Modul statistika dasar

1
BAB I
PENYAJIAN DATA
1.1 PENDAHULUAN
Data mentah atau data yang diperoleh dari proses pengumpulan data pada umumya
masih berupa data yang tidak teratur. Agar data tersebut lebih bermakna, maka proses
pertama adalah mengelompokkan atau mengatur data mentah tersebut ke dalam
bentuk-bentuk tertentu agar lebih berarti dan mudah untuk penggunaan selanjutnya.
Selain ditampilkan dalam bentuk distribusi angka-angka, data juga bisa ditampilkan
dalam bentuk grafik. Tampilan berupa grafik pada prinsipnya bertujuan agar data
secara sekilas mudah dipahami, selain disajikan dalam format yang lebih menarik.
Pemilihan grafik dalam penyajian data tergantung dari jenis data yang mau disajikan.
Dalam hal ini dibedakan berdasarkan atas data kualitatif dan data kuantitatif.
KOMPETENSI KHUSUS, Diharapkan pada akhir perkuliahan nanti mahasiswa/i
dapat menyajikan data-data dalam bentuk grafik, dan dapat menginterpretasikan
tampilan grafik-grafik yang ada.
1.2 PENYAJIAN
PENYAJIAN DATA
Bentuk-bentuk tampilan atau penyajian data pada dasarnya ada dua jenis :
1. Tabel
Data biasa ditampilkan dalam bentuk tabulasi, yang berarti terdapat BARIS dan
KOLOM dalam jumlah tertentu. Tabel sendiri bisa dibagi penggunaannya
berdasar jenis data yang ada. Jika data adalah kualitatif, maka penggunaan
TABEL KONTINGENSI lebih dianjurkan karena tidak adanya decimal dalam
data kualitatif. Sedang untuk data kuantitatif, agak sulit untuk menampilkannya
dalam sebuah table kontigensi. untuk itu data kuantitatif biasa disajikan dengan
sebuah STEAM AND LEAF DISPLAY, atau menyusunnya dalam sebuah
distribusi frekuensi.
Modul statistika dasar
2
Contoh :
Penggambaran data kualitatif.
Remaja Muda Dewasa
Suka 2 5 12
Cukup suka 7 21 30
Tidak suka 5 11 21
Selain dengan table kontingensi, data juga bias dikelompokkan berdasar besaran-
besaran tertentu, yang disebut kelas-kelas, desertai sebuah kolom yang berisi
frekuensi tertentu. Tabel semacam ini biasa disebut dengan Distribusi Frekuensi.
Contoh Penggambaran data kuantitatif.
Berat Badan
(kg)
Frekuensi
25 - 40 10
41 - 56 27
Di atas 56 7
2. Grafik (Diagram)
Selain disusun dalam bentuk table kontingensi atau distribus frekuensi yang
hanya menonjolkan angka-angka, data juga bisa disajikan lebih menarik dengan
tampilan berupa grafik, seperti grafik batang, grafik lingkaran, grafik garis dan
sebagainya. Pada distribusi frekuensi, selain data ditampilkan dalam bentuk
frekuensi perkelas, data juga bias divisualkan dalam bentuk histogram atau
polygon.
Contoh diagram lingkaran :
Modul statistika dasar
3
Contoh Poligon :
Selain dengan table atau grafik, data khususnya data kuantitatif bisa pula
dusajikan dala bentuk STEAM AND LEAF atau ORDERED ARRAY. Ordered
array adalah menyusun data-data secara berurutan (order), bisa dari data terkecil
ke data terbesar atau sebaliknya. Sedangkan steam and leaf merupakan tahap
lanjutan dari ordered array. Setelah data tersusun, kumpulan data tersebut bisa
disajikan dalam bentuk data pokok lalu disertai dengan angka decimal yang ada.
Jadi penyusunan steam and leaf akan efektif pada penyajian data yang
mempunyai angka decimal, seperti tinggi badan 173,3 cm, berat badan 56,7 kg
dan seterusnya.
Modul statistika dasar
4
Grafik Batang (Bar), Lingkaran ( Pie), dan Pareto.
Penyajian data dalam bentuk grafik sebaiknya dilihat pula pada tipe
datanya.jika data bersifat KATEGORIKAL, seperti data nominal dan ordinal,
maka grafik yang sesuai adalah Bar Chart ( Grafik Batang), Pie Chart
(Lingkaran) dan Pareto.
1. Grafik Batang (Bar Chart)
Grafik batang sebenarnya mirip dengan histogram, hanya grafik batang tidak
perlu berdasar atas kelas-kelas pada sebuah distribusi frekuensi. Disebut bar
(batang) karena setiap kategori yang ada akan ditampilkan dalam bentuk
batang. Dengan demikian jika ada lima kategori, nanti akan ada lima batang,
sedangkan panjang atau lebar setiap batang akan ditentukan oleh frekuensi
yang ada pada setiap kategori. Jika kategori A mempunyai data sebanyak 40,
sedang kategori B mempunyai data sebanyak 80, maka secara visual, panjang
Bar B akan dua kali (80/40) panjang Bar A.
Contoh 1. Berikut adalah data penjualan mobil di Indonesia mulai Januari-
Juni 2002.
Kategori Sedan
Merk Jumlah (unit)
Toyota 5661
Mitsibishi 1799
Suzuki 1463
Isuzu 1237
Daihatsu 1093
Honda 717
Modul statistika dasar
5
Kategori Non Sedan
Merk Jumlah (unit)
Toyota 37991
Mitsibishi 37654
Suzuki 29239
Isuzu 14140
Daihatsu 10142
Honda 3449
Contoh 1. Grafik Batang.
Merk Mobil Sedan.
Grafik Batang Untuk Kategori non Sedan.
0
1000
2000
3000
4000
5000
6000
Jumlah penjualan mobil sedan
Jumalh…
Modul statistika dasar
6
Jika pada pembacaan batang di atas mengalami kesulitan, pada grafik
biasa ditambahkan Grid atau garis pembantu untuk memperjelas posisi
batang, atau dalam kasus ini memperjelas jumlah unit mobil yang terjual
untuk merk tertentu seperti yang tertera pada grafik.
Dengan bantuan grid seperti ini member garis tiap 5000 unit, jumlah
penjualan mobil bisa dilihat dengan mudah. Misalnya merk Isuzu bisa dilihat
diperkirakan mendekati 15.000 unit. merk Honda cukup jauh dari 5.000 dan
seterusnya.
Variasi lain adalah apabila diinginkan penonjolan satu atau beberapa data
yang dianggap penting, sehingga harus tampak berbeda dengan data lainnya.
Sebagai contoh ditonjolkan data penjualan mobil non sedan merk Suzuki
dengan tampilan bar yang berbeda disertai dengan adanya nilai pada label.
Seperti pada grafik batang di bawah ini.
2. Grafik Lingkaran ( Pie Chart)
0
10000
20000
30000
40000
jumlah penjualan mobil non sedan
Jumalh (unit)
Modul statistika dasar
7
Jenis grafik yang biasanya menampilkan data kualitatif adalah grafik
lingkaran (pie). Jika pada grafik Bar, setiap bar (batang) mewakili frekuensi
tertentu dari data, maka pada grafik pie, frekuensi data dinyatakan dalam
besar irisan yang ada pada grafik. Pir Chart sebenarnya mirip dengan
histogram, hanya pada diagram batang tidak perlu berdasar pada kelas-kelas
pada sebuah distribusi frekuensi. Dengan demikian jika ada lima katergori,
nanti aka nada lima batang karena setiap kategori yang ada akan ditampilkan
dalam bentuk batang. Sedangkan panjang (lebat) setiap batang akan
ditentukan oleh frekuensi yang ada pada setiap kategori. Jika kategori A
mempunyai data 40, sedang kategori mempunyai data 80 maka secara visual,
pangjang batang B akan dua kali panjang batang A.
Kategori Sedan
jumlah penjualan mobil)
Toyota
Mitsibishi
Suzuki
Isuzu
Daihatsu
Honda
Modul statistika dasar
8
Karegori Non Sedan
3. Grafik Pareto
Grafik Pareto sering digunakan dalam penggunaan statistic untuk
pengendalian mutu (quality control), yang menggambarkan komponen mana
yang lebih menonjolkan kuantitasnya dibanding yang lain, sehingga perlu
perhatian khusus.
Grafik ini merupakan gabungan antara tampilan grafik batang dengan
grafik garis dengan cirri khas data-data untuk pembuatan grafi pareto selalu
diurutkan dahulu dari yang terbesar sampai yang terkecil .
Kategori Sedan
Merk Jumlah (unit)
Toyota 5661
Mitsibishi 1799
Suzuki 1463
Isuzu 1237
Daihatsu 1093
Honda 717
Jumlah penjualan mobil (unit)
Toyota
Mitsibishi
Suzuki
Isuzu
Daihatsu
Honda
Modul statistika dasar
9
Kemudian data diurutkan dari terkecil hingga terbesar.
Kategori Sedan
Merk Jumlah (unit)
Honda 717
Daihatsu 1093
Isuzu 1237
Suzuki 1463
Mitsibishi 1799
Toyota 5661
Dan jika ditampilkan dengan grafik Pareto akan tampak sebagai berikut :
Pada grafik Pareto, sumbu X menampilkan data kualitatif, yang pada kasus ini adalah
merk-merk mobil yang terjual, sedangkan sumbu Y menampilkan jumlah unit mobil
tertentu yang terjual. Pada sumbu Y ini juga, pada sebelah kanan, terlihat persentase
mobil tertentu yang terjual yang karena berbentuk komulatif . Jika tampilan setiap
nilai individu dinyatakan dalam bentuk bar, maka tampilan secara komulatif
dinyatakan dalam bentuk garis (line).
Dari grafik di atas terlihat secara menyolok bahwa mobil merk Toyota terjual
paling banyak, kemudian diikuti merk mobil lain yang gradasi penurunan gambarnya
(tinggi bar) cukup landai dan tidak terlihat menyolok seperti mobil Toyota tersebut.
Modul statistika dasar
10
Dari grafik ini, sesuai tujuan Pareto, perhatian harus diberikan pada satu atau
beberapa data dengan jumlah besar, yang adalah mobil merk Toyota.
KATEGORI NON-SEDAN
Merk
Jumlah (Unit)
Toyota
37991
Mitsubishi
37654
Suzuki
29239
Izusu
14140
Daihatsu
10142
Honda
3449
Lain-lain
12737
Jika diurutkan secara descending (dari terbesar ke terkecil), maka table menjadi :
Merk
Jumlah (Unit)
Toyota
37991
Mitsubishi
37654
Suzuki
29239
Izusu
14140
Lain-lain
12737
Daihatsu
10142
Honda
3449
Modul statistika dasar
11
Dan jika ditampilkan dalam grafik Pareto menjadi :
Dari grafik di atas terlihat mobil merk Toyota kembali menjadi merk yang harus
diperhatikan karena mempunyai persentase terbesar. Namun berbeda dengan
tampilan Pareto pada modil non-sedan, pada mobil sedan, selain merk Toyota, merk
Mitsubishi dan Suzuki mempunyai persentase yang hampir sama dengan Toyota.
Dengan demikian, selain Toyota, kedua merk tersebut juga patut mendapat perhatian.
GRAFIK LINE (GARIS)
Dari namanya, grafik jenis line pada prinsipnya bertujuan menyajikan data dengan
menghubungkan sekumpulan data dalam sebuah garis. Sumbu horizontal
menampilkan keterangan data yang akan disajikan, seperti bulan, periode, kelompok
produk dan sebagainya. Sedang sumbu vertical menyajikan data kuantitatif dari
keterangan yang ada di sumbu horizontal.
Sebagai contoh, berikut data inflasi tahun 2001 :
Bulan
Inflasi (%)
Januari 0,33
Februari 0,87
Maret 0,89
April 0,46
Mei 1,13
Modul statistika dasar
12
Juni 1,67
Juli 2,12
Agustus -0,21
September 0,64
Oktober 0,68
November 1,71
Desember 1,62
Gambarkan grafik garis dari data di atas.
Dari grafik di atas sekilas terlihat terjadi penurunan tingkat inflasi yang tajam
dari bulan Juli ke Agustus. Sebaliknya dari Agustus ke September juga terjadi
lonjakan inflasi yang cukup tinggi, yang meningkat terus sampai November.
Hal inilah yang menjadi keunggulan tampilan data dengan grafik dibandingkan
jika data ditampilkan lewat serangkaian angka, dimana perbedaan data tidak bisa
dilihat secara tepat. Selain itu tampilan lewat grafik garis seperti di atas langsung bisa
dilihat bahwa tingkat inflasi cenderung meningkat dari waktu ke waktu.
TABEL KONTINGENSI
Table kontingensi bisa digunakan jika data yang ada berbentuk kualitatif, seperti
jenis kelamin, tingkat pendidikan dan sebagainya. Data tersebut meliputi data dengan
skala pengukuran nominal atau ordinal. Pada banyak buku, data tersebut bisa juga
dinamakan data kategori, yakni data yang didapat dan kemudian dimasukkan dalam
sebuah kategori tertentu. Ciri khas dari data ini adalah data berbentuk bilangan
integer (bulat), sehingga data tidak mengandung unsure decimal.
Untuk lebih jelasnya, berikut disertakan kasus sederhana, untuk menunjukkan
barbagai variasi tampilan data dengan table kontingensi.
Kasus :
Data komposisi kepemilikan STASIUN RADIO di berbagai kota di Jawa :
Jenis Gelombang
KOTA DI JAWA
Modul statistika dasar
13
Radio
Jakarta Surabaya Bandung
Bogor
AM
4 14 5
2
FM
34 11 21
3
Pada table kontingensi di atas, baik data jenis radio maupun data kota adalah data
kualitatif, karena keduanya adalah data nominal. Dengan demikian, pasti kedua
variable tersebut tidak mengandung decimal, karena tidak mungkin jumlah stasiun
radio AM ada 2,5 buah, atau jumlah stasiun radio gelombang FM di Jakarta
berjumlah 15,4 buah.
Variasi Tampilan Tabel Kontingensi
Walaupun secara dasar tampilan table kontingensi adalah seperti dua contoh di atas,
yang mensyaratkan adanya baris dan kolom, namun dalam praktek table di atas bisa
ditampilkan dalam berbagai variasi, sesuai dengan tujuan yang diinginkan.
Table Kontingensi dengan Total Jumlah
Variasi pertama adalah menampilkan sel TOTAL atau JUMLAH, baik dari sisi baris
atau sisi kolom. Dinamakan TOTAL, berarti dilakukan proses penjumlahan pada
setiap isi baris atau isis kolom yang relevan.
Sebagai contoh, table kontingensi data radio di berbagai kota di Jawa bisa
ditampilkan sebagai berikut :
Jenis
Gelombang
Radio
KOTA DI JAWA
TOTAL
Jakarta Surabaya Bandung Bogor
AM
4 14 5 2
25
FM
34 11 21 3
69
TOTAL
38 25 26 5
94
Perhatikan tambahan kolom TOTAL, baik dibagian kolom ataupun baris.
Modul statistika dasar
14
Dari table di atas bisa dilihat tambahan informasi yang berguna, yakni :
Jika dilihat dari TOTAL KOLOM, maka jumlah radio FM secara total
berjumlah lebih besar disbanding total rdio AM. Perbandingan tersebut
bahkan dua kali lebih (69 dibanding 25 atau sekitar 2,76).
Jika dilihat dari TOTAL BARIS, maka kota Jakarta mempunyai jumlah total
radio (gelombang AM dan gelombang FM) terbanyak, sebesar 38. Sedang
kota Surabaya dan Bandung hamper berimbang (25 dibanding 26).
Table Kontingensi dengan Persentase pada Total Kolom
Pada variasi ini, total kolom dibuat 100%, kemudian isis baris diubah dalam
bentuk persentase, sehingga total persen pada suatu baris adalah 100%.
Untuk jelasnya, berikut hasil pengubahan dalam persentase kolom dari data radio di
atas :
Jenis
Gelombang
Radio
KOTA DI JAWA
TOTAL
Jakarta Surabaya Bandung Bogor
AM
16.00% 56.00% 20.00% 8.00%
100%
FM
49.28% 15.94% 30.43% 4.35%
100%
Keterangan :
Sel untuk radio AM di Jakarta jika diubah ke persentase menjadi :
4/25 x 100% = 16%
Sel untuk radio FM di Surabay jika diubah ke persentase menjadi :
14/25 x 100% = 56%
Demikian untuk persentase kota Bandung dan Bogor, dengan ketentuan setiap
isi sel yang bersangkutan dibagi dengan total radio AM di keempat kota
tersebut, yakni sejumlah 25 buah.
Modul statistika dasar
15
Sel untuk radio FM di Jakarta jika diubah ke persentase menjadi :
34/69 x 100% = 49,28% (dibulatkan dua angka di belakang koma)
Sel untuk radio FM di Bogor jika diubah ke persentase menjadi :
3/69 x 100% = 4,35%
Ketentuan yang sama dengan perhitungan radio AM, yakni setiap isi sel yang
bersangkutan dibagi dengan total radio FM di keempat kota tersebut, yakni
sejumlah 69 buah.
Analisis :
Dari table di atas, dari persentase terlihat stasiun radio gelombang AM
terbanyak berada di Surabaya (56%), sedang jumlah terkecil ada di kota
Bogor (8%). Sedang stasiun radio gelombang FM terbanyak berada di Jakarta
(49,28%), sedang jumlah terkecil juga ada di Bogor (hanya 4,35%). Dari
kedua angka terbesar, terlihat juga bahwa sekitar setengah (50%) dari stasiun
radio AM ataupun FM praktis ada di satu kota tertentu saja (AM di Surabaya
sedangkan FM di jakarta).
 Table Kontingensi denganPersentase pada Total Baris
Sama dengan variasi persentase kolom, total baris dibuat 100%, kemudian isi
kolom yang diubah dalam bentuk persentase, sehingga total persen pada suatu kolom
adalah 100%.
Hasil pengubahan dalam persentase baris dari data radio di atas :
Jenis
Gelombang
Radio
KOTA DI JAWA
Jakarta Surabaya Bandung
Bogor
AM
10.53% 56.00% 19.23%
40.00%
FM
89.47% 44.00% 80.77%
60.00%
TOTAL
100.00% 100.00% 100.00%
100.00%
Keterangan :
Sel untuk radio AM di Jakarta jika diubah ke persentase BARIS menjadi :
Modul statistika dasar
16
4/38 x 100% = 10.53%
Otomatis sisanya (yakni radio gelombang FM di Jakarta) adalah 100% -
10.53% = 89.47%
Sel untuk radio AM di Surabaya jika diubah ke persentase BARIS menjadi :
14/25 x 100% = 56%, sedanf FM adalah 100% - 56% atau 44%.
NB : perhatikan bahwa kebetulan saja baik dengan persentase KOLOM atau
BARIS kota Surabaya mendapatkan hasil 56%.
Demikian untuk persentase kota Bandung dan Bogor, dengan ketentuan setiapisi
sel yang bersangkutan dibagi dengan totak radio di keempat kota teresbut.
Analisis :
Dari table di atas, dari persentase terlihat jumlah stasiun radio gelombang Am hanya
lebih banyak di kota Surabaya, sedang di ketiga kota lain, jumlah stasiun radio FM
lebih banyak dibanding radio AM. Bahkan di kota Jakarta dan Bandung
perbandingan tersebut sangat nyata, yakni sekitar 8 berbanding 1.
 Table Kontingensi denganPersentase pada Total Baris dan Total Kolom
Pada variasi ini, persentase pada satu sel, yakni TOTAL kolom dan total BARIS
(lihat pada table kedua,sejumlah 94 stasiun radio) dibuat 100%, kemudian isi sel
diubah dalam bentuk persentase.
Hasil pengubahan dalam persentase baris dan kolom dari data stasiun radio di atas :
Jenis
Gelombang
Radio
KOTA DI JAWA
TOTAL
Jakarta Surabaya Bandung Bogor
AM
4.26% 14.89% 5.32% 2.13%
26.60%
FM
36.17% 11.70% 22.34% 3.19%
73.40%
TOTAL
40.43% 26.60% 27.66% 5.32%
100.00%
Keterangan :
Modul statistika dasar
17
Sel untuk radio AM di Jakarta jika diubah ke persentase BARIS dan KOLOM
menjadi :
4/94 x 100% = 4.26%
Sel untuk radio FM di Surabaya jika diubah ke persentase BARIS dan
KOLOM menjadi :
14/94 x 100% = 11.70%
Demikian untuk persentase sel lainnya, dengan ketentuan setiap isi sel yang
bersangkutan dibagi dengan total stasiun radio, baik gelombang AM atau FM di
keempat kota tersebut, yakni 94 buah.
Analisis :
Dari table di atas terlihat bahwa jumlah seluruh stasiun radio paling banyak ada
di Jakarta (40.43%), sedang terkecil ada di kota Bogor (hanya 5.32%). Sedang
jika dilihat dari jenis gelombang radio, terbesar tetap Jakarta, dengan jumlah
stasiun radio FM sejumlah 36.17% dari total stasiun radio di keempat kota
tersebut.
 Ummary Tabel
Summary table berfungsi untuk meringkas berbagai informasi yang bertipe
kualitatif. Berbeda dengan table kontingensi yang mempunyai banyak baris dan
kolom, summary table hanya mempunyai satu kolom yang berfungsi untuk
meringkas seluruh informasi yang terkandung dalam setiap baris yang ada.
Sebagai contoh, jika table kontingensi yang menggambarkan komposisi radio di
kota-kota di Jawa disajikan dalam sebuah summary table, maka ventuk table adalah
:
Jenis Gelombang Radio
Jumlah
AM 25
FM 69
Modul statistika dasar
18
TOTAL 94
Perhatikan table di atas yang tidak menampilkan perincian radio AM dan FM per
kota, karena yang diinginkan adalah ringkasan jenis gelombang radio. Pada
summary table, bisa juga diberi tambahan sebuah kolom yang berisi persentase
masing-masing data pada sebuah baris :
Jenis Gelombang Radio Jumlah
Persentase (%)
AM 25 26.6
FM 69 73.4
TOTAL 94 100
Walaupun kolom summary table di atas lebih dari satu kolom, namun kolom kedua
ini merupakan penjelasan tambahan saja dari kolom ringkasan.
Jika akan ditampilkan ringkasan jumlah stasiun radio per kota, maka tampilan
menjadi :
Kota
Jumlah Stasiun Radio
Jakarta 38
Surabaya 25
Bandung 26
Bogor 5
TOTAL 94
Perhatikan walaupun angka-angka pada kolom ringkasan berubah, namun secara
total jumlah stasiun radio tetap, yakni 94 buah. Dari table ringkasan tersebut terlihat
bahwa kota Jakarta memiliki stasiun pemancar radio terbanyak, tanpa
memperhatikan jenis stasiun radio.
Modul statistika dasar
19
1.2.1 LATIHAN
1. Berikut adalah komposisi Pembangkit Listrik berdasarkan sumber
energy pada Negara-negara Eropa :
Sumber Energi
Pangsa Pasar
Fosil (minyak dll) 50%
Nuklir 35%
Energi yang dapat diperbaharui 12%
Lain-lain 3%
TOTAL 100%
Dari tabel di atas buatlah GRAFIK Pie, Bar serta Pareto.
2. Berikut adalah target persentase sumber enrgi yang dapat diperbaharui
dari seluruh sumber energy yang ada pada berbagai negara Eropa :
Dari table di atas buatlah grafik Bar untuk data tahun 1997 dan tahun
2010. Bandingkanlah grafik keduanya.
Negara Target tahun 1997 (%)
Target tahun 2010 (%)
Austria
70,0
78,1
Portugal
38,5
39,0
Denmark
8,7
29,0
Italia
16,0
25,0
Jerman
4,5
12,5
Modul statistika dasar
20
Belanda
3,5
9,0
Belgia
1,1
6,0
BAB II
DISTRIBUSI FREKUENSI
2.1 PENDAHULUAN.
Seperti yang telah disinggung pada modul pertama yaitu penyajian data, Distribusi
frekuensi pada prinsipnya adalah menyususn dan mengatur data kuantitatif yang
masih mentah ke dalam beberapa kelas data yang sama, sehingga setiap kelas bisa
menggambarkan karakteristik data yang ada. Seperti missal jika ada kelas data upah
bulanan “ 200.000 – 300.000” yang berisi frekuensi “100”, maka bisa diartikan
bahwa ada 100 orang yang menerima upah bulanan antara Rp. 200.000 sampai Rp.
300.000.
Modul statistika dasar
21
Walaupun pada pembuatan suatu distribusi frekuensi ada aturan-aturan tertentu,
namun sebuah distribusi frekuensi pada dasarnya tidak ada aturan yang mengikat,
sehingga sebuah data mentah bisa saja ditampilkan dalam bentuk lebih dari satu
distribusi frekuensi. Pembuatan sebuah distribusi frekuensi lebih tepat jikatetap
mengikuti pedoman-pedoman yang ada, namun juga tidak meninggalkan unsure
subyektivitas .Dalam modul ini akan dijelaskan langkah –langkah pembuatan table
frekuensi dan beserta sketsa grafiknya.
Kompetensi Khusus, Diharapkan setelah mengikuti perkulian ini mahasiswa/I
mampu menyajikan data dalam jumlah besar ke dalam table distribusi frekuensi.
2.2 PENYAJIAN.
Distribusi frekuensi
Data hasil pengukuran biasanya dapat disajikan dalam bentuk diagram seperti pada
modul sebelumnya, juga bisa pula disusun dalam sebuah table yang disebut table
frekuensi atau distribusi frekuensi yang yang terdiri dari distribusi frekuensi tunggal
dan distribusi frekuensi berkelompok.
Berikut ini akan diberikan sejumlah data hasil pengukuran tinggi badan ( sampai
sentimeter terdekat) dari 40 orang mahasiswa/I semester I Pendidikan Matematika.
148 150 160 168 150 149 160 160
151 154 156 159 164 163 169 168
170 170 177 150 153 160 165 170
175 158 168 166 167 174 173 155
158 162 166 164 159 163 156 163
Dari data tersebut di atas dapat diperoleh ukuran paling rendah ( minimum) adalan
148 cm dan ukuran tertinggi (maksimum) adalah 177 cm. sehingga selisih antara
data tertinggi dan data terendah disebut sebagai jangkauan ( Range).Untuk data di
atas range = 177 cm – 148 cm = 29 cm. Jika data tersebut disusun dalam table
frekuensi data tunggal maka tentu akan sangat panjang. Untuk itu data tersebut
Modul statistika dasar
22
harus disusun dalam sebuah table yang disebut table frekuensi data berkelompok
atau distribusi frekuensi data berkelompok.
Berikut adalah langkah – langkah pembuatan table frekuensi data berkelompok :
1. Menentukan jumlah kelas
Jumlah kelas pada prinsipnya bisa ditentukan secara subyektif, walaupun secara
umum jumlah kelas yang bagus berkisar antara 5 sampai 20 kelas. Jika jumlah
kelas terlalu kecil, misal ada 500 data dengan jumlah kelas hanya 5, maka banyak
informasi yang penting akan hilang.namun jumlah kelas terlalu banyak juga
dengan data yang relativesedikit, misalnya untuk 50 data ada 20 kelas, maka tiap
kelas relative hanya mendapat 3 data.
H.A Sturges (1926) mengajukan sebuah rumus untuk menentukan jumlah kelas
dari sekelompok data :
Ket :
k = jumlah kelas
n = jumlah data
misalkan untuk data nilai ujian matematika dari 78 mahasiswa, maka jumlah kkelas
yang dianjurkan adalah :
K = 1 + 3,322 log (78) = 7,28 atau dibulatkan menjadi 7.
Jadi dari 78 data tersebut akan dibuat table frekuensi dengan kelas berjumlah 7.
NB. Rumus sturges adalah sebuah alternative, dan tidak diharuskan digunakan dalam
setiap kelas.
2. Menentukan interval kelas
Setelah jumlah kelas ditetapkan, langlah selanjutnya adalah mengisi interval
setiap kelas, dengan rumus :
K = 1 + 3,322. Log n
Modul statistika dasar
23
Dimana :
I = interval kelas
Range = nilai tertinggi – nilai terendah
K = jumlah kelas
3. Menyusun Distribusi frekuensi
Dengan jumlah kelas dan panjang interval kelas yang telah diperoleh, maka
disusunlah table frekuensi. ( seperti pada contoh).
Ada beberapa istilah dalam table distribusi frekuensi yang harus diketahui yaitu :
1. Interval kelas ( class interval)
Interval kelas atau sering juga disebut selang kelas, adalah penanda sebuah kelas.
2. Lebar kelas ( class width)
Lebar kelas adalah selisih antara nilai-nilai pada interval kelas. Setiap interval
kelas interval seharusnya lebar kelas yang sama.
3. Titik tengah kelas ( class midpoint)
Titik tengah kelas adalah nilai tengah setiap interval kelas. Misalkan interval 10 –
16, maka titik tengahnya adalah : (10 + 16)/2 = 14.
Demikian seterusnya setiap kelas seharusnya mempunyai titik tengah kelas yang
berbeda beda.
4. Batas kelas ( Limid Class)
Batas kelas adalah nilai-nilai yang membatasisebuah interval, yang dibagi
menjadi batas kelas atas dan batas kelas bawah. Seperti pada contoh di atas yang
menjadi batas kelas atas adalah 16 dan batas kelas bawah adalah 10. Untuk
penggunaannya batas bawah kelas dikurangi dengan 0,5 dan batas atas kelas
interval ditambah 0,5.
5. Class Boundaries
i = Range/ k
Modul statistika dasar
24
Pada banyak distribusi frekuensi, untuk menghindari sebuah data bisa masuk
pada dua kelas yang berbeda, maka batas kelas diperluas, baik ke bawah atau ke
atas. Seperti pada contoh kelas di atas maka : batas kelasnya dapat diperluas (10,5
– 16,5).
Berikut adalah contoh pembuatan table frekuensi atau table distribusi frekuensi dari
data tinggi badan 40 mahasiswa di atas:
1. Seperti telah dihitung Range dari data tersebut adalah 29 cm. Dan panjang
interval kelas adalah 5 ( i=5).
2. Banyaknya kelas (k) atau panjang kelas dapat dihitung sbb.
K = (range/i) + 1
= (29/5) + 1
= 6,8 atau dibulatkan menjadi 7.
3. Jadi table distribusi frekuensi dari data tinggi badan 40 mahasiswa tersebut
adalah:
Tinggi badan (cm) Turus (Tally) Frekuensi
145 – 149
150 – 154
155 – 159
160 – 164
165 – 169
170 – 174
175 - 179
II
VI
VII
X
VIII
V
II
2
6
7
10
8
5
2
=40
Dari table yang ada maka dapat diketahui bahwa jumlah mahasiswa yang
tingginya kurang dari 60 adalah 15 orang.
GAMBAR DISTRIBUSI FREKUENSI
Setelah table frekuensi distribusi di susun, maka langkah selanjutnya adalah
bagaimana menampilkan distribusi frekuensi dalam bentuk grafik, sehingga selain
lebih komunikatif dan menarik untuk dilihat, juga pengguna secara tepat bisa
Modul statistika dasar
25
mengetahui hal-hal penting pada sebuah distribusi frekuensi ( seperti contoh siapa
yang tertinggi dan siapa yang terendah).
Alat popular yang digunakan untuk menampilkan distribusi frekuensi dalam
bentuk grafik adalah histogram, polygon dan kurva ogive yang akan diuraikan
sebagai berikut:
Kasus.
Dari distribusi frekuensi yang menggambarkan distribusi tinggi badan mahasiswa
Dari data di atas, dapat digambarkan dalam beberapa grafik sbb:
HISTOGRAM
Histogram pada dasarnya adalah pelengkap pada penyusunan suatu distribusi
frekuensi, yang menampilkan frekuensi-frekuensipada distribusi frekuensi dalam
bentuk grafik bar (batang).Tinggi setiap batang pada histogram adalah proposional
berdasar setiap kelas yang ada.Histogram pada dasarnya adalah grafik bentuk
batang yang diletakkan secara vertical, dengan sumbu X adalah titik tengah kelas
sedangkan sumbu y adalah frekuensi.
Berikut adalah histogram dari data tinggi badan mahasiswa pada table di atas.
Tinggi badan (cm) Frekuensi
145 – 149
150 – 154
155 – 159
160 – 164
165 – 169
170 – 174
175 - 179
2
6
7
10
8
5
2
=40
Modul statistika dasar
26
POLIGON FREKUENSI
Poligon frekuensi adalah bentuk lain dari histogram, yang berupa garis yang
menghubungkan titik tengah – titik tengah dari setiap batang (Bar).Jika distribusi
frekuensi dari data tinggi badan di atas ditampilkan dalam polygon maka hasilnya
sbb.
Perhatikan sebuah polygon yang selalu mulai dari titik nol dan diakhiri juga dengan
sebuah titik nol pada sumbu X. Poligon frekuensi berguna untuk membandingkan
dua atau lebih distribusi frekuensi, yang jika ditampilkan dalam bentuk histogram
akan tampak rumit dan sulit untuk interprtasikan.
Modul statistika dasar
27
DISTIBUSI KOMULATIF DAN KURVA OGIVE
Selain ditampilkan dalam bentuk Distribusi Frekuensi dan visual dalam bentuk
Histogram serta Poligon Frekuensi, data bias ditampilkan dalam bentuk Distribusi
Komulatif, yakni penjumlahan atau pengurangan setiap frekuensi pada tiap kelas
secara komulatif.
Distribusi komulatif bias ditampilkan dalam dua bentuk, yakni Distribusi
KURANG DARI atau Distribusi LEBIH DARI.
Sebagai contoh, untuk distribusi nilai ujian Matematika, jika dibuat dalam bentuk
Distribusi Komulatif KURANG DARI akan menjadi :
Nilai Ujian Matematika Frekuensi
Kurang dari 5 0
Kurang dari 20 17
Kurang dari 35 30
Kurang dari 50 38
Kurang dari 65 50
Kurang dari 80 63
Kurang dari 95 77
Kurang dari 110 78
Keterangan :
Angka 0 secara otomatis terjadi karena tidak ada nilai ujian yang kurang dari 5 atau
kurang dari batas bawah dari kelas pertama. Distribusi komulatif ‘KURANG DARI’
selalu dimulai dengan angka 0.
Angka 17 adalah nilai awal dari distribusi frekuensi, yang ada pada kelas pertama,
yakni jumlah mahasiswa (frekuensi) yang mendapat nilai ujian antara 5 sampai 20
(atau dengan batas kelas, antara 4,99 sampai 19,99).
Modul statistika dasar
28
Angka 35 adalah penjumlahan dari angka 17 dan 13. Karena pernyataan ‘Kurang
dari 35’ berarti penjumalahan frekuensi semua mahasiswa yang mendapat nilai
kurang dari 35, sehingga nilai di bawah 20 pun tetap termasuk pada range tersebut.
Demikian seterusnya, setiap kenaikan kelas berarti terjadi penjumlahan satu persatu
dari isi tiap kelas, sehingga secara logika, pada akhir kelas akan terdapat frekuensi
seluruh data, yakni 78 data.
Kemudian jika distribusi nilai ujian Matematika akan dibuat dalam bentuk Distribusi
Komulatif LEBIH DARI akan menjadi :
Nilai Ujian Matematika Frekuensi
Lebih dari 5 0
Lebih dari 20 17
Lebih dari 35 30
Lebih dari 50 38
Lebih dari 65 50
Lebih dari 80 63
Lebih dari 95 77
Lebih dari 110 78
Keterangan :
Angka 78 atau jumlah total data secara otomatis terjadi karena tidak ada nilai ujian
yang kurang dari 5, atau semua lebih dari nilai minimum, yakni 5. Distribusi
Komulatif ‘LEBIH DARI’ selalu dimulai dengan angka jumlah data total, dalam
kasus ini adalah 78.
Jumlah ‘lebih dari 20’ berarti semua data dikurangi jumlah yang mendapat nilai di
bawah 20. Karena yang mendapat nilai 20 ke bawah adalah 17 orang, maka yang
mendapat lebih dari 20 adalah 78 – 17 = 61 orang.
Modul statistika dasar
29
Demikian seterusnya, setiap kenaikan kelas berarti terjadi pengurangan satu persatu
dari setiap isi kelas, sehingga secara logika, pada akhir kelas akan terdapat nilai 0,
karena tidak aka nada mereka yang bernilai lebih dari 105.
Jika kedua distribusi tersebut digabung pada sebuah Poligon Frekuensi, maka
Poligon khusus tersebut bias dinamakan KURVA OGIVE :
SOAL LATIHAN
1. Buatlah dalam table distribusi frekuensi data nilai mata kuliah statistiksa
dari 100 mahasiswa matematika berikut :
45 40 65 67 67 60 80 86 80 85
64 49 40 40 56 50 58 80 80 68
90 95 100 100 70 76 80 95 90 70
65 65 80 85 80 40 45 40 50 55 50 58
80 82 80 65 60 70 75 75 70 60 55 58 58
80 85 80 85 80 90 90 60 60 70 55 50 70 75 80
60 67 65 67 80 80 80 90 95 100
75 55 45 90 95 76 76 55 60 68
Modul statistika dasar
30
86 56 55 58 68 70 70 75 75 60 67 65 80 86 85 78 75 56 46 40
2. Berikut adalah komposisi pangsa pasar sepeda motor periode Januari –
November 2002 :
Merk
Pangsa Pasar
Honda 64,00%
Suzuki 20,70%
Yamaha 13,10%
Kawasaki 1,66%
Lain-lain 0,54%
TOTAL 100%
Dari atdbel di atas :
a. Jenis grafik apa yang seharusnya digunakan untuk mendeskripsikan data di
atas? Mengapa?
b. Buatlah grafik-grafik sesuai jawaban a.
3. Berikut adalah komposisi Pembangkit Listrik berdasarkan sumber energy
pada Negara-negara Eropa :
Sumber Energi
Pangsa Pasar
Fosil (minyak, dll) 50%
Nuklir 35%
Energy yang dapat
diperbaharui
12%
Lain-lain 3%
TOTAL 100%
Dari table di atas buatlah grafik Pie, Bar serta Pareto.
Modul statistika dasar
31
4. Berikut adalah targetpersentase sumber energy yang dapat diperbaharui dari
seluruh sumber enrgi yang ada pada berbagai Negara di Eropa :
Negara Target tahun 1997 (%) Target tahun 2010 (%)
Austria 70,0 78,1
Portugal 38,5 39,0
Denmark 8,7 29,0
Italia 16,0 25,0
Jerman 4,5 12,5
Belanda 3,5 9,0
Belgia 1,1 6,0
Dari table di atas buatlah grafik Bar untuk data tahun 1997 dan tahun 2010.
Bandingkanlah grafik keduanya.
BAB III
UKURAN TENDENSI PUSAT
3.1 PENDAHULUAN
Untuk mendapat gambaran yang jelas tentang sebuah data mengenai suatu hal, baik
mengenai sampel ataupun populasi, selain daripada data itu disajikan dalam bentuk
table dan diagram, masih diperlukan ukuran- ukuran yang merupakan wakil
kumpulan data tersebut. Dalam modul ini akan diuraikan tentang ukuran gejala pusat
dan ukuran letak. Beberapa macam ukuran dari golongan pertama adalah : rata-rata
atau rata-rata hitung, rata-rata ukur, rata-rata harmonic dan modus. Golongan kedua
adalah Median, kuartil, desil dan persentil.
Modul statistika dasar
32
Ukuran yang dihitung dari kumpulan data dalam sampel dinamakan statistic. Apabila
ukuran itu dihitung dari kumpulan data dalam populasi atau dipakai untuk
menyatakan populasi , maka namanya parameter.Jadi ukuran yang sama dapat
berbentuk statistic atau parametertergantung pada apakah ukuran yang dimaksud
untuk sampel atau populasi.
KOMPETENSI KHUSUS, diharapkan setelah mengikuti perkuliahan ini
mahasiswa/I mampu menganalisa data-data sampel atau populasi dengan mengkaji
ukuran-ukurannya, dan dapat menginterpretasikan data-data yang dengan melihat
ukuran tendency pusatnya.
3.2 PENYAJIAN
MEAN
 Rata-rata Hitung Sederhana
Disebut rata-rata sederhana karena dalam proses perhitungan frekuensi data serta
bobotnya.
Rumus :
=

dimana :
Contoh 1:
Data jumlah tamu Hotel AMAN selama seminggu :
HARI
JUMLAH TAMU
Senin 120
Selasa 80
Rabu 46
Kamis 59
Modul statistika dasar
33
Jum’at 89
Sabtu 202
Minggu 279
Maka rata-rata tamu yang menginap di Hotel AMAN tersebut adalah :
= = = 125.
Terlihat rata-rata tamu perhari adalah 125 0rang. Perhatikan bahwa yang dimaksud
bukan
setiap hari ada persis 125 orang yang menginap di Hotel AMAN, namun jika dirata-
ratakan, dari orang yang menginap mulai hari senin sampai sabtu, jumlah tamu
adalah 125 orang perhari.
Contoh 2:
Data jumlah tamu yang menginap di Hotel SRIKANDI. Namun berbeda dengan
Hotel AMAN, Hotel SRIKANDI hanya menyewakan kamar pada hari Kamis sampai
Senin depan saja, sedang hari Selasa dan Rabu digunakan pihak Hotel untuk
membersihkan kamar.
HARI
JUMLAH TAMU
Kamis 61
Jum’at 79
Sabtu 88
Minggu 92
Senin 48
Maka rata-rata tamu yang menginap di Hotel SRIKANDI adalah :
Modul statistika dasar
34
X=

= =73,6
Terlihat rata-rata jumlah tamu perhari adalah 73,6 orang dibulatkan menjadi 74
orang. Perhatikan jumlah data adalah 5, berbeda dengan jumlah data sebesar 7 pada
contoh 1.
Sekarang jika dianggap di daerah tersebut hanya ada dua hotel, maka berapakah rata-
rata(mean) tamu yang menginap di daerah tersebut untuk hari senin dan selasa?
X=

= =84
Perhatikan jumlah data sekarang hanya ada dua, karena memang cuma ada dua hotel.
Dengan demikian, rata-rata tamu yang menginap di daerah tersebut pada hari senin
adalah 84 orang.
Untuk hari Selasa, Mean adalah rata-rata dari semua tamu yang menginap di
kedua hotel tersebut pada hari Selasa, yakni :
X=

= =40
Walaupun jumlah data sama, yakni dua, namun data hari Selasa untuk Hotel
SRIKANDI adalah nol, karena hotel tidak menerima tamu. Dengan demikian, rata-
rata tamu yang menginap di daerah tersebut pada hari Selasa adalah 40 orang.
 Rata-rata Hitung dengan Frekuensi
Variasi lain adalah jika setiap data yang dihitung mempunyai frekuensi kemunculan
tertentu, sehingga rumus Rata-rata sederhana mengalami modifikasi menjadi :
=


dimana :
Modul statistika dasar
35
Perhitungan ini digunakan untuk menghitung rata-rata dari suatu distribusi Frekuensi.
Contoh :
Data distribusi Frekuensi gaji yang diterima karyawan P.T. CLEOPATRA :
Gaji (Rupiah/bulan)
Frekuensi (orang)
575.000 6
600.000 11
625.000 17
650.000 8
Keterangan :
Karyawan dengan gaji Rp. 575.000,-/bulan sejumlah 6 orang, sedang mereka yang
bergaji Rp. 600.000,-/bulan sejumlah 11 orang. Demikian seterusnya untuk data yang
lain. Berbeda dengan kasus sebelumnya, disini ada sejumlah data yang mempunyai
nilai yang sama, seperti data 575.000 ada 6 data, 600.000 ada 11 data, dan
seterusnya.
Namun tetap diperhatikan bahwa semua data haruslah data kuantitatif dan sejenis.
Sebagai contoh, jika isi table adalah 6 buah durian masing-masing seberat 5,1 kg, 9
buah nenas masimg-masing seberat 2,5 kg dan 4 buah melon masing-masing seberat
1,75 kg. untuk data dengan campuran buah seperti ini, tidak bias dilakukan rata-rata
frekuensi, karena walaupun semua data kuantitatif, namun jenis data (jenis buah)
tidak sama. Dengan kata lain tidak mungkin dihitung rata-rata berat buah, karena
akan timbul pertanyaan’rata-rata untuk buah yang mana? Hal ini berbeda dengan gaji
pada table di atas, yang jelas sejenis, karena semua bersatuan ‘Rupiah/bulan’.
Perhitungan rata-rata gaji karyawan P.T. CLEOPATRA :
GAJI (Rupiah/bulan) Frekuensi (orang)
GAJI * Frekuensi
575.000 6 3.450.000
600.000 11 6.600.000
Modul statistika dasar
36
625.000 17 10.625.000
650.000 8 5.200.000
TOTAL 42 25.875.000
Atau dengan penggunaan rumus :
X=
( ∗ . ∗ . )
( )
=
. .
=616.071,4
Dengan demikian, rata-rata gaji 42 orang karyawan P.T. CLEOPATRA adalah Rp.
616.071,4/bulan.
 Rata-rata Hitung dengan Bobot
Data juga bisa diberi bobot (weight) yang membedakan data satu dengan data lainnya
sehingga rumus rata-rata sederhana mengalami modifikasi menjadi :
=


Dimana :
Walaupun rumus ini sama dengan rumus rata-rata frekuensi, dengan perbedaan pada
penggantian symbol f dengan w, namun secara konsep keduanya berbeda. Weighted
mean (rata-rata berbobot) berangkat dari pengertian bahwa data tidak mempunyai
bobot yang sama, tergantung dari besar kepentingan yang diberikan pada data
tersebut.
Contoh :
Perhitungan Indeks Prestasi (IP) seorang mahasiswa, yang mengambil sejumlah mata
kuliah tertentu, dan dihitung dengan sks. Pada umumnya tidak semua mata kuliah
mempunyai bobot sks yang sama, seperti mata kuliah Matematika mempunyai bobot
3 sks, sementara mata kuliah Sosiologi mungkin hanya 2 sks. Apa yang membedakan
kedua mata kuliah tersebut hingga yang satu diberi bobot 3 sks sementara yang lain
Modul statistika dasar
37
hanya 2 sks? Tentu saja ini tergantung pengambilan keputusan yang memandang
mata kuliah Matematika lebih penting dari mata kuliah Sosiologi.
Contoh lain :
Proses penilaian seorang karyawan, dengan memberi pembobotan pada komponen
penilaian yang meliputi kedisiplinan (bobot 50%), kerjasama (bobot 30%) dan
kinerja (bobot 20%). Perhatikan jumlah bobot pada kasus seperti ini selalu 100%
(50%+30%+20%).
Kasus I :
Berikut adalah distribusi mata kuliah yang diambil dan nilai akhir dari mahasiswa
bernama Chandra :
Mata Kuliah Bobot sks Nilai (huruf)
Nilai (angka)
Matematika 3 A 4
Sosiologi 2 C 2
Ekonomi Mikro 4 D 1
Akuntansi 3 B 3
Keterangan :
Konversi Nilai dari huruf ke angka adalah :
A=4
B=3
C=2
D=1
E=0
Jadi untuk mata kuliah matematika yang mempunyai bobot 3 sks, Chandra mendapat
nilai A atau setara dengan angka 4. Demikian seterusnya untuk arti data lainnya.
Tentu saja disini harus dilakukan konversi (pengubahan) dari nilai huruf ke nilai
angka, sebab jika tidak demikian,proses perhitungan rata-rata tidak bias dikerjakan,
karena adanya data non-angka.
Rata-rata nilai Chandra (IP) adalah :
Modul statistika dasar
38
Bobot sks Nilai (angka)
Bobot*Nilai
3 4 12
2 2 4
4 1 4
3 3 9
TOTAL 12 29
Atau dengan rumus :
X=
( ∗) ( ∗) ( ∗) ( ∗)
( )
= =2.41
Dengan demikian IP atau rata-rata nilai Chandra dengan mempertimbangkan bobot
masing-masing mata kuliah, adalah 2.41.
Jika IP Chandra dihitung tanpa mempertimbangkan bobot SKS, maka nilai rata-rata
adalah persis seperti rumus Rata-rata sederhana :
X= = = 2.5
Disini n atau jumlah data adalah 4.
Perhatikan selisih perhitungan antara tanpa mempertimbangkan bobot dengan
mempertimbangkan bobot. Hal ini disebabkan pada bobot SKS yang tinggi, yakni
mata kuliah Ekonomi Micro, Chandra mendapat nilai jelek (D), yang hanya bernilai
angka sama dengan 1, sehingga akan menurunkan total IP Chandra. Hal ini tentu
tidak terjadi jika bobot SKS dihilangkan, yang otomatis membuat semua mata kuliah
sama pengaruhnya terhadap IP.
Kasus 2 :
Berikut adalah hasil penilaian seorang Supervisor terhadap karyawan bernama Deddy
:
Komponen Penilaian Bobot (%)
Nilai (angka)
Modul statistika dasar
39
Disiplin 50% 70
Kerjasama 30% 60
Kinerja 20% 90
TOTAL 100%
Keterangan :
Nilai yang diberikan adalah pada skala 0 (sangat jelek) sampai 100 (sangat baik).
Data di atas menunjukkan Supervisor menilai Deddy dengan angka 70 untum
kedisiplinannya selama bekerja, nilai 60 untuk kerjasama dengan teman sekerja dan
90 untuk kinerja secara pribadi. Perhatikan jumlah bobot yang menunjukkan
setengah dari penilaian adalah berdasarkan kedisiplinan seseorang (50%) dan jumlah
bobot pada kasus seperti ini adalah selalu 100%.
NB : Bobot 50% bias juga ditampilkan dalam bentuk angka 0,5.
Rata-rata nilai dari Deddy, adalah :
Bobot (%) Nilai (angka)
Bobot* Nilai
50% 70 35
30% 60 18
20% 90 18
TOTAL 71
Atau dengan rumus :
X=
( %∗ ) ( %∗ ) ( %∗ )
( % % %)
= =71
Dengan demikian, Nilai rata-rata Deddy adalah 71, yang tetap diukur dari skala 0
sampai 100. Dengan kata lain, tidak mungkin hasil rata-rata ada di bawah angka 0
atau di atas angka 100, jika pengukur awal adalah skor 0 sampai 100. Jika saja skor
nilai diukur pada skala 1 sampai 10, maka nilai rata-rata tetap tidak mungkin ada di
bawah 1 atau lebih dari 10.
NB : Perhatikan angka 100% yang sama dengan angka 1.
Modul statistika dasar
40
MEAN DISTRIBUSI FREKUENSI
 Mean Data Berkelompok (Grouped)
Untuk data berkelompok, atau data yang disajikan dalam suatu distribusi frekuensi,
perhitungan hamper sama dengan perhitungan Rata-rata untuk frekuensi. Perbedaan
hanya pada penetapan titik tengah kelas sebagai dasar pengambilan frekuensi.
Rumus :
=


dimana :
Contoh :
Data distribusi frekuensi berat badan remaja sebuah daerah :
Berat Badan
(kg)
Jumlah
(frek/f)
35 – 39.9 6
40 – 44.9 15
45 – 49.9 40
50 – 54.9 38
55 – 59.9 24
Di atas 60 11
Keterangan :
Remaja dengan berat badan antara 35 kg sampai 39.9 kg sebanyak 6 orang.
Kemudian remaja dengan berat badan antara 40 kg sampai 44.9 kg sebanyak 15
orang. Demikian seterusnya untuk data yang lain. Perhatikan bahwa batas atas dibuat
dengan decimal 9 dengan asumsi bahwa pengukuran berat badan tidak melebihi dua
decimal, seperti berat badab seorang remaja akan diukur sampai 37.5 dan tidak 37.55
Modul statistika dasar
41
kg. Dengan demikian, jika seorang remaja mempunyai berat badan lebih dari 39.9
kg, ia langsung dikategorikan mempunyai berat badan 40 kg.
Dengan demikian, contoh perhitungan titik tengah untuk kelas 30 – 39.9 adalah :
(35+39.9)/2 = 37.45
Perhitungan rata-rata berat badan :
Berat Badan (kg) Titik Tenga( ) Jumlah ( )
.
35 – 39.9 37.45 6 224.70
40 – 44.9 42.45 15 636.75
45 – 49.9 47.45 40 1898.00
50 – 54.9 52.45 38 1993.10
55 – 59.9 57.45 24 1378.80
60 – 64.9 62.45 11 686.95
TOTAL 134 6818.30
Rata-rata :
=
.
=50.88
Catatan ; Penggunaan titik tengah sebagai alat hitung hitung rata-rata grouped data
tentu bias mengakibatkan bias dalam perhitungan. Missal untuk interval berat badan 35-
39,9 kilogram,diasumsi remaja pada kelas tersebut sebagian besar mempunyai berat
badan 37,45 kilogram.ternyata sebagian besar jusru mempunyai berat badan 36 kilogram.
Hal ini tentu mengakibatkan bias perhitungan rata-rata, jika hasil 50,88 kilogram
dibandingkan dengan rata-rata hitung berat badan yang tidak dikelompokkan (lihat
penjelasan rata-rata frekuensi).
Namun demikian, selisih perhitungan tersebut tidaklah berarti jika jumlah data
banyak, seperti di atas 300 data, atau interval kelas relative kecil (missal 35-36.9 kg dan
seterusnya).
 Rata-rata dengan Menggunakan Coding
Modul statistika dasar
42
Coding adalah penggunaan kode-kode (seperti 1, 2 dan seterusnya) sebagai pengganti
titik tengah kelas, jika interval kelas adalah sama.
Rumus :
= A +
∑ .
.
dimana :
A = kelas dengan kode 0
f.u = total frekuensi
N = jumlah data
C = interval kelas
Sebagai contoh, digunakan data distribusi frekuensi berat badan remaja seperti kasus
sebelumnya.
Proses Pengkodean (coding) :
Cari kelas yang mempunyai frekuensi terbanyak, lalu beri kode 0. Pada kasus ini,
karena frekuensi terbesar adalah 40 yang ada di kelas 45-49.5, maka kode 0 ada pada
kelas tersebut.
Kemudian untuk kelas di atasnya diberi kode -1, -2 dan seterusnya, dan untuk kelas
di bawahnya diberi kode +1, +2 dan seterusnya, sampai jumlah kode mencukupi.
Hasil :
Berat Badan (kg) Titik Tengah ( ) KODE
Jumlah (frek/f)
35 – 39.9 37.45 -2 6
40 – 44.9 42.45 -1 15
45 – 49.9 47.45 0 40
50 – 54.9 52.45 +1 38
Modul statistika dasar
43
55 – 59.9 57.45 +2 24
60 – 64.9 62.45 +3 11
Proses perhitungan Mean :
Berat Badan
(kg)
Titik Tengah
( )
KODE
Jumlah
(frek/f)
f.u
35 – 39.9 37.45 -2 6 -12
40 – 44.9 42.45 -1 15 -15
45 – 49.9 47.45 0 40 0
50 – 54.9 52.45 +1 38 38
55 – 59.9 57.45 +2 24 48
60 – 64.9 62.45 +3 11 33
TOTAL TOTAL 134
+92
Di sini A adalah kelas dimana terdapat kode 0, yakni 45-49.9. karena kelas tersebut
mempunyai titik tengah 47.45, maka A adalah 47.45.
Dan c adalah interval kelas yang harus sama untuk setiap kelas yang ada, yakni 5
(bias didapat dari 39.9-35 atau 44.9-40 atau selisih kelas yang manapun dalam
distribusi frekuensi tersebut).
Perhitungan Mean :
= 47.45 + .5 =50.88
Perhatikan hasil perhitungan yang tepat sama dengan perhitungan Mean sebelumnya.
Catatan :
Modul statistika dasar
44
Karena sifatnya yang praktis, maka perhitungan Mean untuk distribusi frekuensi jika
memungkinkan sebaiknya menggunakan cara penyandian (kode), karena baik dengan
cara biasa maupun dengan cara koding, keduanya akan menghasilkan besaran Mean
yang sama.
RATA-RATA GEOMETRIK
Konsep Rata-rata Geometrik
Rata-rata geometric biasanya digunakan untuk menghitung rata-rata laju kenaikan
atau penurunan dari sekelompok data pada periode tertentu, yang mempunyai
perubahan angka secara mencolok.
Contoh :
Tingkat penjualan televise P.T. SUKSES selama empat tahun terakhir adalah
1.000 unit, 5.000 unit, 9.000 unit dan 15.000 unit.
Jika ditanya berapakah rata-rata pertumbuhan penjualan TV, dan dihitung
menggunakan rata-rata hitung (Mean), maka didapat :
= = = 7500
Atau 7500 TV per tahun.
Jika rata-rata adalah 7500 TV per tahun, maka seharusnya dari 1000 TV, periode
kedua akan terjual 1000+7500 = 8500 TV, periode ketiga akan terjual 8500+7500
= 16000 TV, dan periode keempat akan terjual 16000+7500 = 23500 TV.
Kenyataan pergerakan penjualan sangat berbeda dengan angka-angka sebenarnya,
seperti terlihat pada table berikut ini :
Tahun Data Asli Data Dengan Rata-rata
1 1000 1000
2 5000 8500
Modul statistika dasar
45
3 9000 16000
4 15000 23500
Unruk menghindari perbedaan tersebut, bias digunakan rata-rata geometric, yang
mengubah perhitungan rata-rata dengan konsep deret hitung menjadi berdasar
deret ukur.
Rata-rata Geometrik
Rumus :
= . …
dimana :
G adalah Rata-rata Geometrik
N adalah jumlah data
Dari penjualan TV seperti contoh sebelumnya, jika digunakan rata-rata geometric
akan didapat :
= √1000 5000 9000 15000 =5097.13
Atau jika dibulatkan ke bawah rata-rata laju kenaikan penjualan TV adalah 5097
unit TV per tahun.
Dengan demikian, perbandingan kenaikan antara penggunaan rata-rata hitung
dengan geometric :
TAHUN Data Asli
Rata-rata Geometrik (factor
5097)
Rata-rata Hitung
(factor 7500)
1 1000 1000 1000
2 5000 1000+5097=6097 8500
3 9000 6097+5097=11194 16000
4 15000 11194+5097=16291 23500
Modul statistika dasar
46
Terlihat selisih antara rata-rata geometric dengan data asli lebih sedikit daripada
selisih antara rata-rata hitung dengan data asli. Seperti pada akhir periode 4, data
asli menyatakan penjualan TV adalah 15.000 unit. Dengan rata-rata Geometrik,
diprediksi penjualan adalah 16.291 unit. Sedang dengan prediksi menggunakan
rata-rata Hitung, hasil yang didapat jauh dari data asli, yakni 23.500 unit. Dengan
demikian, jika akan dilakukan prediksi ke depan, maka untuk kasus seperti ini
seharusnya digunakan rata-rata Geometrik agar hasil tidak terlalu bias.
Secara umum, Rata-rata Geometrik selalu menghasilkan angka yang lebih kecil
dari rata-rata Hitung untuk data yang sama :
G <
Rata-rata Geometrik (cara lain)
Selain dengan rumus di atas, Rata-rata Geometrik bias dicari lewat perbandingan
(rasio) di antara data awal dan akhir :
Rumus :
= . … =
Di mana :
G adalah rata-rata Geometrik
n adalah jumlah data
Dari penjualan TV seperti contoh sebelumnya, jika digunakan rata-rata
Geometrik dengan rumus kedua di atas akan didapat :
=
.
.
= 1,97.
Berarti rata-rata laju kenaikan penjualan TV secara rasio adalah 1,97 dari tahun
ke tahun.
Modul statistika dasar
47
Dengan demikian, perbandingan kenaikan antara penggunaan rata-rata hitung
dengan geometric :
Rata-rata Geometrik
(rasio 1,97)
1.000 x 1,97 = 1.970
1.970 x 1,97 = 3.880
3.880 x 1,97 = 7.643
7.643 x 1,97 = 15.057
MEDIAN
DEFINISI Median. Median segugus data yang telah diurutkan dari yang terkecil sampai
terbesar atau terbesar sampai terkecil adalah pengamatan yang tepat ditengah-tengah bila
banyaknya pengamatan itu ganjil, atau rata-rata kedua pengamatan yang ditengah bila
banyaknya pengamatan genap.
Contoh soal 3. Dari lima kali kuiz statistic seorang mahasiswa mendapat nilai 82,93,86,92 dan
79.tentukan median populasi nilai ini.
Jawab. Setelah data diurutkan dari terkecil sampai terbesar, kita peroleh
79 82 86 92 93
Oleh karena itu, didapat =86.
Contoh soal . Kadar nikotin yang berasal dari sebuah sampel random enam batang rokok
cap tertentu adalah 2.3,2.7,2.5,2.9,3.1,dan 1.9 milligram.Tentukan mediannya.
Jawab. Bila kadar nikotin itu kita urutkan dari yang terkecil sampai terbesar maka kita
peroleh :
1.9 2.3 2.5 2.7 2.9 3.1
Maka mediannya adalah : rata-rata dari 2.5 dan 2.7, yaitu
Modul statistika dasar
48
=
. .
= 2.6
Formula Median untuk Data berkelopok adalah :
Keterangan :
I = Lebar kelas
L = Tepi bawah kelas median
F
k
= Jumlah frekuensi sebelum kelas median
F
med
= Jumlah frekuensi dimana kelas median ada
MODUS
DEFINISI Modus. Modus segugus pengamatan adalah nilai yang terjadi paling
sering atau yang mempunyai paling tinggi.
Contoh soal 5. Nilai ujian semester dari beberapa mahasiswa matematika tercatat
sebagai berikut: 90,100,50,90,90,70,80,60,65 dan 75. Tentukan modusnya.
Jawab. Modusnya adalah nilai yang terjadi dengan frekuensi paling paling tinggi,
adalah : 90.
Formula Modus untuk data berkelompok Y
.
Keterangan :
MODUS = L +
Median = L + . i
Modul statistika dasar
49
L : Batas bawah kelas modus ada
d1 : Selisih frekuensi kelas modus dengan kelas sebelumnya.
d2 : Selisih frekuensi kelas modus dengan kelas sesudahnya
i : Lebar kelas
1.3.1 LATIHAN
1. Sebuah bioskop mencatat adanya penurunan jumlah penonton selama
periode 1998-2001 :
TAHUN
PENONTON
(orang)
1998 5300
1999 5200
2000 4500
2001 4000
Dari data di atas :
a. Hitung rata-rata Geometrik dari penurunan penonton tersebut. Apa arti
hasil rata-rata Geometrik tersebut?
b. Jika penurunan tersebut tetap berlangsung dengan tingkat yang sama,
maka berapakah perkiraan penonton untuk tahun 2002?
2. IQ rata-rata sepuluh mahasiswa yang mengambil mata kuliah matematika
adalah : 114. Bila Sembilan mahasiswa diantaranya memiliki IQ
101,125,118,128,106,115,99,118 dan 109, berapa IQ mahasiswa yang satu
lagi?
3. Produktivitas 25 karyawan dari sebuah perusahaan konveksi adalah sebagai
berikut : (potong pakaian per minggu)
25 31 37 42 19
20 24 23 30 26
Modul statistika dasar
50
21 22 34 30 32
29 33 31 34 40
21 28 32 33 40
Pertanyaan :
a. Buatlah distribusi frekuensi dari 25 data di atas, dengan interval kelas 5.
b. Hitung rata-rata dari distribusi frekuensi di atas.
c. Hitung rata-rata TANPA MENNGUNAKAN distribusi frekuensi.
d. Bandingkan dan analisis hasil b dan c.
4. Tentukan mean. Median dan modus dari data tinggi badan 50 mahasiswa
berikut.
Berat (X)
kg
Nilai tengah
interval
Frekuensi
50 - 52
53 – 55
56 – 58
59 – 61
62 - 64
51
54
57
60
63
5
17
14
10
4
50
5. Sebuah bank yang secara agresif berusaha menarik dana dari para nasabah,
menawarkan suku bunga tabungan dalam lima bulan terakhir sebagai berikut : 5%,
9%, 15%, 20% dan 29%. Berapakah suku bungan tabungan rata-rata yang
ditawarkan bank tersebut?
BAB IV
UKURAN DISPERSI
4.1 PENDAHULUAN
Modul statistika dasar
51
Terlepas dari ukuran gejala pusat dan ukuran letak, masih ada lagi ukuran lain
ialah ukuran simpangan atau ukuran dispersi. Ukuran ini kadang-kadang dinamakan
pula ukuran variasi, yang manggambarkan bagaimana berpencarnya data kuantitatif.
Beberapa ukuran disperse yang dikenal dan akan diuraikan disini ialah : rentang,
rentang antar kuartil, simpangan kuartil atau deviasi kuartil, rata-rata simpangan atau
rata-rata deviasi, simpangan baku atau deviasi standar, varians dan koefisien variasi.
KOMPETENSI KHUSUS, Diharapkan pada akhir perkuliahan nanti, mahasiswa/I
dapat mengetahui dan memahami arti dan manfaat dari mengetahui dispersi sebuah
data. Dan juga mengetahui teknik perhitungan disperse data.
1.2 PENYAJIAN
1. RENTANG, RENTANG ANTAR KUARTIL DAN SIMPANGAN
KUARTIL
Ukuran variasi yang paling mudah ditentukan ialah rentang. Rumusnya :
rentang = data terbesar – data terkecil
(R1)
Karena mudahnya dihitung, rentang ini banyak sekali digunakan dalam cabang lain
dari statistika, iakah statistika industry.
Rentang antar kuartil juga mudah ditentukan, dan ini merupakan selisih antara dan
. Jadi didapatlah hubungan :
RAK = −
(R2)
dengan RAK = rentang antar kuartil
= kuartik ketiga
= kuartil pertama
Contoh : Daftar berikut menyatakan upah tiap jam untuk 65 pegawai di suatu
pabrik.
DAFTAR R1
Upah (Rupiah)
Modul statistika dasar
52
50,00 - 59,99 8
60,00 - 69,99 10
70,00 - 79,99 16
80,00 - 89,99 14
90,00 - 99,99 10
100,00 - 109,99
5
1100,00 - 119,99
2
JUMLAH
65
Dengan menggunakan rumus di bawah , maka nilai-nilai dan dapat dihitung.
= +
dengan I = 1, 2, 3
Hasilnya : = .68,25; = .90,75.
RAK dihitung dengan menggunakan rumus R2, maka diperoleh : RAK = Rp. 22,50.
Ditafsirkan bahwa 50% dari data, nilainya paling rendah 68,25 dan paling tinggi
90,75 dengan perbedaan paling tinggi 22,50.
Simpangan kuartil atau deviasi kuartil atau disebut pula rentang semi antar kuartil,
harganya setengah dari rentang antar kuartil. Jadi jika simpangan kuartil disingkat
dengan SK, maka :
=
1
2
( − )
(R3)
Contoh : Dari daftar R1, jelas didapat :
Modul statistika dasar
53
=
1
2
( .90,75− .68,25) = .11,25
Selanjutnya, karena
1
2
( − ) = Rp. 79,50, maka 50% dari pegawai mendapat
upah terletak dalam interval .79,50 ± .11,25 atau antara Rp. 68,25 dan
Rp.90,75.
2. RATA-RATA SIMPANGAN
Misalkan data hasil pengamatan berbentuk , …, dengan rata-rata ̅ .
Selanjutnya kita tentukan jarak antara tiap data dengan rata-rata ̅ . Jarak ini, dalam
symbol ditulis | − ̅ |. Dengan | |. Berarti sama dengan a jika a positif, sama
dengan –a jika a negative dan nol jika a = 0. Jadi harga mutlak, selalu memberikan
tanda positif, karena inilah | − ̅ | disebut jarak antara dengan ̅ . Jika sekarang
jarak-jarak :
| − ̅ | , | − ̅ |, . . . , | − ̅ | dijumlahkan, lalu dibagi oleh n, maka diperoleh
satuan yang disebut rata-rata simpangan atau rata-rata deviasi. Rumusnya adalah :
=
∑| − ̅ |
(R4)
Dengan RS berarti = rata-rata simpangan.
Contoh :
− | − |
8 -1 1
7 -2 2
10 1 1
11 2 2
Modul statistika dasar
54
Dari data di atas, jika dihitung, rata-ratanya = 9. Jumlah harga-harga mutlaknya,yaitu
jumlah bilangan-bilangan dalam kolom akhir, adalah 6. Maka = = 1 ½ .
3. SIMPANGAN BAKU
Barangkali ukuran simpangan yang paling banyak digunakan adalah simpangan baku
atau deviasi standar.
Pangkat dua dari simpangan baku dinamakan varians. Untuk sampel, simpangan
baku akan diberi symbol s, sedangkan untuk populasi diberi symbol . Variansnya
tentulah s
2
untuk varians sampel dan untuk varians populasi. Jelasnya, s dan s
2
merupakan statistic sedangkan dan parameter.
Jika kita mempunyai sampel berukuran n dengan data-data , …, dan rata-
rata ̅ , maka statistic s
2
dihitung dengan :
=
∑( − )
−1
(R5)
Untuk mencari simpangan baku s, dari s
2
diambil harga akarnya yang positif.
Dari rumus R5, varians s
2
dihitung sebagai berikut :
1. Hitung rata-rata ̅
2. Tentukan − selisih, − ,…, −
3. Tentukan kuadrat selisih tersebut, yakni ( − )
2
, ( − )
2
, . . . , ( − )
2
4. Kuadrat-kuadrat tersebut dijumlahkan
5. Jumlah tersebut dibagi oleh (n - 1)
Contoh : Diberikan sampel dengan data : 8, 7, 10, 11, 4. Untuk menentukan
simpangan baku s, kita buat table berikut.
− ( − )
2
(1) (2) (3)
8 0 0
7 -1 1
10 2 4
Modul statistika dasar
55
11 3 9
4 -4 16
Rata-rata ̅ =8. Dapat dilihat dari kolom 2 bahwa ∑( − ) = 0. Karena itulah
disini diambil kuadratnya yang dituliskan dalam kolom 3. Didapat ∑( − ) = 30.
Dengan menggunakan rumus R5, didapat :
s
2
= 30/4 = 7,5. Sehingga = 7,5 =2,74.
Bentuk lain untuk rumus varians sampel ialah :
=
∑ −(∑ )
( −1)
(R6)
Dalam rumus di atas Nampak bahwa tidak perlu dihitung dulu rata-rata ̅ , tetapi
cukup menggunakan nilai data aslinya berupa jumlah nilai data dan jumlah
kuadratnya. Jika digunakan untuk data di atas, maka dari table berikut ini, dihasilkan
:
8 64
7 49
10 100
11 121
4 16
40 = ∑ 350 = ∑
∑ = 40 dan ∑ = 350. Dengan n = 5, dari rumus R6 didapat varians :
=
( )
=7,5dan simpangan baku = 7,5 =2,74.
Sangat dianjurkan bahwa menghitung simpangan baku lebih baik
menggunakan rumus R6 karena kekeliruannya lebih kecil.
Modul statistika dasar
56
Jika data dari sampel tekah disusun dalam daftar distribusi frekuensi, maka
untuk menentukan varians s
2
dipakai rumus :
=
∑ −( − )
( −1)
(R7)
Atau yang lebih baik digunakan :
=
∑ −(∑ )
( −1)
(R8)
Rumus R7 menggunakan rata-rata ̅ sedangkan rumus R8 hanya
menggunakan nilai tengah atau tanda kelas interval.
Contoh : Untuk menghitung varians s
2
dari data di bawah ini tentang nilai ujian
80 mahasiswa, digunakan rumus R7.
Nilai ujian
31 – 40 1
41 – 50 2
51 – 60 5
61 – 70 15
71 – 80 25
81 – 90 20
91 – 100 12
Jumlah 80
Jawab : lebih baik dibuat table berikut.
NILAI
UJIAN
− ( − )
2
. ( − )
2
Modul statistika dasar
57
(1)
(2) (3) (4) (5) (6)
31 – 40 1 35,5 -41,1 1689,21 1.689,21
41 – 50 2 45,5 -31,1 967,21 1.834,42
51 – 60 5 55,5 -21,1 445,21 2.226,05
61 – 70 15 65,5 -11,1 123,21 1.848,15
71 – 80 25 75,5 -1,1 1,21 30,25
81 – 90 20 85,5 8,9 79,21 1.584,20
91 – 100 12 95,5 18,9 357,21 4.286,52
Jumlah 80 - - - 13.498,80
Telah dihitung, dengan harga ̅ = 76,6.
Kolom 3 merupakan tanda kelas, kolm 4 adalah tiap tanda kelas dalam kolom 3
dikurangi 76,6 dan kolom 5 merupakan kuadrat bilangan-bilangan dalam kolom 4
sedangkan kolom akhir sama dengan hasil kali kolom 2 dengan kolom 5. Didapat
harga-harga :
n = ∑ = 80 dan ∑ . . ( − )
2
= 13.498,80. Sehingga dengan rumus R7
didapat varians :
=
. ,
= 170,9
Simpangan baku =

170,9=13,07.
Untuk menggunakan rumus R8, menggunakan data yang sama, maka table
yang perlu dibuat adalah seperti di bawah ini :
NILAI
UJIAN
. .
(1)
(2) (3) (4) (5) (6)
31 – 40 1 35,5 1260,25 35,5 1260,25
41 – 50 2 45,5 2070,25 91,0 4.140,50
Modul statistika dasar
58
51 – 60 5 55,5 3080,25 277,5 15.401,25
61 – 70 15 65,5 4290,25 982,5 64.353,75
71 – 80 25 75,5 5700,25 1887,5 142.506,25
81 – 90 20 85,5 7310,25 1710,0 146.205,00
91 – 100 12 95,5 9120,25 1146,0 109.443,00
Jumlah 80 - - 6130,0 483.310,00
Kolom 4 adalah kuadrat tanda-tanda kelas dalam kolom 3, kolom 5 merupakan
hasil kali kolom 2 dan kolom 3 dan kolom akhir adalah produk antara kolom 2
dan kolom 4. Dari table didapat :
n = ∑ = 80, ∑ . = . ∑ . = . .
Sehingga dari rumus R8 diperoleh varians :
=
80 483.310−(6.130)
80 79
=172,1.
Hasilnya berbeda dengan hasil dari rumus R7, karena ̅ yang digunakan di
rumus R7 telah dibulatkan hingga satu decimal, yang dengan sendirinya akan
menyebabkan adanya perbedaan.
Cara singkat atau cara sandi, seperti ketika menghitung rata-rata ̅ , dapat
digunakan juga untuk menghitung varians sehingga perhitungan akan lebih
sederhana. Rumusnya adalah :
=
∑ −(∑ )
( −1)
(R9)
P = panjang kelas interval
=nilai sandi dan =∑
Contoh : Untuk data dalam table yang lalu, jika dipakai rumus R9 ini, maka
diperlukan table berikut :
Modul statistika dasar
59
NILAI UJIAN
. .
31 – 40 1 35,5 -4 16 -4 16
41 – 50 2 45,5 -3 9 -6 18
51 – 60 5 55,5 -2 4 -10 20
61 – 70 15 65,5 -1 1 -15 15
71 – 80 25 75,5 0 0 0 0
81 – 90 20 85,5 1 1 20 20
91 – 100 12 95,5 2 4 24 48
Jumlah 80 - - - 9 137
Dari tabel ini didapat P = 10, =∑ =80, ∑ . = dan ∑ . = ,
sehingga didapat varians :
=(10)
80 137−(9)
80 79
=172,1.
Hasilnya sama dengan bila digunakan rumus R8. Ini memang demikian!
Membandingkan rumus R8 dan R9, sebenarnya yang terakhir didapat dari yang
pertama dengan menggunakan transformasi = berdasarkan dua sifat
yaitu:
1. Jika tiap nilai data ditambah atau dikurangi dengan bilangan yang sama, maka
simpangan baku s tidak berubah.
2. Jika tiap nilai data dikalikan dengan bilangan yang sama d, maka simpangan
bakunya menjadi d kali simpangan baku yang asal.
Contoh : Diberikan sampel dengan data : 9, 3, 8, 8, 9, 8, 9, 18. Setelah dihitung
maka s = 4,14.
a. Tambah tiap data dengan 6 atau berapa saja, maka untuk data baru
s = 4,14.
b. Kurangi tiap data dengan 5 atau berapa saja, maka untuk data baru
s = 4,14
Modul statistika dasar
60
c. Kalikan tiap data dengan 6, maka untuk data baru s = 24,84.
d. Bagi tiap data dengan ½ , maka untuk data baru s = 8,28.
Simpangan baku gabungan dihitung dengan rumus :
=
∑( )
∑ −
(R10)
Atau lengkapnya :
=
( −1) +( −1) + +( −1)
+ + + −
Dengan s
2
berarti varians gabungan untuk sampel yang berukuran n.
Contoh : Hasil pengamatan pertama terhadap 14 obyek memberikan s = 275
sedangkan pengamatan yang kedua kalinya terhadap 23 obyek
menghasilkan s = 3,08. Maka, dengan rumus R10 untuk k = 2, didapat
varians gabungan :
=
( )( , ) ( )( , )
=8,7718.
Sehingga simpangan baku gabungan s = 2,96.
4. BILANGAN BAKU DAN KOEFISIEN VARIASI
Misalkan kita mempunyai sebuah sampel berukuran n dengan data , …,
sedangkan rata-ratanya = ̅ dan simpangan baku s. dari sini kita dapat membentuk
data baru , …, dengan rumus :
=
̅
untuk I = 1, 2, …, n
(R11)
Jadi diperoleh penyimpangan atau deviasi data dari rata-rata dinyatakan dalam
satuan simpangan baku. Bilangan yang didapat dinamakan bilangan z. variable
, …, ternyata mempunyai rata-rata = 0 dan simpangan baku = 1.
Dalam penggunaannya, bilangan z ini sering diubah menjadi keadaan atau model
baru, atau tepatnya distribusi baru, yang mempunyai rata-rata ̅ dan simpangan baku
Modul statistika dasar
61
yang ditentukan. Bilangan yang diperoleh dengan cara ini dinamakan bilangan
baku atau bilangan standar dengan rata-rata ̅ dan simpangan baku dengan rumus
:
= ̅ +
− ̅
(R12)
Perhatikan bahwa untuk ̅ = 0 dan = 1, rumus R12 menjadi rumus R11, sehingga
bilangan z sering pula diesbut bilangan standar. Bilangan baku sering dipakai untuk
membandingkan keadaan distribusi fenomena.
Contoh : Seorang mahasiswa mendapat nilai 86 pada ujian akhir matematika dimana
rata-rata dan simpangan baku kelompok, masing-masing 78 dan 10. Pada
ujian akhir statistika dimana rata-rata kelompok 84 dan simpangan baku
18, ia mandapat nilai 92. Dalam mata ujian mana ia mencapai kedudukan
yang lebih baik?
Jawab : Dengan rumus R11 didapat bilangan baku :
Untuk matematika = =0,8.
Untuk statistika = =0,44.
Mahasiswa itu mendapat 0,8 simpangan baku di atas rata-rata nilai matematika dan
hanya 0,44 simpangan baku di atas rata-rata nilai statistika. Kedudukannya lebih
timggi dalam hal matematika.
Kalau saja nilai-nilai di atas ke dalam bilangan angka baku dengan rata-rata 100 dan
simpangan baku 20, maka :
Untuk matematika =100+20( ) =116.
Untuk statistika =100+20( ) =108,9.
Dalam system ini ia lebih unggul dala matematika.
Ukuran variasi atau disperse yang diuraikkan dalam bagian-bagian yang lalu
merupakan disperse absolute. Variasi 5 cm untuk ukuran jarak 100 m dan variasi 5
Modul statistika dasar
62
cm untuk ukuran jarak 20 m jelas mempunyai pengaruh yang berlainan. Untuk
mengukur pengaruh demikian dan untuk membandingkan variasi antara nilai-nilai
besar dan nilai-nilai kecil, digunakan disperse relative yang ditentukan oleh :
Dispersi relatif =
Diepersi absolut
Rata−rata
(R13)
Jika untuk dispersi absolute diambil simpangan baku, maka didapat koefisien
variasi, disingkat KV. Rumusnya, dinyatakan dalam persen, berbentuk :
KV =
simpanganbaku
rata−rata
x100%
(R14)
Skoefisien variasi tidak bergantung pada satuan yang digunakan, karenanya dapat
dipakai untuk membandingkan variasi relative beberapa kumpulan data dengan
satuan yang berbeda.
Contoh : Semacam lampu electron rata-rata dapar dipakai selama 3.500 jam dengan
simpangan baku 1.050 jam. Lampu model lain rata-ratanya 10.000 jam
dengan simpangan baku 2.000 jam.
Dari sini mudah dihitung :
KV (lampu pertama) =
.
.
100%=30%.
KV (lampu kedua) =
.
.
100%=20%.
Ternyata lampu kedua secara relative mempunyai masa pakai yang lebih
uniform.
SOAL LATIHAN
1. Diberikan =85dan =116. hitunglah rentang 10 – 90 persentilnya
(Rentang 10 – 90 persentil didefinisi sebagai − ). Apa artinya?
2. Diberikan data : 12, 8, 9, 10, 14, 15, 8, 10, 12.
Modul statistika dasar
63
Hitunglah :
a. Rata-rata simpangan
b. Simpangan baku
c. Simpangan baku berapa kali rata-rata simpangan.
3. Hasil pengamatan memberikan harga-harga =140 dan =196.
Apakah artinya?
a. −
b. ( − )
Ukuran-ukuran apakah itu?
4. Koefisien variasi hasil pengamatan yang terdiri atas 100 obyek besarnya
20%. Rata-ratanya tiga lebihnya dari simpangan bakunya. Tentukan rata-
rata untuk sampel itu.
5. Sebuah sampel berukuran 200 telah dibagi menjadi 3 bagian ialah :
Bagian I dengan ̅ =40,8dan =10,5
Bagian II dengan ̅ =36,7dan =9,8
Bagian III dengan ̅ =29,9dan =10,2
Dapatkah rata-rata gabungan dan simpangan baku gabungan dihitung
disini?
Mengapa? Bagaimana jika juga diberikan bahwa :
Bagian I terdiri dari 60 obyek
Bagian II terdiri dari 105 obyek dan
Bagian III terdiri 35 obyek.
Modul statistika dasar
64
BAB V
MOMEN, KEMIRINGAN DAN KURTOSIS
5.1 PENDAHULUAN
Ekspektasi lain yang juga banyak digunakan dalam statistika adalah momen
distribusi suatu peubah random atau momen peubah random. Peranan momen ke-r
terhadap pusat suatu peubah random X, r = 0, dan momen ke-r terhadap suatu
peubah random X sangat penting dalam statistika namum demikian, suatu hal yang
dapat dipertanyakan adalah apakah distribusi suatu peubah random akan tertentu,
jika semua momennya tertentu? Jawabannya tentu saja tidak, yang artinya belum
tentu.
Untuk keperluan itu, akan sangat menguntungkan apabila kita dapat menentukan
Modul statistika dasar
65
suatu fungsi yang dapat menentukan semua momen suatu peubah random dan
fungsi tersebut menentukan distribusi peubah randomnya.
KOMPETENSI KHUSUS, Mahasiswa dapat Menentukan momen ke-r terhadap
pusat suatu peubah random X, r = 0, momen ke-r terhadap suatu peubah random
X, dan Fungsi pembangkit momen.
5.2 PENYAJIAN
A. MOMEN
Momen ke-r terhadap pusat suatu peubah random X, r =0, 1,2, . . .ditulis µ
r

disesuaikan.
) (
' r
X E r = 
, )
X
X E  

= =
=
'
1
'
0
1
Momen ke-r terhadap rataan suatu peubah random X, r = 0,1,2, …, ditulis µ
r
didefenisikan sebagai
= ( − )
Perlu dicatat bahwa ada hanya jika ada.
=
=
= ( − ) =
= − = −
Metode Fungsi Pembangkit Momen
Teorema 5.2.
Modul statistika dasar
66
Perhatikan X dan Y yang masing-masing memiliki fungsi pembangkit momen mX(t)
dan mY(t). Jika mX(t) = mY(t) untuk semua nilai t maka X dan Y memiliki fkp/fmp
yang sama. (sifat unik fungsi pembangkit momen).Bagaimana menentukan fkp/fmp
melalui fpm? Jika kita memiliki suatu fungsi U = g(Y) dan kemudian dapat
ditentukan mU(t) adalah fungsi pembangkit momen peubah random U,serta kita
mengenali bentuknya (misal Poisson, Binomial, Normal, Gamma, dll). Kita dapat
menggunakan sifat unik fungsi pembangkit momen untuk menentukan fkp/fmp dari
peubah random U.
Ilustrasi 5.6.
Jika Y ~ Gamma(α, β), perlihatkan bahwa U = g(Y) = 2Y/β ~ χ2 (2α).
Kita tahu bahwa fpm Y adalah
( ) =
( ) = ( ) =
( ⁄ )
=
( ⁄ )
= ( ⁄ )
=
Jelas U ~ χ2
(2α)
Teorema 5.3.
Perhatikan Y1, Y2, …, Yn adalah sampel random dimana Yi memiliki fpm
mYi(t) untuk i = 1, 2, …, n. Jika U = Y1 + Y2 + … + Yn maka
Bisa diperlihatkan sbb :
( ) = ( ) =
( + + + )
= ( … )
= ( ) ( ) … ( )
Modul statistika dasar
67
= ( ) ( ) … ( )
=∏ ( )
Ilustrasi 5.7.
mU(t) dapat dihitung sbb.
Jika Y1, Y2, …, Yn ~ Bernoulli (p). Tentukan fkp U = Y1 + Y2 + …+ Yn.
( ) = ( ) ( ) … ( )
=( + ) ( + ) …( + )
n
=( + )
m
U
(t) adalah fpm Binomial (n, p).Jadi U ~ Binomial (n, p)
FUNGSI PEMBANGKIT MOMEN
Peranan momen-momen yang dibicarakan terdahulu pada modul sebelumnya,
sangat penting dalam statistika. Namun demikian, suatu hal yang dapat
dipertanyakan adalah apakah distribusi suatu peubah random akan tertentu, jika
semua momennya tertentu? Jawab: pada umumnya tidak, yang artinya belum tentu.
Untuk keperluan itu, akan sangat menguntungkan apabila kita dapat menentukan
suatu fungsi yang dapat menentukan semua momen suatu peubah random, dan
fungsi tersebut menentukan distribusi peubah randomnya.
Defenisi: fungsi pembangkit momen suatu peubah X, ditulis m
X
(t), didefenisikan
sebagai berikut:
0 h h), h, ( setiapt untuk ), E(e (t) m
tX
X
> ÷ e =
- m
X
(t) = 1 untuk t = 0
- Jika m
X
(t) ada, maka
. 2,.. 1, 0, r , μ
dt
(t) m d
r
r
X
r
= ' =
Modul statistika dasar
68
- Suatu hal lain yang penting untuk dicatat adalah bahwa jika X adalah suatu
peubah random dengan m
X
(t) ada, maka distribusi X tertentu dan sebaliknya.
Dengan perkataan lain m
X
(t) ada bila dan hanya bila distribusi X tertentu.
- Jika m
X
(t
0
) ada untuk t
0
> 0, maka m
X
(t
1
) ada untuk setiap
0 h ), t (0, t setiap untuk
0 1
> e
Demikian juga, jika m
X
(t
1
) ada untuk t
0
< 0, maka m
X
(t
1
) ada
,0) (t t setiap untuk
0 1
e
- m
aX+b
(t) = e
bt
m
X
(at)
- Jika X
1
, X
2
, …,Xn saling bebas, maka
]
=
¿
=
=
n
i
i X
t X a
t a m t m
i
n
i
1
) (
) ( ) (
1
1 1
Maka
Contoh
1. Jika X adalah suatu peubah random dengan
, )
) (
, 1
2
) (
x
X
I x x f
·
÷
=
¦
·
÷
=
1
2
X
(t) m maka dx e x
tx x
Karena m
X
(t) = ∞ untuk t >0, maka m
X(t)
tidak ada disekitar t = 0
2. Jika x adalah peubah random dengan
1
) (
!
) (
,... 2 , 1 , 0 ,
!
) (
) 1 (
0
= = =
=
=
=
= ÷ =
÷
÷
·
=
÷
÷
¿
t untuk
dt
t dE
sehingga
e
e e
x
e t
t E
x
x
e
x f
X
X
t
x
x
x X
X
x
 



 


Modul statistika dasar
69
Perlu diperhatikan disini bahwa untuk soal ini µX dapat juga dihitung
menggunakan mX(t).
Kesetangkupan dan Kemenjuluran
DEFINISI Kemenjuluran Pearson. Koefisien kemenjuluran pearson dapat
didefinisikan sebagai berikut:
SK =
( )
, atau SK =
( )
Untuk Distribusi data yang setangkup sempurna, nilai tengah dan mediannya
identik oleh karena ituSK bernilai nol.Bila Distribusinya menjulur nilai tengah lebih
kecil dari mediannya, sehingga nilai SK negative. Tetapi bila Distribusinya menjulur
ke kanan, nilai tengahnya lebih besar daripada mediannya, sehingga nilai SK positif.
Contoh Soal 10. Hitunglah koefisien kemenjuluran pearson bagi Distribusi umur
aki dalam table 2.2.
Jawab. Dengan menganggap data table 2.2 sebagai suatu sampel , kita peroleh = 3.41,
= 3.4 dan S =0.70. oleh karena itu, SK =
( )
=
( . – . )
.
= 0.04
Hasil perhitungan di atas menunjukkan bahwa data itu hamya sedikit menjulur ke kanan.
Dengan nilai SK yang demikian kecilnya, kita dapat mengatakan bahwa datanya
setangkup.
Persenti, desil dan Kuartil
DEFINISI : Persentil. Persentil adalah nilai-nilai yang membagi segugus
pengamatan menjadi 100 bagian yang sama. Nilai-nilai itu dilambangkan dengan P-
1
, P
2
,P3, . . . P
99
, bersifat bahwa 1% dari seluruh data terletak dibawah P
1,
2%
terletak dibawah P
2
, dan 99% terletak di bawah P
99
.
Untuk menghitung prosedur perhitungan suatu persentil, sebagai contoh marilah kita
mencari P
85
untuk besaran umur Aki dalam table 2.2. langkah pertama kita harus
mengurutkan data dari terkecil sampai terbesar. sbb: 1.6, 1.9,2.2, 2.5,2.6, 2.6,2.9,3.0,
Modul statistika dasar
70
3.0, 3.1, 3.1, 3.1, 3.1, 3.2, 3.2, 3.2, 3.3, 3.3, 3.3, 3.4, 3.4, 3.4, 3.5, 3.5, 3.6, 3.7, 3.7,
3.7, 3.8, 3.8, 3.9, 3.9, 4.1, 4.1, 4.2, 4.3, 4.4, 4.5, 4.7, 4.7.
Karena ada 40 data pengamatan, maka kita harus mencari sebuah nilai yang
dibawahnya terdapat (85/100) X 40 = 34 pengamatan. P
85
dapat berupa sembarang
nilai antara 4.1 tahun dan 4.2 tahun.Supaya mendapat nilai yang khas maka P
85
didefinisikan sebagai titik tengah antara ke dua pengamatan tersebut. Jadi didapat P
85
=
. .
= 4.15 tahun.
DEFINISI Desil. Desil adalah nilai-nilai yang membagi segugus pengamatan
menjadi 10 bagian yang sama.Nilai-nilai itu dilambangkan dengan D
1
, D
2
,D
3
, …
D
9
, mempunyai sifat bahwa 10% data jatuh dibawah D
1,
20% jatuh dibawah D
2
, . . .
, dan 90% jatuh dibawah D
9
.
Cara kita menghitung desil persis sama dengan cara kita menentukan persentil.
DEFINISI Kuartil. Kuartil adalah nilai-nilai yang membagi segugus data
pengamatan menjadi 4 bagian sama besar.Nilai-nilai itu yang dilambangkan dengan
Q
1
, Q
2,
Q
3,
mempunyai sifat bahwa 25% data jatuh dibawah Q
1
, 50% jatuh dibawah
Q
2
, dan 75% jatuh dibawah Q
3
.
Untuk menghitung Q
1
, bagi Distribusi umur Aki, kita memerlukan nilai yang
dibawahnya terdapat (25/100) X 40 = 10 pengmatan. Karena pengamatan yang ke –
10 dan ke-11 sama dengan 3.1 tahun, jadi Q
1
= 3.1.
B. KEMIRINGAN
Kita sudah mengenal kurva halus atau model yang bentuknya bisa positif, negate
atau simetrik. Model positif terjadi bila kurvanya mempunyai ekor yang memanjang
di sebelah kanan. Sebaliknya, jika ekornya memanjang ke sebelah kiri didapat model
negative. Dalam kedua hal terjadi sifat taksimetri. Untuk mengetahui derajat
taksimetri sebuah model, digunakan ukuran kemiringan yang ditentukan oleh :
kemiringan =
(Rata−rata) −(Modus)
Simpanganbaku
Modul statistika dasar
71
(K1)
Rumus empiric untuk kemiringan, adalah :
kemiringan =
3((Rata−rata) −(Median))
Simpanganbaku
(K2)
Rumus-rumus K1 dan K2 berturut-turut dinamakan koefisien kemiringan pearson
tipe pertama dan tipe kedua.
Kita katakana model positif jika kemiringan positif, negative jika kemiringan
negative dan simetrik jika kemiringan sama dengan nol.
Contoh : Data nilai ujian 80 orang mahasiswa yang tercantum dalam daftar di bawah
ini telah menghasilkan = 76,62; Me = 77,3; Mo = 77,17 dan simpangan
baku s = 13,07.
Nilai ujian
31 – 40 1
41 – 50 2
51 – 60 5
61 – 70 15
71 – 80 25
81 – 90 20
91 – 100 12
Jumlah 80
Jawab : Kemiringan
, ,
,
=−0,04.
Karena kemiringan negative dan dekat kepada nol maka modelnya sedikit miring
ke kiri. Berikut ada gambar grafiknya.
Modul statistika dasar
72
A. KURTOSIS
Bertitik tolak dari kurva model normal atau distribusi normal, tinggi rendahnya
atau miring datarnya bentuk kurva disebut kurtosis, dapat ditentukan. Kurva
distribusi normal, yang tidak terlalu runcing atau tidak terlalu datar, dinamakan
mesokurtik. Kurva yang runcing dinamakan leptokurtic sedangkan yang datar
disebut platikurtik.
Salah satu ukuran kurtosis ialah koefisien kurtosis, diberi symbol , ditentukan
oleh rumus :
Modul statistika dasar
73
=( / )
dengan dan di dapat dari rumus :
=
∑( − ̅ )
Criteria yang didapat dari rumus ini ialah :
a) =3 distribusi normal
b) >3 distribusi leptokurtik
c) <3 distribusi platikurtik
Untuk menyelidiki apakah distribusi normal atau tidak, sering pula dipakai
koefisien kurtosis persentil, diberi simbol k, yang rumusnya :
=

=
1
2
( − )

(K3)
dengan SK = rentang semi antar kuarti
= kuarti kesatu
= kuartil ketiga
= persentil kesepuluh
= persentil ke-90
− = rentang 10 – 90 persentil.
Untuk model distribusi normal, harga k = 0,263.
SOAL LATIHAN
1. Bilangan-bilangan berikut menyatakan hasil ujian mata kuliah Metode
Statistik :
23
80
52
41
60
60
77
10
71
78
79
81
64
83
89
32
95
75
54
76
57
41
78
64
84
74
65
25
72
48
52
92
80
88
84
70
85
98
62
90
82
55
81
74
15
36
76
67
43
79
Modul statistika dasar
74
34 67 17 82 69 74 63 80 85 61
Dengan menggunakan 9 selang dengan nilai terendah 10 :
a) Buat Distribusi frekuensinya
b) Sajikan data di atas dalam diagram batang
c) Hitunglan persentil, desil dan kuartil data di atas.
2. Buatlah rumus rata-rata dan Varians S
2
dari rumus momen untuk:
a. Data belum disusun dalam daftar distribusi frekuensi
b. Data yang sudah disusun dalam distribusi frekuensi
3. Diberikan data: 5,4,4,6,3,8,10,8,3,2. Hitunglah
a. Momen pertama, kedua,ke tiga dank e empat
b. Momen ke-1, ke-2, ke-3 dan ke-4 disekitar rata-rata.
BAB VI
K O M B I N A T O R I A L
6.1 PENDAHULUAN
Seperti yang telah dibicarakan dalam modul-modul terdahulu, apabila suatu
eksperimen dilakukan, yang menjadi perhatian kita adalah beberapa kejadian yang
Modul statistika dasar
75
menarik dan peluang terjadinya kejadian-kejadian tersebut. Pengertian distribusi
peluang adalah himpunan pasangan berurut dari kejadian dan paluang terjadinya
kejadian tersebut dimana kejadian tersebut biasanya adalah hasil perhitungan atau
hasil pengukuran terhadap hasil eksperimen yang menjadi perhatian. Dalam hal
ini perlu dicatat bahwa hasil-hasil yang mungkin dari suatu eksperimen pada
umumnnya belum tentu merupakan angka/ bilangan.
Sebenarnya menurut urutan yang tepat, maka sebelum kia membahas tentang
Peluang maka kita terlebih dahulu kita pelajari tentang bagaima cara atau teknik
membilang, menyelesaikan bentuk faktorial suatu bilang dan sampai masuk
permutasi dan kombinasi suatu bilangan. Jadi dalam modul ini kita akan
membahas khusus tentang materi-materi yang disinggung di atas, ditambah
dengan pengulangan beberapa bentuk distribusi peluang.
KOMPOTENSI KHUSUS, Diharapkan setelah mengikuti perkuliahan ini
mahasiswa/i mempu menjelaskan dan menggunakan konsep kombinatorial dalam
menyelesaikan masalah-asalah yang berkaitan dengan peluang yang ada dalam
kehidupan sehari-hari.
6.2 PENYEJIAN
Mencacah Titik Sampel
Masalah yang harus kita pikirkan dan coba untuk dievaluasi adalah pengaruh factor
kebetulan yang berkaitan dengan terjadinya kejadian-kejadian tertentu bila sebuah
percobaan dilaksanakan. Masalah ini termasuk dalam cabang matematika yang
disebut peluang. Dalam banyak hal kita akan memecahkan masalah peluang dengan
mencacah banyaknya titik dalam ruang sampel tanpa mendaftarkan dahulu unsur-
unsurnya.Prinsip dasar mencacah, sering disebut kaidah penggandaan, dan
dinyatakan dalam dalil-dalil sebagai berikut :
DALIL 1.Kaidah Penggandaan. Bila suatu operasi dapat dilakukan dalam n
1
cara,
dan bila untuk setiap cara tersebut operasi kedua dapat dilakukan dengan n
2
cara,
maka kedua operasi itu secara bersama-sama dapat dilakukan dalam n
1
n
2
cara.
Modul statistika dasar
76
Contoh soal Bila sepasang dadu dilempar dilemparkan sekali, berapa banyakkah
titik sampel dalam ruang sampelnya?
Jawab. Dadu pertama dapat mendarat dalam 6 cara.untuk masing-masing keenam
cara itu, dadu kedua dapat mendarat 6 cara pula. Dengan demikian, sepasang dadu
tersebut dapat mendarat dalam 6 (6) =36 cara.
DALIL 2. Kaidah Penggandaan Umum. Bila suatu operasi dapat dilakukan dalam
n
1
cara, bila untuk setiap cara tersebut operasi ke dua dapat dilakukan debgan n
2
cara, bila untuk setiap pasangan dua cara operasi ketiga dapat dilakukan dalam n
3
cara, dan demukian seterusnya, maka k operasi dalam urutan tersebut dapat
dilakukan dalam n
1
n
2
…n
k
cara.
Contoh soal Berapa macam menu makan siang yang terdiri atas sup,
sandwich,desert dan minuman yang dapat dipilih dari 4 macam sup, 3 jenis
sandwich, desert dan 4 minuman?
Jawab. Banyaknya macam menu makan siang adalah : 4x3x5x4 = 240.
DEFINISI Permutasi. Permutasi adalah suatu susunan yang dibentuk oleh
keseluhan atau sebagian dari sekumpulan benda.
Perhatikan tiga huruf a,b dan c. kemungkinan permutasinya abc, acb, bac, bca, cab,
dan cba. Jadi terdapat 6 susunan yang berbeda. Ada tiga posisi yang harus diisi oleh
ke tiga huruf a,b dan c.Jadi, kita mempunyai 3 pilihan untuk posisi pertama, 2 untuk
posisi kedua, dan 1 untuk posisi terakhir. Sehingga semuanya ada 3x2x1 = 6
permutasi.Secara umum dari n benda yang berbeda dapat disusun sebanyak n (n-
1)(n-2)…(3)(2)(1) cara. Perkalian ini kita lambangkan dengan n!. Selain itu
didefinisikan 1! =1 dan 0! = 1.
DALIL 3. Banyaknya permutasi n benda yang berbeda adalah n!.
Banyaknya permutasi empat huruf a,b,c dan d adalah 4! = 24.
DALIL 4. Banyaknya permutasi akibat pengambilan r benda dari n benda yang
Modul statistika dasar
77
berbeda adalah :
n
P
r
=
!
( )
Contoh soal 18. Dua kupon lotere diambil dari 20 kupon untuk menentukan hadiah
pertama dan kedua. Hitunglah banyaknya titik sampel dalam ruang sampelnya.
Jawab. Banyaknya titik sampel adalah :
20
P
2
=
!
( )
= (20)(19) = 380.
Contoh Soal. Dari 24 orang anggota suatu perkumpulan akan dipilih pengurus yang
susunannya terdiri dari ketua, wakil ketua sekretaris dan bendahara. Jika semua anggota
mempunyai hak yang sama untuk menduduki suatu jabatan?
Jawab : maka banyaknya susunan pengurus yang dapat dipilih ada
255024
21 . 22 . 23 . 24
4 24
=
= p
DALIL 5. Banyaknya permutasi n benda yang berbeda yang disusun dalam suatu
lingkaran adalah ( n – 1).
DALIL 6. Banyaknya permutasi yang berbeda dari n benda yang n
1
diantaranya
berjenis pertama, n
2
berjenis kedua, …, n
k
berjenis ke –k adalah :
!
! ! !,… !
Contoh soal Berapa banyak susunan yang berbeda bila kita ingin membuat sebuah
rangkaian lampu hias untuk pohon natal dari 3 llampu merah, 4 kuning dan 2 biru?
Jawab. Banyaknya susunan yang berbeda ada
!
! ! !
= 1260
Contoh soal: Banyaknya cara pengaturan duduk 5 orang pejabat di 5 kursi baris
terdepan ada
120
1 . 2 . 3 . 4 . 5
5 5
=
= P
Modul statistika dasar
78
Contoh Soal: Banyaknya permutasi dari huruf -huruf dalam kata-kata STATISTIKA
ada
75600
1 . 2 . 1 . 2 . 1 . 3 . 2 . 1 . 2 . 1
10 . 9 . 8 . 7 . 6 . 5 . 4 . 3 . 2 . 1
! 1 ! 2 ! 2 ! 3 ! 2
! 10
1 . 2 . 2 . 3 . 2 10 , , ,
,
=
=
=
= P P
k I T s
n n nA n n n
s
Soal ini dapat juga diselesaikan dengan cara berikut :
Jika semua huruf berbeda, maka banyaknya permutasi huruf-
huruf " S
1
T
1
A
1
T
2
I
1
S
2
T
3
I
2
KA
2
" ada 9
9 9
= P ! . Dilain pihak permutasi huruf-huruf
S
1
T
1
A
1
T
2
I
1
S
2
T
3
I
2
KA
2
dapat difikirkan sebagai proses gabungan dari proses-proses
permutasihuruf-huruf "STATISTIKA", " S
1
S
2
" T
1
T
2
T
3
", " A
1
A
2
" I
1
I
2
"dan dan huruf "K".
Dengan demikian menggunakan aturan multiplikatif membilang diperoleh
75600
! 1 !. 2 !. 2 !. 2 !. 3 !. 2 .
1 , 2 , 2 , 3 , 2 9
1 , 2 , 2 , 3 , 2 10 9 9
=
=
P
sehingga
P P
Dalam banyak masalah kita ingin mengetahui banyaknya cara mengambil r benda
dari n benda tanpa memperhatikan urutannya. Pengambilan demikian ini disebut
kombinasi.
DALIL 7. Banyaknya kombinasi r benda dari n benda yang berbeda adalah :
=
!
!( )!
atau
n
C
r
=
!
!( )!
Contoh soal Dari 4 orang anggota partai Republik dam 3 oramg anggota partai
democrat, hitunglah banyaknya komisi yang terdiri atas 3 orang dengan 2 orang dari
Partai Republic dan 1 orang dari partai Demokrat yang dapat dibentuk.
Jawab. Banyaknya cara memilih 2 orang dari 4 orang partai Republik ada :
=
!
! !
= 6
Banyaknya cara memilih 1 dari 3 orang partai Demokrat ada:
Modul statistika dasar
79
=
!
! !
= 3
Jadi dengan dalil 1. Kita temukan banyaknya komisi yang dapat dibentuk dengan
2 orang partai Republik dan 1 orang Partai Demokrat adalah (6)(3) = 18.
Contoh
3. Dari 12 orang pemain bola basket,
a. Banyaknya tim yang dapat disusun ada
792
5 . 4 . 3 . 2 . 1
12 . 11 . 10 . 9 . 8
5!7!
12!
5
12
=
=
=
|
|
¹
|

\
|
b. Jika akan disusun dua tim, maka banyaknya tim yang dapat disusun ada
16632
2 . 1 . 5 . 4 . 3 . 2 . 1 . 5 . 4 . 3 . 2 . 1
12 . 11 . 10 . 9 . 8 . 7 . 6 . 5 . 4 . 3 . 2 . 1
5!.5!.2!
12!
5,5,2
12
=
=
=
|
|
¹
|

\
|
Banyaknya sampel random berukuran n yang dapat diambil dari suatu populasi
berukuran N ada
n)! (N n!
N!
n
N
÷
=
|
|
¹
|

\
|
Perlu dicatat disini bahwa pada umumnya ukuran populasi N tidak diketahui. Ini
bukan berarti bahwa ukuran tersebut tidak ada, tetapi ukuran tersebut besar sekali.
Modul statistika dasar
80
Nah ... dengan rumus di atas kalau kita mengambil hanya satu satu sampel random
n, tentunya harus disadari bahwa satu yang diambil tersebut adalah satu diantara
|
|
¹
|

\
|
n
N
. Misalnya untuk n = 5 dan N =100, maka satu sampel random yang diambil
adalah satu diantara
760480
. 5 . 4 . 3 . 2 . 1
100 . 99 . 98 . 97 . 96
5!.95!
100!
5
100
=
=
=
|
|
¹
|

\
|
4. Banyaknya cara pengelompokan 9 orang menjadi 3 kelompok dengan masing-
masing kelompok terdiri dari 4, 3 dan 2 orang ada
1260
. 2 . 1 . 3 . 2 . 1 . 4 . 3 . 2 . 1
9 . 8 . 7 . 6 . 5 . 4 . 3 . 2 . 1
4!.3!.2!
9!
4.3.2
9
=
=
=
|
|
¹
|

\
|
Sampel Dengan Dan Tanpa Pengembalian
Dalam mengambil sampel random dari suatu populasi perlu dibedakan bermacam-
macam sampel menurut cara pengambilannya. karena cara tersebut akan menentukan
banyaknya , sampel yang mungkin diambil. Menurut cara pengambilannya dapat
dibedakan beberapa macam sampel random sebagai berikut :
Sampel yang diambil sekaligus
yaitu yang semua elemen-elemennya diambil bersama-sama.
Sampel dengan pengembalian, yaitu sampel yang elemen-elemennya diambil
satu persatu dengan pengembalian, artinya elemen kedua dan seterusnya
diambil setelah elemen sebelumnya dikembalikan, dengan demikian hasil
yang sama dalam setiap pengambilan dimungkinkan
Sampel tanpa pengembalian, yaitu yang elemen-elemennya diambil satu
persatu tanpa pengembalian. Artinya, artinya elemen kedua dan seterusnya
diambil tanpa pengembalian elemen sebelumnya. Dengan demikian hasil
yang sama dalam setiap pengambilan tidak mungkin.
Jika ukuran sampel adalah n dan ukuran populasi adalah N, maka banyaknya
sampel yang mungkin untuk :
- Sampel yang diambil sekaligus
|
|
¹
|

\
|
n
N
- Sampel dengan pengembalian ada N
n
Modul statistika dasar
81
- Sampel tanpa pengembalian
N
P
n
Contoh
Jika dari 10 bola lampu dicoba 2 bola lampu secara random, maka banyaknya
pasangan bola lampu yang dapat di coba
a. Untuk sampel yang coba sekaligus ada
pasang 45
2 . 1
10 . 9
2!.8!
10!
2
10
=
=
=
|
|
¹
|

\
|
b. Untuk sampel yang dicoba dengan pengembalian ada
10
2
= 10.10.
= 100
c. Untuk sampel yang dicoba tanpa pengembalian
pasang 90
. 9 . 10
! 8
! 10
2 10
=
=
= P
Jika dalam contoh di atas yang dicoba adalah 3 bola lampu secara random, maka
banyaknya sampel bola lampu yang dapat dicoba
a. Untuk sampel yang coba sekaligus ada
120
. 3 . 2 . 1
10 . 9 . 8
3!.7!
10!
3
10
=
=
=
|
|
¹
|

\
|
b. Untuk sampel yang dicoba dengan pengembalian ada
10
3
= 10.10.10
= 1000
c. Untuk sampel yang dicoba tanpa pengembalian
720
8 . 9 . 10
! 7
! 10
3 10
=
=
= P
Modul statistika dasar
82
SOAL LATIHAN
1. Seorang mahasiswa tingkat persiapan harus mengambil masing-masimg
satu mata kuliah sains, humaniora, dan matematika.Bila ia tersedia 6 mata
kuliah sains, 4 mk. Humsniora, dan 4 mk. Matematika.Berapa banyak
cara ia menyusun rencana studinya?
2. Ada berapa macam cara menjawab 9 pertanyaan benar-salah?
3. Berapa banyak permutasi yang berbeda yang dapat disusun dari kata “
STATISTIKA”?
4. Empat pasang suami-istri membeli 8 karcis yang sebaris untuk suatu
pertunjukan konser music, berapa banyak susunan duduk mereka
a) Bila tidak ada pembatasan apa-apa?
b) Biala setiap pasang suami-istri harus duduk berdampingan?
c) Bila kelompok suami duduk disebelah kanan kelompok istri?
BAB VII
PENGANTAR PELUANG
7.1 PENDAHULUAN
Telah diketahui bahwa Statistika adalah ilmu atau cabang ilmu pengetahuan
tentang teori dan penggunaan metode-metode untuk mengumpulkan data
(statistik), menganalisis data tersebut dan menggunakannya untuk melakukan
inferensi statistik.
Dengan memperhatikan bahwa data statistik adalah kumpulan hasil pengukuran atau
perhitungan atau pengamatan terhadap obyek-obyek yang menjadi perhatian, dan
inferensi statistik adalah proses pengambilan kesimpulan terhada populasi (=
Modul statistika dasar
83
keseluruhan/semua obyek yang menjadi perhatian) maka menggunakan statistika
adalah menyimpulkan populasi berdasarkan informasi yang diperoleh dari sampel (=
sebagian obyek) representatif yang diambil dari populasi tersebut Dalam hal ini baik
populasi maupun sampel dapat merupakan kumpulan obyeknya atau data statistik,
sedangkan dalam statistik; yang dimaksud dengan data statistik adalah sampel.
Karena sampel hanya memberikan sebagian informasi tentang populasinya, maka
kesimpulan yang akan dicapai tidak akan benar mutlak. Dengan demikian agar
supaya pengambilan kesimpulan dapat lebih dipertanggung jawabkan, diperlukan
suatu alat. Alat tersebut adalah apa yang dikenal sebagai peluang. Sebelum sampai
pada pembicaraan tentang apa yang dimaksud dengan peluang (= kemungkinan =
probabilitas), terlebih dahulu akan disajikan beberapa pengertian yang menunjang
pembicaraan tersebut, yaitu : eksperimen, hasil (outcome), ruang sampel dan
kejadian (= event). Selanjutnya akan dibahas pula mengenai ekspektasi.
Dalam melakukan perhitungan-perhitungan peluang, menghitung banyaknya hasil
yang mungkin terjadi jika suatu eksperimen dilakukan akan sangat diperlukan,
khususnya, apabila eksperimen tersebut menghasilkan hasil yang cukup banyak atau
merupakan suatu proses gabungan dari beberapa proses dengan masing-masing
proses dapat dilakukan menurut lebih dari satu cara. Berikut ini akan dibicarakan
suatu teknik membilang yang umum, kemudian dilanjutkan dengan beberapa teknik
membilang khusus seperti untuk permutasi, kombinasi,dan membilang hasil yang
mungkin dari sampel dengan dan tanpa pengembalian.
KOMPETENSI KHUSUS, Diharapkan pada akhir perkuliahan nanti mahasiswa/i
dapat mengetahui dan memahami konsep dasar tentang peluang, dan dapat
menggunakannya dalam pemecahan masalah
7.2PENYAJIAN
KONSEP-KONSEP DASAR PELUANG
Eksperimen, hasil, ruang sampel dan kejadian
Modul statistika dasar
84
7.1.1 Eksperimen adalah proses yang menghasilkan hasil Pengukuran, perhitungan
atau pengamatan.
Contoh
Melempar sebuah mata uang satu kali.
1. Melempar sebuah dadu satu kali.
2. Mengambil dua kelereng dari sebuah kotak berisi 4 kelereng putih, 3
kelereng merah dan 3 kelereng hijau berturutan
tanpa pengembalian atau dengan pengembalian.
3. Mengamati indeks prestasi sekelompok mahasiswa di akhir suatu tahun
ajaran tertentu.
4. Mengambil sampel random berukuran n dari suatu populasi tertentu. Dan
lain-lain.
8 Hasil suatu eksperimen adalah hasil yang mungkin terjadi, jika eksperimen
tersebut dilakukan.
Contoh
Berikut ini akan disajikan berbagai hasil untuk beberapa eksperimen dalam
contoh 2.1.1.
1. Jika eksperimen adalah melempar sebuah mata uang 1 kali suatu hasil adalah
M (dapat muka), sedang hasil yang lain adalah B (dapat belakang).
2. Jika eksperimen adalah melempar sebuah mata uang 2 kali maka setiap hasil
adalah hasil dari lemparan pertama dan lemparan kedua. Dengan demikian
hasil eksperimen ini adalah MMatau MB atau BMatau BB
3. Jika eksperimen adalah mengukur tinggi seseorang, maka hasil eksperimen ini
adalah salah satu ukuran antara 164, dan 165,5, misalnya 165. Ukuran
tersebut adalah suatu hasil.
4. Jika eksperimen adalah mengamati indeks prestasi sekelompok mahasiswa
diakhir suatu tahun ajaran tertentu, maka suatu hasil adalah pasangan indeks
prestasi kelompok tersebut dengan indeks prestasi masing-masing mahasiswa
dalam kelompok tersebut, tertentu.
Modul statistika dasar
85
9 Ruang Sampel suatu eksperimen adalah himpunan semua hasil eksperimen
tersebut.
- Menurut banyaknya hasil dalam ruang sampel, dibedakan dua macam ruang
sampel, yaitu : ruang sampel diskrit dan ruang sampel kontinu.
- Hal lain yang perlu dicatat adalah bahwa penentuan ruang sampel suatu
eksperimen, ditulis S, dapat bergantung pada hasil yang diharapkan dari
eksperimennya. Misalnya. Dalam eksperimen melempar sebuah dadu satu
kali, jika perhatian kita adalah pada mata dadu yang tampak, maka ruang
sampelnya adalah S
1
= {1, 2, 3, 4, 5, 6}, sedangkan jika perhatian kita adalah
pada mata dadu tampak genap atau ganjil, maka ruang sampelnya adalah
S
2
= {genap, ganjil}. Dari contoh ini jelas bahwa
informasi yang diperoleh dari S
1
. lebih jelas dari pada S
2
,
sebab terjadinya suatu hasil dalam S
1
pasti dapatmenunjukkan terjadinya hasil
dalam S
2
tetapi tidak sebaliknya. Dengan demikian timbul masalah
sebaiknya ruang sampel mana yang dipilih. Biasanya ruang sampel yang
dipilih adalah yang setiap hasilnya tidak mungkin "dipecah" lagi.
Contoh
Untuk eksperimen melempar sebuah mata uang 1 kali, ruang sampelnya adalah S
= {M, B}.
1. Untuk eksperimen melempar sebuah mata uang 2 kali,
S = {MB, BM, BB, MM}
2. Untuk eksperimen melempar sebuah dadu 2 kali,
S = { 11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25, 26, 31, 32, 33, 34, 35, 36,
41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, 61, 62, 63, 64, 65, 66 }
atau
S ={(x,y)| x = 1, 2,…, 6; y = 1,2, ...,6}
3. Untuk eksperimen melempar sebuah mata uang berhenti kalau dapat M,
S = {M, BM, BBM. ...}.
Modul statistika dasar
86
4. Untuk eksperimen mengukur tinggi seseorang yang tingginya antara 164,5
dan 165,5,
S= {x | 164.5 < x < 165,5 } .
5. Untuk eksperimen mengamati indeks prestasi 5 mahasiswa disuatu tahun
ajaran tertentu,
S = {(x1 ,x2 ,x3 ,x4,x5 ) |xi= prestasi mahasiswa ke-i i = 1,2,3, ... }
6. Untuk eksperimen mengambil sampel random berukuran n dari suatu
populasi,
S = {(x1 ,x2 ,x3 ,x4,x5 ) |xi= anggota populasi ke-i
i = 1,2,3, ... }
Dari contoh-contoh di atas, ruang sampel dalam contoh 2.1.3 nomor 5 adalah
ruang sampel kontinu, sedangkan yang lain adalah ruang sampel diskrit.
10 Kejadian adalah suatu himpunan hasil atau suatu himpunan bagian dari
ruang sampel.
- Dari definisi di atas jelaslah bahwa baik ruang sampel maupun kejadian
kosong juga merupakan kejadian. Kedua kejadian tersebut dikenal sebagai
kejadian-kejadian yang tidak sejati.
- Menurut banyaknya hasil dalam suatu kejadian, dapat dibedakan dua
macam kejadian, yaitu : kejadian sederhana jika hasilnya hanya satu, dan
kejadian majemuk jika hasilnya lebih dari satu. Baik kejadian sederhana
maupun kejadian majemuk, keduanya merupakan kejadian-kejadian sejati.
- Suatu kejadian dikatakan terjadi, jika eksperimen yang dilakukan
menghasilkan hasil dalam kejadian tersebut.
Contoh
1. Jika eksperimen adalah melempar sebuah mata uang 2 kali dengan
A = kejadian mendapat M pada lemparan pertama,
B = kejadian mendapat hasil kedua lemparan sama,
C = kejadian mendapat B pada lemparan kedua.
Modul statistika dasar
87
maka
A = {MB, MM}„ B = {BB, MM} dam C = {MB, BB}.
2. Jika eksperimen adalah meletnpar sebuah dadu 1 kali dengan
A = kejadian Mendapat mata genap,
B = kejadian mendapat mata ganjil,
C = kejadian mendapat mata yang habis dlbagi 3,
D = kejadian mendapat mata yang ≤ 6,
E = kejadian mendapat mata yang > 6,
maka
A = {2,4,6}, B ={1,3,5}, C = {3,6},
D = {1,2,3,4,5,6} dan E ={...}.
Dari eksperimen dalam contoh 2.1.4. nomor 2 terlihat bahwa D adalah suatu
kejadian yang pasti terjadi, sedangkan E adalah suatu kejadian yang tidak
mungkin terjadi, jika eksperimen tersebut dilakukan. Kejadian-kejadian A, B
dan C adalah contoh kejadian majemuk.
A. Hubungan Antar Kejadian
Jika satu eksperimen dilakukan, hal yang biasanya menjadi perhatian adalah
kejadian-kejadian sejati. Dengan mengingat bahwa ruang sampel, kejadian dan
hasil adalah kejadian khusus dari semester perbicaraan, himpunan dan
elemen, maka operasi-operasi maupun hukum-hukum atau teorema-
teorema antar himpunan akan berlaku pula untuk kejadian. Operasi-operasi
tersebut antara lain adalah gabungan
(= union) beberapa kejadian, interseksi beberapa kejadian dan komplemen suatu
kejadian.
Modul statistika dasar
88
Gabungan 2 kejadian A dan B, ditulis AՍB, adalah suatu kejadian yang hasil-
hasilnya adalah hasil dalam A atau hasil dalam B.
- Jika A dan B tertentu, cara yang mudah untuk menentukan AՍB adalah
menggabungkan A dan B (dengan hasil dalam A dan B yang sama hanya
ditulis satu kali saja).
- ABC= (A B) C = A U (B C).
Contoh 2.2.1.
1. Jika eksperimen adalah melempar sebuah mata uang 3 kali
dengan
A = Hasil ketiga lemparan sama,
B = Hasil lemparanIpertama dan ketiga tidak sama,
C = M pada lemparan pertama, maka
A = {MMM, BBB}, B = {MMB, MBB. BMM, BBM} dan
C = {MMM, MMB, MBM, MBB}, sehingga
AB = {MMM, MMB, MBB, BMM, BBM, BBB},
AC = {MMM, MMB, MBM, MBB, BBB},
BC = {MMM, MMB, MBM, MBB, BMM, BBM}.
2. Jika S = (x,y)|0 ≤ x,y ≤ 1} dengan
A
1
= {(x,y)|0 ≤ x ≤
2
1
, 0≤y≤l}= {<x,y);|0 ≤ x <
2
1
)},
A
2
= (x,y)|0 ≤ y ≤
2
1
},
A
3
= {(x,y)|0 ≤ x ≤ y ≤1)},
A
4
= {(x,y)|0 ≤ x,y ≤
2
1
},
Maka
Modul statistika dasar
89
A
1
A
2
= { ((x,y)|0 ≤ x ≤
2
1
} atau {(x,y)|0 ≤ y ≤
2
1
},
A
1
A
3
= { ((x,y)|0 ≤ x ≤
2
1
} {(x,y)|0 ≤ x ≤ y ≤1)}
A
2
A
3
= A
3
ՍA
4
Interseksi 2 kejadian A dan B, dltulis A·B, adalah suatu kejadian yang hasil-
hasilnya adalah hasil dalam A yang sekaligus adalah hasil dalam B atau hasil
dalam B yang sekaligus adalah hasil dalam A.
- Dengan perkataan lain A·B adalah kejadian yang hasil-hasilnya adalah
hasil dari A dan B .
- Jika A dan B tertentu, cara yang mudah untuk menentukan A·B adalah cari
semua hasil yang sama dari A dan B .
- Jika A·B = , A dan B dikatakan saling asing atau merupakan dua kejadian
yang tidak mungkin terjadi bersama-sama.
- Jika AՍB = S dan A
·
B =

, maka A dan B adalah suatu partisi dari S.
- A
·
B
·
C = (A·B) ·C = A·<(B·C)
Contoh
Dalam contoh sebelumnya:
a. A·B = {MMM, BBB} ·{MMB, MBB, BMM, BBM}=  , artinya A
dan B tidak mungkin terjadi bersama-sama. Sebenarnya jawaban tersebut
juga dapat diperoleh tanpa menentukan terlebih dahulu hasil-hasil A dan
hasil-hasil B. Caranya adalah sebagai berikut :
Karena A = hasil ketiga lemparan sama dan
B = hasil lemparan pertama dan ketiga tidak sama, maka A
·
B = hasil
ketiga lemparan sama dan lemparan pertama dan ketiga tidak sama. Jelas
Modul statistika dasar
90
hal ini tidak mungkin terjadi, karena lemparan pertama dan ketiga sama
dan lemparan pertama dan ketiga tidak sama tidak akan pernah terjadi
bersama.
b. A·C ={MMM,BBB} ·{MMM,MMB,MBM,MBB}
= {MMM} atau r !
A·C = Hasil ketiga lempar'an sama dan hasil lemparan pertama M =
{MMM).
c. B·C ={MMB,MBB,BMM,BBM} ·{MMM,MMB,MBM, MBB}
= {MMB, MBB}.
2. Dalam contoh 2.2.1 nomor 2,
A·B = {2,4,6} ·{1,3,5} =  ,
A·C = {2, 4, 6}·{3,6} = {6},
B·C = {1, 3, 5}·{3,6} = {3}.
3. Dalam contoh 2.2.1 nomor 3,
a. A·B = jumlah hasil lemparan pertama dan kedua adalah genap dan
hasil lemparan pertama ganjil = {11, 13, 15, 31, 33, 35, 51, 53, 55}.
b. A·C = jumlah hasil lemparan pertama dan kedua adalah genap dan
hasil kedua lemparan sama = {11, 22, 33, 44, 55, 66} = C.
c. B·C = hasil lemparan pertama ganjil dan hasil kedua lemparan sama =
{11, 33, 55}
4. Dalam contoh 2.2.1 nomor 4 ,
a. A
1
·A
2
= {(x
1
.y)|0≤ x ≤
2
1
}· {(x,y}|0 ≤ y ≤
2
1
}
= {(x,y)|0 ≤ x,y ≤
2
1
} =A
4
b. A
1
·A
3
= {(x
1
.y)|0≤ x ≤
2
1
}·{(x,y)|0≤ x ≤y≤1}
= {(x,y)|0≤x,y ≤
2
1
,0≤ x ≤y ≤1}
Modul statistika dasar
91
c. A
2
·A
3
= {(x
1
,y)|0≤ x ≤
2
1
}·{(x,y)|0≤ x ≤y ≤1 }
= {(x,y)|0≤x,y ≤
2
1
,0≤ x ≤y ≤1}
Komplemen suatu kedadian A, ditulis A
c
, adalah suatu kejadian dalam S yang
hasil-hasilnya adalah bukan hasil dari A.
- Jelas bahwa A dan A
c
tidak mungkin terjadi bersama-sama dan keduanya
adalah suatu partisi dari S.
- (A
c
)
c
= A, S
c
= dan 
C
= S
Contoh 2.2.3. .
1. Dalam contoh 2.1.4 nomor 1,
5. A
c
dapat ditentukan dengan dua cara.
Cara pertama :
Karena S = {MM, MB, BM, BB} dan A = {MM, MB), maka A
c
= {BM, BB}.
Cara kedua :
Karena A = Dapat M pada lemparan pertama,
maka A
c
= tidak dapat M pada lemparan pertama
= Dapat bukan M pada lemparan pertama
= {BM, BB}.
6. Bc = Dapat hasil kedua lemparan tidak sama
= {MB, BM}.
2. Dalam contoh 2.2.1 nomor 1,
a. Karena S ={MMM,MMB,MBM,MBB,BMM,BMB,BBM,BBB},
dan A = {MMM, BBB}, maka
A
c
= {MMB, MBM, MBB, BMM, BMB, BBM}.
B
c
= Hasil lemparan pertama dan ketiga tidak sama
Modul statistika dasar
92
= hasil lemparan pertama dan ketiga sama = {MMM,
MBM, BMB, BBM}.
b. C
c
= Bukan M pada lemparan pertama ;
= {BMM, BMB, BBM, BBB}
3. Dalam contoh 2.1.3;nomor 3,
a. A
c
= Jumlah hasil lemparan pertama dan kedua bukan/tidak
genap
= Jumlah hasil lemparan pertama dan kedua ganjil
= {12, 14, 16, 21, 23, 25, 32, 34, 36, 41, 43, 45, 52, 54, 56,
61, 63, 65} .
b. B
c
= Hasil lemparan pertama bukan/tidak ganjil
= Hasil lemparan pertama genap
= (21,...... 26, 41......, 46, 61, . . .,86} .
c. C
c
lebih mudah ditentukan dari hasilnya
S = {11,...,16,21,...26,31,...,36, 41,..,46,51...58,61,....66}
yang bukan hasilnya A = {11, 22, 33, 44, 55, 66},
Karena C
c
= hasil kedua lemparan tidak sama, akan sukar untuk dicari
tanpa memperhatikan S.
ALJABAR KEJADIAN
Berikut ini akan disajikan hukum-hukum atau sifat-sifat yang berlaku
untuk bentuk-bentuk hubungan antar kejadian yang telah didefinisikan atau
kombinaslnya. Hukum-hukum atau sifat-sifat ini akan berguna dalam melakukan
perhitungan-perhitungan antar kejadian,
hukum komutatif :
A B = B A,
A ·B = B · A.
Modul statistika dasar
93
hukum asosiatif :
A (BC) = (AB) C,
A ·(B ·C) = (A ·B) · C.
hukum distributif :
A ·(B · C) = (AB) ·(AC),
A (B · C)= (A·B) (A·C).
hukum De Morgan :
(AB)
c
= A
c
·B
c
,
(A·B)
c
= A
c
B
c
.
AS = S,.A·S = A, A  = A, A·  = 
A A
c
= S, A ·A
c
= , A A = A, A ·A = A.
A·S = A·(BB
C
) = (A·B) (A· B
c
) dengan
(A · B) dan (A · B
C
) tidak mungkin terjadi bersama-sama.
Disamping kejadian-kejadian yang dapat ditentukan dari gabungan, interseksi atau
komplemen, dapat pula ditentukan dari kombinasi antara gabungan, interseksi dam
atau komplemen
DEFENISI PELUANG
Defenisi Peluang
Andaikan kejadian A adalah suatu kejadian yang menjadi perhatian kita dengan
A ≠ S dan A ≠θ, maka peluang terjadinya A, ditulis P(A), dapat didefinisikan
menurut beberapa cara.
Definisi Klasik (peluang a priori)
Jika suatu eksperimen menghasilkan n hasil yang tidak mungkin terjadi bersama-
sama dan masirig-masing mempunyai peluang yang satna terjadi, maka
P(A) =
n
A n ) (
dengan n(A) = banyaknya hasil dalam A.
Modul statistika dasar
94
Jika suatu eksperimen dilakukan. (tanpa suatu keterangan tertentu), maka
dianggap bahwa setiap hasil yang mungkin mempunyai peluang yang sama
untuk terjadi.
Untuk menghitung peluang terjadinya suatu kejadian, misalnya P(A), yang
diperlukan hanya n(A) dan n. Dengan demikian, kecuali S dan A juga
ditanyakan, sebenarnya tidak perlu dicari. Dilain pihak, untuk eksperimen
dengan hasil (yang mungkin) cukup banyak, sebelum S disajikan biasanya
lebih baik/mudah jika dihitung dulu banyaknya hasil yang mungkin. Ini dapat
dilakukan dengan teknik-teknik membilang yang sudah dibicarakan dalam
butir 2.3 .
Karena 0≤ n(A) ≤ n, maka 0 ≤ P(A) ≤ 1 .
Walaupun definisi tersebut di atas mudah digunakan danmudah dimengerti.
perlu diperhatikan bahwa persyaratan mempunyai peluang yang sama dalam
praktek mungkin sekali tidak masuk akal. Disamping keterbatasan
penggunaannya untuk eksperimen dangan ruang sampel barhingga.
Contoh 3.1.1.
1. Sebuah dadu yang "baik" dilempar satu kali.
A = dapat mata genap,
B = dapat mata habis dibagi 3,
C = dapat mata kurang dari 4.
Hitunglah P(A), P(B), P(C), P(A B), P(B·C) dan P(C
C
).
Jawab :
Dadu yang "baik" (dalam keadaan baik) menjamin bahwa setiap hasil yang
mungkin terjadi mempunyai peluang yang sama untuk terjadi. Artinya dadu
dalam keadaan seimbang.
Karena S = (1,2,3,4,5,6}.
A = {2, 4, 6},
B = {3, 6}, C {1, 2, 3}, m
Modul statistika dasar
95
maka A B = {2, 4, 6} {3, 6}= {2, 3, 4, 6},
B·C = {3,6}·{1, 2, 3} = {3},
C
c
= {4, 5, 6}.
Dengan demikian n = n(S) = 6,
n(C
c
) = 3,
n(B) = 2,
n(C) = 3,
n(A B) = 4,
n(B ·C) = 1,
n(C
c
) = 3, sehingga
2
1
6
3
n
) n(C
) p(C
dan
6
1
n
B) n(A
B) p(A
3
2
6
4
n
B) n(A
B) p(A
2
1
6
3
n
n(C)
p(C)
3
1
6
2
n
n(B)
p(B)
2
1
6
3
n
n(A)
p(A)
c
c
= = =
=
·
= ·
= =

=
= = =
= = =
= = =
2. Sebuah mata uang yang "baik" dilempar tiga kali,
A = dapat M pada lemparan pertama,
B = dapat hasil ketiga lemparan sama dan
C = dapat hasil lemparan pertama dan ketiga tidak sama.
Hitunglah P(A), P(B), P(C), P(A B), P(B·C)
Jawab :
Karena
Modul statistika dasar
96
S = {MMM, MMB, MBM, MBB, BMM, BMB. BBM. BBB}.
A = {MMM, MMB, MBM,MBB},
B = {MMM, BBB} dan
C = {MMB, MBB, BMM, BBM}, maka
AB = {MMM, MMB, MBM, MBB} {MMM, BBB}
= {MMM, MMB, MBM, MBB, BBB},
B·C = {MMM, BBB} ·{MMB, MBB, BMM, BBM} =  .
Dengan demikian n = 6, n(A) = 4, n(B) = 2,
n(AB) = 5 dan n(B·C)=0, sehingga
0
n
B) n(A
B) p(A
6
5
n
B) n(A
B) p(A
3
1
6
2
n
n(B)
p(B)
3
2
6
4
n
n(A)
p(A)
=
·
= ·
=

=
= = =
= = =
Definisi Empiris (peluang a posteriori)
Peluang terjadinya kejadian A dari suatu eksperimen adalah frekuensi
relatif terjadinya A, jika eksperimen tersebut dilakukan/diulang sebanyak kali
mungkin. Artinya :
, )
n
A n
A P
n · ÷
= lim ) (
dengan n(A) = banyaknya hasil dari A dalam n ulangan.
Modul statistika dasar
97
Difenisi ini sebenarnya lebih masuk akal, sebab tidak diperlukan persyaratan
"berat" seperti pada definisi klasik. Tetapi suatu keberatannya adalah
eksperimen harus/dapat dilakukan sebanyak kali mungkin.
Definisi ini biasanya digunakan sebagai interpretasi dari definisi klasik
dan sebaliknya
Contoh 3.1.2.
1. Jika peluang penerbangan Yogyakarta-Bandung tepat waktu adalah
0,84 , artinya : dari pengamatan yang cukup lama terhadap
penerbangan Yogyakarta-Bandung, 84% menunjukkan penerbangan,
tepat waktu.
2. Jika ramalan cuaca mengatakan peluang besok hujan adalah 30%,
artimya : jika keadaan cuaca dari hari ke- hari tidak berubah, 30% hari
diantaranya hujan.
3. Untuk mengatakan bahwa peluang seorang ibu melahirkan bayi laki-
laki adalah 75% atau 10%, tidak mungkin diparoleh dari mengamati
satu kelahiran saja. Tetapi harus diperoleh dari mengamati kelahiran
Ibu-Ibu yang "cukup banyak" dan dalam keadaan kondisi yang sama.
Definisi Subyektif
Peluang subyektif terjadinya suatu kejadian adalah peluang yang ditentukan
berdasarkan pertimbangan-pertimbangan subyektif.
Biasanya dilakukan apabila definisi-definisi obyektif tidak dapat digunakan,
misalnya dalam keadaan dimana eksperimen belum/tidak pernah dilakukan.
Sangat subyektif kepada pertimbangan seseorang.
Biasanya menunjukkan keyakinan terhadap terjadinya atau tidak terjadinya
kejadian yang menjadi perhatian.
Contoh 3.1.3.
1. Berapakah peluang isteri saya mencintai saya ?
2. Berapakah Peluang perang dunia ketiga akan meletus tahun depan ?
Definisi Aksiomatis
Modul statistika dasar
98
Andaikan S adalah ruang sampel suatu eksperimen ,A adalah klas/himpunan
semua kejadian dan P adalah fungsi berharga nyata yang didefinisikan pada A
dengan kodomain interval [0,1], maka P adalah fungai peluang dan P(A)
adalah peluang terjadinya kejadian A , jika dipenuhi :
(A,1) P(A) = 0 , untuk setiap Ae A
(A,2) P(s) = 1
(A,3) Jika A
1
, A
2
, . . . adalah barisan kejadian saling asing dengan A
1
eA
(yang artinya untuk A
i
·A
j
= untuk i≠j,i, j = 1, 2,... ) dan A
i
A
j
= e
·
=
i
i
A
1
A
maka
) (
1
1
¿
·
=
·
=
=

]

¸

i
i i
i
A P A P
A adalah suatu aljabar (= aljabar Boole), yaitu keluarga/himpunan semua
kejadian dalam ruang sampel S yang mempunyai sifat-sifat :
(i) S e A ,
(ii) Jika A eA, maka A
c
eA
(iii) Jika A
1
dan A
2
eA, maka A
1
A
2
eA
Atau A hádala statu aljabar sigma, jika sifat (iii) dalam aljabar diganti
dengan
(iii) jika Jika A
1
,A
2, …..
eA, maka e
·
=
i
i
A
1
A
Perlu dicatat bahwa suatu aljabar-sigma adalah aljabar, tetapi tidak
sebaliknya,
P( ) = 0.
Bukti:
Ambil A =  , A
2
=  ; maka menggunakan (iii)
P( ) =
¿ ¿
·
=
·
=
·
=
= =

]

¸

1 1
1
) ( ) (
i i
i i
i
P A P A P 
Modul statistika dasar
99
yang hanya akan dipenuhi, jika Pembelajaran( ) = 0
Jika jika Jika A
1
,A
2, …..
,A
n
adalah kejadian-kejadian yang tidak
mungkin terjadi bersama-sama (= saling asing) dalam A,
Maka
) (
1
1
¿
·
=
·
=
=

]

¸

i
i i
i
A P A P
Jika S adalah suatu ruang sampel diskrit, dengan sifat (A.3) maka peluang
terjadinya suatu kejadian adalah jumlah peluang setiap hasil dalam kejadian
tersebut, ditulis
¿
=
= e =
n(A)
1 i
i i
n(A). 3,..., 2, 1, i dan A h ), P(h P(A)
=
4
1
+
4
1
+
4
1
=
4
3
RUANG SAMPEL
Dalam statistic kita menggunakan istilah percobaan bagi sembarang proses yang
membangkitkan data. Misalnya suatu percobaan pelemparan sekeping mata uang.
DEFINISI Ruang Sampel. Ruang sampel adalah himpunan semua kemungkinan
hasil suatu percobaan, dan dilambangkan dengan huruf S.
Setiap kemungkinan hasil dalam suatu ruang sampel disebut unsure atau anggota
ruang sampel atau biasa juga disebut titik sampel. Seandainya banyaknya unsure
ruang sampel itu terhingga, kita mungkin dapat mendaftarkan unsure-unsur tersebut
dengan menggunakan koma untuk memisahkan setiap unsure, dan menutupnya
dengan dengan dua kurung kurawal.Jadi ruang sampel S bagi percobaan pelemparan
dekeping uang logam, dapat kita tuliskan sebagai : S = { G, A}, dengan G dan A
masing-masing menyatakan “sisi gambar” dan “sisi angka”.
Contoh soal 11. Sebuah percobaan pelemparan sebuah dadu berisi enam. Tentukan
ruang sampelnya.
Modul statistika dasar
100
Jawab: S = {1,2,3,4,5,6}.
Contoh soal 12. Misalkan tiga produk diambil secara random dari suatu proses
produksi dipabrik.kemudian setiap produk tersebut diperiksa apakah cacat ( C ) atau
tidak cacat ( T ). Tentukan ruang sampelnya.
Jawab. Untuk mendaftarkan semua anggota ruang sampel yang mengandung imformasi
maksimum, kita buat diagram pohon sbb.
Jadi Ruang sampelnya adalah: S = { CCC,CCT,CTC,CTT,TCC,TCT,TTC,TTT }
Ruang sampel yang besar atau tak hingga paling baik diterangkan melalui suatu
pernyataan atau yang dikenal sebagai notasi pembangun himpunan. Misalnya, bila
kemungkinan hasil percobaan berupa himpunan kota-kota di dunia yang dihuni oleh
lebih dari 1 juta penduduk, maka ruang sampelnya dapat ditulis sbb.
S = { x|x adalah kota berpenduduk lebih dari 1 juta jiwa }
KEJADIAN
DEFINISI Kejadian. Kejadian adalah suatu himpunan bagian dari ruang sampel.
Untuk suatu kejadian, kita membentuk sebuah kumpulan titik sampel yang
merupakan himpunan bagian ruang sampel. Himpunan bagian ini mencakup semua
anggota ruang sampel yang menyusun kejadian itu.
Contoh soal 12. Bila diketahui ruang sampel S = { t|t ≥ 0 }, sedangkan t adalah umur
(tahun) komponen elektronik tertentu. Maka kejadian A adalah komponen tersebut rusak
Modul statistika dasar
101
sebelum akhir tahun ke limadapat dinyatakan debagai himpunan A = { t|0 ≤ t < 5 },
himpunan A adalah himpunan bagian ruang sampel S.
DEFINISI Kejadian sederhana dan kejadian majemuk.Bila suatu kejadian dapat
dinyatakan sebagai sebuah himpunan yang terdiri dari suatu titik sampel, maka
kejadian itu disebut kejadian sederhana. Sedangkan kejadian majemuk adalah
kejadian yang dapat dinyatakan sebagai gabungan beberapa kejadian sederhana.
Contoh soal 13. Kejadian terambilnya kartu hati dari seperangkat (52 helai) kartu Bridge
dapat dinyatakan sebagai A = { hati} yang merupakan himpunan bagian dari ruang
sampel S = {hati, sekop, klaver, wajik}. Jadi A adalah kejadian sederhana. Kejadian B
yaitu terambilnya kartu merah merupakan kejadian majemuk, karena B= {hati ∪ wajik}
= { hati, wajik}.
DEFINISI Ruang Nol. Ruang nolatau ruang kosong atau himpnan kosong adalah
himpunan bagian ruang sampel yang tidak mengandung satupun anggota.Kejadian ini
kits beri lambang khusus ∅.
Seandainya A adalah kejadian terlihatnya organisme mokroskopik dengan mata
telanjang dalam suatu percobaan biologis, maka A = ∅. Juga, jika B = { x|x adalah
factor bukan prima dari 7 selain 1 }, maka B pasti himpunan kosong, karena factor bagi 7
adalah 1 dan 7 sedangkan 7 bilangan prima.
Hubungan antara kejadian dan ruang sampel dapat digambarkan dengan diagram
Venn, sebagai berikut :
Modul statistika dasar
102
Dalam diagram Venn, ruang sampel digambarkan sebagai empat persegi panjang,
sedangkan kejadian digambarkan sebagai lingkaran-lingkaran di dalam persegi panjang
tersebut.misalnya dalam gambar di atas, kejadian-kejadian A, B dan C semuanya
merupakan himpunan bagian ruang sampel S.
Pengolahan Terhadap Kejadian
Sekarang kita akan mempelajari pengo;ahan terhadap kejadian yang akan
menghasilkan kejadian baru.Kejadian bari itu akan tetap merupakan himpunan bagian
dari ruang sampel semula.
DEFINISI Irisan Dua Kejadian. Irisan dua kejadian A dan B dilambangkan dengan
A ∩ B, adalah kejadian yang mengandung semua unsur persekutuan kejadian A dan
B.
Unsur-unsur dalam himpunan A ∩ B mewakili terjadinya secara sekaligus
kejadian A dan B, oleh karena itu haruslah merupakan unsure-unsur, dan hanya unsure-
unsur yang termasuk dalam A dan B sekaligus. Unsure-unsur tersebut dapat
didefinisikan menurut kaidah A ∩ B = {x|x ∈A dan x ∈B}, lambing ∈berarti
“anggota” atau “termasuk dalam". Dalam diagram Venn daerah yang diwarnai
merupakan A ∩B.
Contoh soal 14. Misalkan A = {1,2,3,4,5} dan B = {2,4,6,8}, maka
jawab: A ∩B = {2,4}
DEFINISI Kejadian Saling Terpisah. Dua kejadian A dan B dikatakan saling terpisah
bila A ∩B = ∅, A dan B tidak memiliki unsur persekutuan.
Modul statistika dasar
103
Dua kejadian saling terpisah A dab B diilustrasikan dengan diagram Venn berikut:
Dengan mewarnai kedua daerah yang mewakili kejadian A dan Bkita melihat bahwa
tidak ada daerah irisan keduanya yang mewakili kejadian A ∩B.
Contoh soal 14. Misalkan sebuah dadu dilemparkan. Misalkan pula A adalah kejadian
munculnya bilangan genap dan B adalah kejadian munculnya bilangan ganjil. Maka
Kejadian A = {2,4,6} dan B= {1,3,5} tidak memiliki titik persekutuan karena bilangan
ganjil atau genap tidak mungkin muncul bersamaan pada satu kali lemparan sebuah
dadu.
DEFINISI Paduan Dua Kejadian.Paduan dua kejadian A dan B, dilambangkan
dengan A ∪ B, adalah kejadian yang mencakup semua unsur atau anggota A atau B
atau keduannya.
Unsur-unsur A ∪B dapat didefinisikan menurut kaidah A ∪B = {x|x ∈A atau x
∈B}. Pada diagram Venn daerah yang diwarnai mewakili kejadian A ∪B.
Modul statistika dasar
104
Contoh soal 15. Jika A = { 2,3,5,8} dan B = { 3,6,8}, maka A ∪B = { 2,3,5,6,8}.
DEFINISI Komplemen Suatu Kejadian. Komplemen suatu kejadian A relatif terhadap
S adalah himpunan semua anggota S yang bukan anggota A. kita lambangkan
komplemen A ini dengan A

.
Anggota A

dapat didefinisikanmenurut kaidah A

= {x|x ∈S dan x ∉A}. Pada
diagram Venn kejadian A

diwakili oleh daerah yang diarsir.
Akibat dari definisi-definisi sebelumnya maka muncul dalil-dalil sebagai berikut :
1. A ∩∅= ∅
2. A ∪∅= A
3. A ∩

= ∅
4. A ∪

= S
5. S

= ∅
6. ∅

= S
7. (

)

= A
Modul statistika dasar
105
SOAL LATIHAN
1. Sepasang pengantin baru merencanakan untuk mempunyai 3 anak.
Daftarkan ruang sampel S
1
dengan menggunakan huruf L untuk “
laki-laki” dan P untuk “perempuan”.Selain itu buat pula ruang
sampel S
2
yang unsur-unsurnya menyatakan banyaknya anak
perempuan.
2. Misalkan sebuah keluarga hendak berkemah, Misalkan M adalah
kejadian mereka mendapat kesulitan mekanis pada kemahnya, T
kejadian mereka terkena denda pelanggaran lalu lintas, dab V
adalah kejadian bahwa mereka sampai di bumi perkemahan dan
ternyata tidak ada tempat yang kosong.Dengan melihat diagram
dibawah ini, nyatakan dalam kata-kata kejadian yang diwakili oleh
daerah-daerah :
a) Daerah 5
b) Daerah 3
c) Daerah 1 dan 2 bersama-sama
d) Daerah 4 dan 7 secara bersama-sama
e) Daerah 3,6,7 dan 8 bersama-sama.
BAB VIII
DISTRIBUSI PELUANG
8.1 PENDAHULUAN
Seperti yang telah dibicarakan dalam bagian-bagian terdahulu, apabila suatu
eksperimen dilakukan, yang menjadi perhatian kita adalah beberapa kejadian yang
Modul statistika dasar
106
menarik dan peluang terjadinya kejadian-kejadian tersebut. Pengertian distribusi
peluang adalah himpunan pasangan berurut dari kejadian dan peluang terjadinya
kejadian tersebut dimana kejadian tersebut biasanya adalah hasil perhitungan atau
hasil pengukuran terhadap hasil eksperimen yang menjadi perhatian. Dalam hal ini
perlu dicatat bahwa hasil-hasil yang mungkin dari suatu eksperimen pada umumnnya
belum tentu merupakan angka/ bilangan.
Dalam modul ini akan diuraikan distribusi tentang peluang yang terdiri dari beberapa
distribusi diskrit antara lain adalah Distribusi Seragam, Distribusi Binom dan
Multinom, Distribusi Hipergeometrik, Distribusi Binom Negatif dan Distribusi
Geometrik, Distribusi Poisson.
KOMPETENSI DASAR, Diharapkan pada akhir perkuliahan ini mahasiswa dapat
mengetahui dan memahami manfaat dari masing-masing distribusi dalam distribusi
peluang, dan juga dapat diterapkan untuk memecahkan masalah dalam kehidupan
sehari – hari.
8.2PENYAJIAN
A. DISTRIBUSI PELUANG
8.3 Pengertian Peubah Random
DEFINISI Peubah Random. Suatu fungsi yang nilainya berupa bilangan nyata yang
ditentukan oleh setiap unsur dalam ruang sampel disebut peubah random.
Kita akan menggunakan huruf capital, misalnya X, untuk melambangkan suatu peubah
random, dan huruf kecilnya dalam hal ini x, untuk menyatakan salah satu di antara nilai-
nilainya.
Conto soal 31. Dua kelereng diambil berturut-turut tanpa pemulihan dari sebuah kantung
yang berisi 4 kelereng merah dan 3 kelereng hitam. Hasil-hasil percobaan yang mungkin
berikut nilai y bagi peubah random Y, yang menyatakan banyaknya kelereng merah yang
terambil adalah
Ruang Sampel y
Modul statistika dasar
107
MM
MH
HM
HH
2
1
1
0
DEFINISI Ruang Sampel Diskret. Bila suatu ruang sampel mengandung jumlah
titik sampel yang terhingga atau suatu barisan unsure yang tidak pernah berakhir,
tetapi yang sama banyaknya dengan bilangan cacah, maka ruang itu disebut ruang
contoh diskret.
DEFINISI Ruang Sampel Kontinu. Bila suatu ruang sampel mengandung
takhingga banyaknya titik sampel yang sama dengan banyaknya titik pada sebuah
ruas garis, maka ruang itu disebut ruang sampel kontinu.
Peubah random kontinu digunakan untuk data yang diukur, misalnya tinggi, bobot, suhu,
jarak, atau umur sedangkan peubaha random diskret digunakan untuk data yang berupa
cacahan, misalnya banyaknya produk yang cacat, banyaknya kecelakaan per tahun di
nsuatu provinsi.
8.4 Distribusi Peluang Diskret
Suatu peubah random dinyatakan dalam sebuah rumus. Rumus itu merupakan fungsi
nilai-nilai x, oleh karena itu kita akan melambangkan dengan f(x), g(x), r(x) dan
sebagainya. Jadi f(x) = P(X = x); misalnya f(3) = P(X = 3). Himpunan semua pasangan
berurutan (x,f(x)) disebut fungsi peluang atau distribusi peluang bagi peubah random X.
DEFINISI Distribusi Peluang Diskret. Sebuah tabel atau rumus yang
mencantumkan semua kemungkinan nilai suatu peubah random diskret berikut
peluangnya, disebut distribusi peluang diskret.
Modul statistika dasar
108
Conto soal 32. Tentukan distribusi peluang bagi jumlah bilangan bila sepasang dadu
dilemparkan.
JAWAB. misalkan X adalah peubah random yang menyatakan jumlah bilangan dari
kedua dadu tersebut. Maka X dapat mengambil sembarang nilai bulat dari 2 sampai 12.
Dua dadu dapat mendarat dalam (6) (6) = 36 cara, masing-masing dengan peluang 1.36.
P(X = 3) = 2/36, karena jumlah 3 hanya dapat terjadi dalam 2 cara. Dengan
memperhatikan kemungkinan nilai-nilai lainnya, kita akan mendapatkan distribusi
peluang di bawah ini :
X 2 3 4 5 6 7 8 9 10 11
12
P(X=x)
Comtoh soal 33. Tentukan rumus bagi distribusi peluang banyaknya sisi gambar bila
sebuah uang logam dilempar 4 kali.
Jawab. Karena ruang sampelnya mengandung 2
4
= 16 titik ssampel, maka penyebut bagi
bagi peluangnya adalah 16, dan semua titik sampel ini mempunyai peluang terjadi yang
sama. Untuk menghitung banyaknya cara mendapatkan, misalnya 3 sisi gambar, kita
perlu memperhatikan banyaknya cara menyekat 4 hasil percobaan ke dalam 2 sel, dengan
3 sisi gambar dalam sel yang satu dan satu sisi angka dalam sel lainnya. Ini dapat
dilakukan dalam
4
3
= 4 cara.secara umum x sisi gambar dan 4 – x sisi angka dapat
terjadi dalam
4
cara, dengan x dapat bernilai 0,1,2,3,atau 4.jadi fungsi peluangnya f(x)
= P(X=x) adalah :
F(x) = , umtuk x = 0,1,2,3,4
8.5 Distribusi peluang kontinu
Peubah random kontinu berpeluang nol untuk mengambul tepat salah satu
nilainya. Akibatnya, distribusi peluangnya tidak dapat diberikan dalam bentuk table.
Perhatikan peubah random yang menyatakan tinggi badan semua orang berusia di
Modul statistika dasar
109
atas 21 tahun. Antara dua nilai tinggi sembarang, misalnya 163.5 dan 164.5
cm.terdapat tak hingga banyaknya tinggi, dan hanya satu yang tepat 164 cm. peluang
mengambil secara randomorang yang tingginya tepat 164 cm, dan bukan salah satu
dari takhingga banyaknyatinggi yang sangat dekat dengan 164 cm tetapi yang tidak
dapat lagi dibedakanoleh nanusia, adalah sangat kecil sekali. Sehingga kita
memberikan peluang nol pada kejadian tersebut.Tetapi bila kita bicarakan peluang
terambilnya seseorang yang tingginya sekurang-kurangnya 163 cm tetapi tidak lebih
dari 165 cm. dalam hal ini kita berhadapan dengan sebuah selang nilai peubah
random, dan bukan tepat satu nilai peubah random.
Untuk menghitung peluang bagi berbagai selang peubah random kontinu seperti
P(a < X <b), P(W>c), dan lain sebagainya.
Bila X kontinu, maka
P(a < X ≤b) = P(a < X <b) + P(X = b)
= P(a < X <b)
Distribusi peluang bagi peubah random kontinu tidak dapat disajikan dalam bentuk
table tetapi dapat dinyatakan dalam bentuk rumus. Rumus itu merupakan fungsi
nilai-nilai peubah random kontinu X, sehingga dapat digambarkan sebagai suatu
kurva kontinu. Fungsi peluang yang digambarkan oleh kurva disebut fungsi
kepekatan peluang atau fungsi kepekatan atau fungsi densitas.
Beberapa bentuk funsi kepekatan :
Modul statistika dasar
110
Gambar 4.3 a.
Beberapa bentu fungsi kepekatan
Gambar 4.3b. P(a < X <b)
Fungsi kepekatan peluang dibuat sedemikian sehingga luas daerah dibawah kurvadan
di atas sumbu x sama dengan 1. Bila suatu fungsi kepekatan dinyatakan oleh kurva di
atas, maka peluang X mengambil nilai antara a dan b sama dengan luas daerah yang
diarsir yang terletak diantara X= a dan X=b dibawah fungsi kepekatannya.
DEFINISI Fungsi Kepekatan Peluang. Fungsi f disebut fungsi kepekatan
Modul statistika dasar
111
peluangbagi peubah random kontinu X bila luas darah dibawah kurva dan di atas
sumbu x sama dengan 1, dan bila luas daerah dibawah kurva antara x=a dan x=b
menyatakan peluang X terletak antara a dan b.
Contoh Soal 34. Sebuah peubah random kontinu X yang mengambil nilai antara x=2 dan
x=4 mempunyai fungsi kepekatan peluang : f(x) = ,
a) Perlihatkan bahwa P(2 < X <4),
b) Hitunglah P ( X <3.5),
c) Hitunglah P( 2.4 < X <3.5 ),
JAWAB.
a) Perhatikan gambarnya:
Karena daerah yang dihitami dalam gabar di atas adalah berupa sebuah
trapezium, maka luasnya sama dengan jumlah kedua sisi yang sejajar digandakan
dengan alasnya dan kemudian dibagi 2.
Luas =
(jmlahsisi sejajar) Xalas
2
=
[ ( ) ( )]( )
Sekarang, karena f(2) = 3/8 dan f(4) = 5/8,maka P(2 < X <4) =
( )
= 1
b) Lihat gambar berikut:
Modul statistika dasar
112
Sudah diperoleh bahwa f(2) = 3/8, maka f(3.5) = 4.5/8. Sehingga luas daerah
yang diarsir adalah P ( X <3.5) =
.
( . )
= 0.70
c) Kita peroleh bahwa f(2.4) = 3.4/8 dan f(3.5) = 4.5/8, dapat dilihat pada gambar
di bawah bahwa: P( 2.4 < X <3.5 ) = =
. .
( . )
= 0.54
8.6 Distribusi Peluang Bersama
Bila X dan Y adalah dua peubah random diskrit, distribusi peluang
bersamanya dapat dinyatakan sebagai sebuah fungsi f(x,y) bagi sembarang pasangan
nilai (x,y)yang dapat diambil oleh peubah random X dan Y.Fungsi ini biasa disebut
distribusi peluang bersama bagi X dan Y. jadi, dalam kasus peubah random diskrit :
F(x,y) = P(X=x, Y=y)
Artinya nilai f(x,y) menyatakan peluang bahwa x dan y terjadi secara bersamaan.
Modul statistika dasar
113
DEFINISI Distribusi Peluang Bersama. Suatu table atau rumus mendaftarkan
semua kemungkinan nilai x dan y bagi peubah random diskrit X dan Y , berikut
peluang padanannya f(x,y), disebut distribusi peluang bersama
Contoh soal 35. Dua isi bolpoin dipilih secara random dari sebuah kotak yang berisi 3
isi bolpoin biru, 2 merah dan 3 hijau.Bila X adalah banyaknya isi bolpoin biru dan Y
banyaknya isi bolpoin merah yang terpilih, tentukan :
a) Fungsi peluang bersama f(x,y), dan
b) P [(X,Y) ∈A],sedangkan A = {(x,y) x + y ≤1 }
JAWAB.
a) Semua pasangan kemungkinan nilai (x,y) adalah (0,0), (0,1), (1,0),(1,1),(0,2),dan
(2,0). Sekarang f(0,1) misalnya menyatakan peluang terambilnya isi bolpin hijau
dan merah. Banyaknya cara mengambil 2 dari 8 isi bolpoin adalah
8
2
= 28.
Banyaknya cara mengambil 1 dari 2 isi bolpoinmerah dan 1 dari 3 isi bolpoin
hijau adalah
2
1
3
1
= 6. Sehingga f(0,1) = 6/28 = 3/14. Perhitungan yang sama
akan menghasilkan peluang bago kemungkinan hasil lainnya, seperti disajikan
dalam table berikut
Distribusi Peluang bersama untuk contoh soal 35.
Distribusi peluang bersama dari table di atas adalah :
f (x,y) = , untuk X = 0.1,2; Y = 0,1,2; 0 ≤X + Y≤2
b) P [(X,Y) ∈A] = P(x + y ≤1)
Modul statistika dasar
114
= f(0,0) + f(0,1) + f(1,0)
= 3/28 + 3/14 + 9/28
= 9/14
DEFINISI Distribusi Bersyarat. Distribusi bersyarat bagi peubah random diskret
Y, untuk X= x , diberikan menurut rumus :
f(y x) =
( , )
( )
, g(x) > 0
Begitu pula, Distribusi bersyarat bagi peubah random diskrit X, untuk Y = y
diberikan rumus :
f(x y) =
( , )
( )
, h(y) > 0
Contoh Soal 36. Dari contoh soal 35, tentukan f(x 1) untuk semua nilai x dan
tentukan pula P(X= 0 Y = 1).
Jawab. Pertama-tama kita hitung h(1) = f(0,1) + f(1,1) + f(2,1) = 3/14 + 3/14 + 0 =
3/7
Sekarang, f(x 1) =
( , )
( )
= 7/3 f(x,1), x= 0,1,2. Sehingga,
f(0 1) = 7/3 f(0,1) = (7/3)(3/14) = ½
f(1 1) = 7/3 f(1,1) = (7/3)(3/14) = ½
f(2 1) = 7/3 f(2,1) = (7/3)(0) = 0,
dan distribusi bersyarat X, untuk Y = 1, adalah
x 0 1 2
f(x 1) ½ ½ 0
Dan terakhir,
P(X= 0 Y = 1) = f(0 1) = ½.
Modul statistika dasar
115
DE DEFINISI Dua Buah Peubah Random yang Bebas. Peubah random X dan Y
dikatakan bebas jika dan hanya jika
F(x,y) = g(x)h(y)
Untuk semua kemungkinan nilai X dan Y.
Contoh Soal 37. Tunjukkan bahwa kedua peubah random dalam cotoh 35 tidak bersifat
bebas.
JAWAB. Baiklah kita perhatikan titik (0.1). dari table distribusi peluang bersama contoh
35 kita mengetahui ketiga nilai peluang f(0.1), g(0), dan h (1) adalah
f(0.1) = ,
g(0) = ∑ ( , ) = + + = ,
h(1) = ∑ ( ,1) = + + 0= .
Jelas bahwa, F(0.1) ≠g(0)h(1),
Sehingga X dan Y tidak bebas.
8.7 Nilai tengah Peubah Random
DEFINISI Nilaitengah suatu Peubah Random. Misalkan X adalah peubah
random diskret dengan Distribusi peluang
x . . .
P(X = x) f( ) f( ) . . . f( )
Maka nilaitengah atau nilai harapan bagi X adalah
= ( ) = ∑ ( ).
Modul statistika dasar
116
Contoh Soal 38. Tentukan nilai harapan bagi X bila X menyatakan hasil yang diperoleh
bila sebuah dadu setimbang dilemparkan.
JAWAB. Masing-masing bilangan 1, 2, 3, 4, 5, dan 6 dapat terjadi dengan peluang 1/6.
Maka
= ( ) = (1)(1/6) + (2)( 1/6) + . . . + (6)( 1/6) = 3.5.
Artinya secara rata-rata kita memeperoleh 3.5 perlemparan.
Contoh Soal 39. Dalam sebuah permainan judi, petaruh akan mendapat 5 dolar bila hasil
dari 3 lemparan sebuah uang logam adalah gambar semua atau angka semua, tetapi Ia
harus membayar 3 dolar bila hasilnya adalah 1 atau 2 sisi gambar. Berapa penerimaan
harapan bagi petaruh tersebut?
Jawab. Ruang sampel bagi pelemparan 3 uang logam sekali, atau yang setara dengan 1
uang logam dilemparkan 3 kali, adalah :
S ={ GGG,GGA,GAG,AGG,GAA,AGA,AAG,AAA}, kita dapat mengajukan alasan
bahwa masing-masing itu mempunyai peluang terjadi yang sama, yaitu sebesar 1/8.
Pendekatan lain adalah menerapkan kaidah penggandaan peluang bagi kejadian yang
bebas untuk setiap unsure ruang sampel S. misalnya :
P( GGA) = P(G)P(G) P(A)
= (1/2)(1/2)(1/2) = 1/8.
Peubah randomnya adalah Y, banyaknya uang yang dapat dimenangkan oleh petaruh,
dan
kemungkinan nilai bagi Y adalah 5 dolar bila yang terjadi adalah kejadian E
1
=
{GGG,AAA} dan -3 dolar bila yang terjadi adalah E
2
={
GGA,GAG,AGG,GAA,AGA,AAG}.karena E
1
dan E
2
masing-masing mempunyai
peluang terjadi ¼ dan ¾, maka
= ( ) = (5)(1/4) + (-3)( 3/4) = -1,jadi dalam permainan ini, secara rata-
rata petaruh itu kalah 1 dolar per pelemparan 3 uang logam.
Contoh soal 40. Tentukan nilai harapan banyaknya orang laki-laki dalam sebuah panitia
yang terdiri atas 3 orang, yang diambil secara random dari 4 laki-laki dan 3 perempuan.
Modul statistika dasar
117
Jawab. Misalkan X melambangkan banyaknya laki-laki dalam penitia tersebut:
f(x) = , untuk x = 0, 1, 2,3
Perhitungan sederhana menghasilkan f(0) = 1/35, f(1) = 12/35, f(2) = 18/35, dan f(3) =
4/35. Sehingga = ( ) =(0)(1/35) + (1)(12/35) + (2)(18/35) + (3)(4/35) = 1.7
Jadi, bila sebuah panitia 3 orang yang diambil secara random berulang-ulang dari 4 laki-
laki dan 3 perempuan, secara rata-rata akan berisi1.7 laki-laki.
DALIL 1. Nilai Tengah Fungsi satu peubah random. Misalkan X adalah suatu
peubah random Diskret dengan distribusi peluang :
x . . .
P(X = x) f( ) f( ) . . . f( )
Maka nilai tengah atau nilai harapan peubah random g(X) adalah
( )
= [ ( )] = ( ) ( ).
Contoh soal 41. Misalkan banyaknya mobil X, yang dicuci disuatu tempat penyucian
mobil antara pukul 16:00 dan 17:00 pada setiap hari jumat yang cerah mempunyai
distribusi peluang
x 4 5 6 7 8 9
P(X = x) 1/12 1/12 ¼ ¼ 1/6 1/6
Bila g(x) = 2X – 1 menyatakan uang yang dibayarkan, dalam dolar, oleh manager kepada
petugas pencuci, tentukan penerimaan harapan petugas encuci mobil pada periode waktu
tersebut.
Jawab. Menurut dalil 1 di atas, petugas itu dapat mengharapkan untuk:
E[g(X) ] = E (2X -1) = ∑ (2 −1) ( )
= (7)(1/12) + (9)(1/12) + (11)(1/4) + (13)(1/4) + (15)(1/6) + (15)(1/6)
Modul statistika dasar
118
= 12.67 Dolar.
DEFINISI Nilai Tengah Fungsi Dua Peubah Random. Misalnya X dan Y
keduanya merupakan peubah random diskret dengan peluang bersama f(x,y).
Untuk x = x
1
, x
2
, …x
n
. dan Y = y
1
,y
2
, …, y
n
. Maka nilai tengah atau nilai
harapan bagi peubah random g(X,Y) adalah
( , )
= [ ( , )] = , ( , )
Contoh Soal 42. Misalkan X dan Y adalah peubah random dengan distribusi bersama
seperti yang diberikan contoh soal 36. Carilah nilai harapan bagi g(X,Y) =XY.
Jawab. Menurut definisi di atas,
E(X)(Y) = ∑ ∑ ( , )
= (0)(0)f(0,0) + (0)(1)f(0.1)+ (0)(2)f(0,2) + (1)(0)f(1,0) +
(1)(1)f(1,1) + (2)(0)f(2,0)
= f(1,1) = 3/14
8.8 Ragam Suatu Peubah Random
Sautu populasi yang pengamatannya terdiri atas nilai-nilai peubah random X,s bila
suatu percobaan diulang terus menerus tak hingga kali, tidak hanya memiliki nilai
tengah seperti yang telah didefinisikan, tetapi juga memiliki ragam yang
dilambangkan dengan atau .Ragam populasi ini kita sebut dengan ragam
peubah randomX atau ragam distribusinya:
Modul statistika dasar
119
DEFINISI Ragam Peubah Random. Bila X adalah peubah random dengan
distribusi peluang:
x . . .
F (x) f( ) f( ) . . . f( )
Maka ragam bagi X adalah
= [( − ) ] = ∑ ( − ) ( )
Contoh soal 43. Hitunglah ragam peubah random X dalam contoh soal 40. X
menyatakan banyaknya laki-laki dalam sebuah panitia yang terdiri atas 3 orang yang
diambil secara cak dari 4 orang laki-laki dan 3 perempuan.
Jawab. Dalam contoh soal 10 telah diperoleh bahwa = 12/7. Maka
= ( − ) ( )
= (0– 12/ 7) (1/35) + (1– 12/ 7) (12/35)
+ (2– 12/ 7) (18/35) + (3– 12/ 7) (4/35).
= 24/4
DALIL 2. Rumus Hitung Bagi .Ragam bagi peubah random X dapat dihitung
menurut rumus = E(X
2
) -
2
Latihan : Buktikan dalil 2 di atas dengan rumus kaidah penjumlahan pada bab I.
Contoh soal 44. Peubah random X, yang menyatakan banyaknya peluru roket yang
gagal bila 3 peluru demikian ditembakkan, mempunyai distribusi peluang sebagai
berikut:
Modul statistika dasar
120
x 0 1 2 3
P(X = x) 0.51 0.38 0.10 0.01
Dengan menggunakan dalil 2, hitunglah σ .
Jawab. Pertama-tama kita hitung :
= (0)(0.51) + (1)(0.38) + (2)(0.10) + (3)(0.01)
= 0.61, sehingga;
E(X
2
) = (0)(0.51) + (1)(0.38) + (4)(0.10) + (9)(0.01)
= 0.61
Jadi, = E(X
2
) -
2
= 0.87 – (0.16)
2
= 0.4979
DALIL 3. Ragam Fungsi Satu Peubah Random. Misalkan peubah random X
mempunyai distribusi peluang berikut :
x . . .
f (x) f( ) f( ) . . . f( )
Maka ragam random g (X) adalah
( )
= E{[g(X) -
( )
]
2
} = ∑ [( ( ) −
( )
)] ( )
Contoh soal 45. Hitunglah ragam g(X) = 2X + 3, bila X merupakan peubah random
dengan distribusi peluang :
Modul statistika dasar
121
x 0 1 2 3
f( x) 1/4 1/8 1/2 1/8
Jawab. Pertama-tama kita harus menghitung nilai tengah peubah random 2X + 3,
menurut dalil 1. = [2 +3] = ∑ (2 +3) ( ) = 6
Sekarang, dengan menerapkan dalil 3.kita peroleh :
( )
= E{[(2X + 3) -
)
]
2
}
= E {[(2X + 3) – 6 ]
2
}
= E ( 4X
2
+ 12x +3)
= ∑ (4X2 + 12x +3) ( )
= 137/8
8.9 Sifat-Sifat nilai Tengah Dan Ragam
DALIL 4. Bila a dan b konstanta, maka
= a + b = a + b.
Bukti. Menurut definisi nilaitengah peubah random,
= [ + ] = ∑ ( + ) ( )
= ( + ) ( ) + ( + ) ( ) + . . . + ( + ) ( )
= [ ( ) + ( ) + …+ ( )] + [ ( ) +
( ) + …+ ( )]
= ∑ ( ) + ∑ ( ).
Jumlah yang pertama di sebelah kanan tanda sama dengan adalah definisi , sedangkan
jumlah yang kedua sama dengan 1. Dengan demikian, kita mendapatkan
= a + b.
Modul statistika dasar
122
KOROLARI 1 Bila =0, maka =
KOROLARI 2 Bila =0, maka = .
Contoh soal 46. Dengan menerapkan Dalil 4 pada contoh 41, kita dapat menuliskan
= 2 −
Sekarang,
= ( ) = ∑ ( )
=(4) + (5) + (6)( ) + (7)( ) + (8) + (9)( )
=( ).
Sehingga
=(2)
41
6
−1 =$12.6
Seperti yang telah diperoleh sebelumnya.
DALIL 5 Nilaitengah jumlah atau selisih dua atau lebih peubah random sama dengan
jumlah atau selisih nilaitengah masing-masing peubah. Jadi
= + = − .
Bukti. Menurut definisi,
= ( + )
= ∑ ∑ ( + ) ( , ).
= ∑ ∑ ( , ) + ∑ ∑ ( , )
= +
DALIL 6. Nilai tengah hasil kali dua atau lebih peubah random yang bebas satu
sama lain dengan hasil kali nilai tengah masing-masing peubah random. Jadi, bila X
dan Y bebas, maka:
Modul statistika dasar
123
=
Bukti : Menurut definisi :
= ( ) ( ) ( )
Karena X dan Y bebas, maka
( , ) = ( ) ( ).
Sedangkan ( ) dan ( ) masing-masing adalah distribusi marjinal bagi X dan Y.
dengan demikian
= ∑ ∑ ( ) ( )
= [∑ ( )] ∑
=
DALIL 7 Bila X suatu peubah random dan b konstanta, maka
= =
Bukti. Menurut dalil 3,
= {[( + ) − ] }.
Sekarang, dari Dalil 4, = + . Sehingga,
= [( + − − ) ]
= [( − ) ]
= .
DALIL 8 Bila X suatu peubah random dan a suatu konstanta, maka
= = .
Bukti. Menurut Dalil 3,
= {[ − ] }.
Sekarang, menurut Korolari 2 dari Dalil 4, = . Sehingga
Modul statistika dasar
124
= [( − ) ]
= [( − ) ]
=
2 2
.
DALIL 9. Ragam jumlah atau selisih dua atau lebih peubah random yang bebas
sama dengan jumlah ragam masing-masing peubah random.jadi, bila X dan Y bebas,
maka
= + dan = +
Bukti. Dengan memperluas dalil 3. Pada kasus dua peubah random, kita peroleh :
= E{[(X – Y) - ]
2
}
Sekarang, dari dalil 5.
= , sehingga
= E{[(X – Y) – ( ) ]
2
}
= E{[(X – ) – ( − ) ]
2
}
= E{[(X – )
2
] +E[( − )2] – 2E[{[(X – ) ( − ) }
= +
Karena untuk dua peubah randomyang bebas berlaku ;
E[(X – ) ( − )] = E(XY - Y - X + )
= E(X)E(Y) - E(Y) - E(X) + E( )
= − − +
= 0
Contoh Soal 47. Bila X dan Y bebas, masing-masing mempunyai ragam = 1 dan
= 2, tentukan ragam peubah random Z = 3X – 2Y +5.
Jawab. Dengan memandang 3X – 2Y sebagai peubah random yang baru, kita dapat
menggunakan dalil 7 untuk menuliskan :
Modul statistika dasar
125
= = , selanjutnya, dengan menerapkan dalil 9 dan kemudian
dalil 8 pada kedua peubah random yang bebas 3X dan 2Y, kita memperoleh :
= +
=9 + 4
= (9)(1) + (4)(2)
= 17
BEBERAPA DISTRIBUSI PELUANG DISKRET
1.1 Distribusi Seragam
DEFINISI Distribusi Seragam Diskret. Bila peubah random X mempunyai
nilai-nilai , ,…, , dengan peluang yang sama, maka distribusi seragam
diskretnya diberikan oleh
f(x;k) = 1/k, untuk x = , ,…, .
Kita telah menggunakan notasi f(x;k) alih-alih f(x) untuk menunjukkan bahwa
distribusi seragam itu bergantung pada parameter k.
Contoh Soal 48. Tentukan distribusi seragam bagi himpunan bagian nama bulan
berukuran 3 yang diambil secara random.
JAWAB. Karena semuanya terdapat 12 nama bulan, maka kita dapat mengambil 3 secara
random dalam = 220 cara. Dengan menomori masing-masing dari 1 sampai 220,
maka distribusi peluangnya diberikan oleh
f(x;220) = 1/220, untuk x = 1,2, . . . , 220
sehingga peluang terambilnya himpunan bagian nomor 5, misalnya, adalah f(x;220) =
1/220.
Modul statistika dasar
126
1.2 Distribusi Binomial
DEFINISI Distribusi Binom. Bila suatu ulangan binom mempunyai peluang
keberhasilan p dan peluang kegagalan q = 1 – p, maka distribusi peluang bagi
peubah random binom X, yaitu banyaknya keberhasilan dalam n ulangan yang
bebas, adalah
B(x;n,p) = , untuk x = 0, 1, 2, . . . , n.
Perhatikan bila n = 3 dan p = ½, maka
B(X; 3,1/2) = =
Sesuai dengan hsil untuk banyaknya sisi gambar bila sebuah uang logam
dilemparkan tiga kali.
Contoh Soal 49. Tentukan peluang mendapatkan tepat tiga bilangan 2 bila sebuah dadu
setimbang dilemparkan 5 kali.
JAWAB. Peluang keberhasilan setiap ulangan yang bebas ini adalah 1/6 dan peluang
kegagalan adalah 5/6. Dalam hal ini munculnya bilangan 2 dianggap keberhasilan. Maka
b(3;5,1/6) =
=
!
! !
.
= 0.032.
Contoh Soal 50. Peluang seorang sembuh dari suatu penyakit darah adalah 0.4. bila 15
orang diketahui menderita penyakit ini , berapa peluang bahwa (a) sekurang-kurangnya
10 orang dapat sembuh; (b) ada 3 sampai 8 orang yang sembuh; dan (c) tepat 5 orang
yang sembuh.
JAWAB. (a). Misalkan X adalah banyaknya orang yang sembuh. Maka
P(X ≥10) =1− ( <10)
=1− ∑ ( ;15,0.4)
=1−0.9662
Modul statistika dasar
127
=0.0338.
(b) (3 ≤ ≤8) =∑ ( ;15,0.4)
=∑ ( ;15,0.4) −∑ ( ;15,0.4)
=0.9050−0.0271
=0.8779.
(c) ( =5) = ( ;15,0.4)
=∑ ( ;15, 0.4) −∑ ( ;15,0.4)
=0.4032−0.2173
=0.1859.
DALIL 1. Nilaitengah dan ragam bagi distribusi binom b(x;n,p) adalah
μ=np dan σ =npq.
Bukti. Misalkan hasil pada ulangan ke-j dinyatakan oleh peubah random , yang bernilai
0 dan 1, masing-masing dengan peluang q dan p. ini disebut peubah Bernoulli atau
mungkin lebih tepat peubah Indikator , karena =0berarti kegagalan dan =1
berarti keberhasilan.
Dengan demikian, dalam suatu percobaan binom banyaknya keberhasilan dapat
dituliskan sebagai jumlah n peubah indicator yang bebas. Sehingga
X = + + . . . + .
Nilaitengah setiap adalah E( ) = 0.q + 1.p = p. maka dengan menggunakan Dalil 5,
kita mendapatkan nilaitengah bagi distribusi binom, yaitu
= ( ) = ( ) + ( ) + …+ ( )
= + +...+
= np.
Ragam bagi setiap adalah
= − = −
= (0
2
)q + (1)
2
p – p
2
= p (1 – p) = pq.
Dengan demikian, menurut Dalil 9, ragam distribusi binom adalah
= + + …+
Modul statistika dasar
128
= + + …+
= .
Contoh Soal 51. Dengan menggunkan Dalil Chebyshev, tentukan dan tafsirkan selang
±2
Untuk contoh soal 50.
JAWAB. Karena contoh 50 merupakan percobaan binom dengan n = 15 dan p = 0.4,
maka menurut Dalil 1 kita memperoleh
=(15)(0.4) =6 =(15)(0.4)(0.6) =3.6. Dengan mengambil akar dari
3.6, kita memperoleh =1.897. Sehingga selang yang ditanyakan adalah 6
±(2)(1.897), atau dari 2.206 sampai 9.794. Dalil Chebyshev mengatakan bahwa
banyaknya yang sembuh diantara 15 pasien tersebut akan berada antara 2.206 dan 9.794
dengan peluang sekurang-kurangnya ¾.
1.3 Distribusi Poisson
Percobaan Poisson memiliki cirri-ciri berikut :
1. Banyaknya hasil percobaan yang terjadi dalam suatu selang waktu atau suatu
daerah tertentu, tidak bergantung pada banyaknya hasil percobaan yang terjadi
pada selang waktu atau daerah lain yang terpisah.
2. Peluang terjadinya suatu hasil percobaan selama suatu selang waktu yang singkat
sekali atau dalam suatu daerah yang kecil, sebanding dengan panjang selang
waktu tersebut atau besarnya daerah tersebut, dan tidak bergantung pada
banyaknya hasil percobaan yang terjadi di luar selang waktu atau daerah tersebut.
3. Peluang bahwa lebih dari satu hasil percobaan akan terjadi dalam selang waktu
yang singkat tersebut atau dalam daerah yang kecil tersebut, dapat diabaikan.
DEFINISI Distribusi Poisson. Distribusi peluang bagi peubah random Poisson
X, yang menyatakan banyaknya hasil percobaan yang terjadi selama suatu
selang waktu atau daerah tertentu, adalah
( ; ) =
!
, =1,2,…
Sedangkan dalam hal ini adalah rata-rata banyaknya hasil percobaan yang
Modul statistika dasar
129
terjadi selam selang waktu atau dalam daerah yang dinyatakan, dan =
2.71828…
Contoh Soal 60. Rata-rata jumlah hari sekolah ditutup karena salju selama musimdingin
di suatu kota di bagian timur AS adalah 4. Berapa peluang bahwa sekolah-sekolah di
kota ini akan ditutup selama 6 hari dalam suatu musim dingin?
JAWAB. Dengan menggunakan distribusi poisson dengan x = 6 dan = 4 kita peroleh
(6;4) =
!
=∑ ( ;4) −∑ ( ;4)
=0.8893−0.7851 =0.1042
DISTRIBUSI PELUANG KONTINU
. Distribusi Normal
Distribusi normal merupakan distribusi debgab variable acak kontinu. Distribusi
normal sering pula disebut distribusi gauss.
Jika variable acak kontinu X mempunyai fungsi densitas pada X = x dengan
persamaan :
( ) =

(N3)
dengan : π =nilai konstantayangbiladitulishingga4desimal π =3,1416.
e=bilangankonstan,biladitulishingga4desimal,e=2,7183.
μ=parameter,ternyatamerupakanrata−ratauntukdistribusi.
σ =parameter,merupakansimpanganbakuuntukdistribusi.
dan nilai x mempunyai batas −∞ < <∞ maka dikatakan bahwa variable acak X
berdistribusi normal.
Modul statistika dasar
130
Sifat-sifat penting distribusi normal :
1. Grafiknya selalu ada diatas sumbu datar x.
2. Bentuknya simetrik terhadap =
3. Mempunyai satu modus, jika kurva unimodal, tercapai pada
=
,
4. Grafiknya mendekati (berasimtutkan) sumbu datar x dimulai dari = +3 ke
kanan dan = −3 ke kiri.
5. Luas daerah grafik selalu sama dengan satu unit persegi.
Untuk tiap pasang ; sifat-sifat di atas selalu dipenuhi, hanya untuk
kurvanya saja yang berlainan. Jika makin besar, kurvanya makin rendah
(platikurtik) dan untuk makin kecil, kurvanya makin tinggi (leptokurtik).
Hubungan antara rumus N3 dengan rumus ∫
( ) =1(sifat 5). Jadi :
√2
−1 2

2
=1
(N4)
Untuk menentukan peluang harga X antara a dan b, yakni ( < < ),
digunakan rumus N4, sehingga :
( < < ) =∫ √2
−1 2

2
(N5)
Distribusi normal standar ialah distribusi normal dengan rata-rata =0 dan
simpangan baku =1. Fungsi densitasnya berbentuk :
( ) =


(N6)
untuk z dalam daerah −∞ < <∞ .
Mengubah distribusi normal umum dalam rumus N3 menjadi distribusi normal baku
dalam rumus N6 dapat ditempuh dengan menggunakan transformasi :
=
(N7)
Modul statistika dasar
131
Perubahan grafiknya dapat dilihat pada gambar di bawah ini.
Gambar grafik
Bagian-bagian luas dari distribusi normal baku dapat dicari dengan cara berikut :
1. Hitung z sehingga dua decimal.
2. Gsmbsrksn kurvanya seperti gambar sebelah kanan pada gambar di atas.
3. Letakkan harga z pada sumbu datar, lalu tarik garis vertical hingga memotong
kurva.
4. Luas yang tertera dalam daftar adalah luas daerah antara garis ini dengan garis
tegak di titik nol.
5. Dalam daftar, Daftar F, Lampiran, cari tempat harga z pada kolom paling kiri
hingga hanya satu decimal dan decimal keduanya dicari pada baris paling atas.
6. Dari z di kolom kiri maju ke kanan dan dari z di baris atas turun ke bawah, maka
didapat bilangan yang merupakan luas yang dicari. Bilangan yang didapat harus
ditulis dalam bentuk 0,xxxx (bentuk 4 desimal).
Karena seluruh luas = 1 dan kurva simetrik terhadap =0 , maka luas dari garis
tegak pada titik nol ke kiri ataupun ke kanan adalah 0,5.
Beberapa contoh, penggunaan daftar normal baku :
Akan dicari luas daerah :
1. Antara z = 0 dan z = 2,15.
Gunakan Daftar F, dalam Lampiran. Di
bawah z pada kolom kiri cari 2,1 dan di
atas sekali angka 5. Dari 2,1 maju ke kanan
dan dari 5 menurun, didapat 4842. Luas
daerah yang dicari, lihat daerah yang diarsir,
= 0,4842.
2. Antara z = -1,50 dan z = 1,82.
Modul statistika dasar
132
Dari grafik terlihat bahwa kita perlu mencari
luas dua kali, lalu dijumlahkan. Mengikuti
cara di 1) untuk z = 1,82 dan cara di 2)
untuk z = -1,50, masing-masing didapat
0,4656 dan 0,4332. Jumlahnya = luas yang
dicari = 0,4332 + 0,4656 = 0,8988.
3. Dari z = 1,96 ke kiri.
Luasnya sama dengan dari z = 0 ke kiri (=
0,5) ditambah luas dari z = 0 sampai ke z =
1,96 dari daftar didapat 0,4750. Luas = 0,5 +
0,4750 = 0,9750.
Untuk mencari kembali z apabila luasnya diketahui, maka dilakukan langkah
sebaliknya. Misalnya, jika luas = 0,4931, maka dalam badan daftar dicari 4931 lalu
menuju ke pinggir sampai pada kolom z, didapat 2,4 dan menuju ke atas sampai batas
z didapat 6. Harga z = 2,46.
Contoh :
1. Berat bayi yang baru lahir rata-rata 3.750 gram dengan simpangan baku 325 gram.
Jika berat bayi berdisribusi normal, maka tentukan ada :
a. Berapa persen bayi yang beratnya lebih dari 4.500 gram?
b. Berapa bayi yang beratnya antara 3.500 gram dan 4.500 gram, jika semuanya
10.000 bayi?
c. Berapa bayi yang beratnya yang lebih kecil atau sama dengan 4.000 jika
semuanya ada 10.000 bayi?
d. Berapa bayi yang beratnya 4.250 gram jika semuanya ada 5.000 bayi?
Jawab :
Dengan X = berat bayi dalam gram, =3.750gram, =325gram, maka :
a. Dengan transformasi rumus N7 untuk X = 4.500 :
=
. .
=2,31.
Modul statistika dasar
133
Berat yang lebih dari 4.500 gram,
pada grafiknya ada di sebelah kanan
z = 2,31. Luas daerah ini = 0,5 –
0,4896 = 0,0104. Jadi ada 1,04%
dari bayi yang beratnya lebih dari
4.500 gram.
b. Dengan X = 3.500 dan X = 4.500 didapat :
=
. .
=−0,77 =2,31.
Luas daerah yanh perlu = daerah
yang diarsir = 0.2794 + 0,4896 =
0,7690. Banyak bayi yang beratnya
antara 3.500 gram dan 4.500 gram
diperkirakan ada (0,7690)(10.000) =
7.690.
c. Bertanya lebih kecil atau sama dengan 4.000 gram, maka beratnya harus lebih
kecil dari 4.000,5 gram.
=
. , .
=0,77.
Peluang berat bayi lebih kecil atau sama dengan 4.000 gram = 0,5 + 0,2794 =
0,7794.
d. Berat 4,250 gram berarti berat antara 4.249,5 gram dan 4.250,5 gram. Jadi untuk
X = 4.249,5, dan X = 4.250,5 didapat :
=
. , .
=1,53.
=
. , .
=1,54.
Luas daerah yang perlu = 0,4382 – 0,4370 = 0,0012.
Banyak bayi = (0,0012)(5.000) = 6.
Antara distribusi binom dan distribusi normal terdapat hubungan tertentu. Jika
untuk fenomena yang berdistribusi binom berlaku :
Modul statistika dasar
134
a) N cukup besar,
b) = ( ) = peluang peristiwa A terjadi, tidak terlalu dekat kepada nol,
maka distribusi binom dapat didekati oleh distribusi normal dengan rata-rata
= dan simpangan baku = (1− ).
Untuk pembakuan, agar daftar distribusi normal baku yang dapat dipakai, maka
digunakan transformasi :
=
( )
(N8)
dengan X = variable acak diskrit yang menyatakan terjadinya peristiwa A.
7. Distribusi Student
Fungsi densitasnya adalah :
( ) =
1+
−1

berlaku untuk harga-harga t yang memenuhi −∞ < <∞ dan K merupakan bilangan
tetap yang besarnya bergantung pada n sedemikian sehingga luas daerah di bawah
kurva sama dengan satu unit.
Pada distribusi t ini terdapat bilangan (n-1) yang dinamakan derajat kebebasan,
akan disingkat dengan dk.
Jika sebuah populasi mempunyai model dengan persamaan seperti dalam rumus
N9, maka dikatakan populasi itu berdistribusi t dengan dk = (n - 1) .
Bentuk grafiknya seperti grafik distribusi normal baku, simetrik terhadap t = 0,
sehingga sepintas lalu hamper tak ada bedanya. Untuk harga-harga n yang besar,
biasanya ≥30, distribusi t mendekati distribusi normal baku seperti dalam rumus
N6.
Untuk perhitungan-perhitungan, daftar distribusi t sudah disusun seperti dapat
ditemukan dalam lampiran, Daftar G. Daftar tersebut berisikan nilai-nilai t untuk dk
dan peluang tertentu. Kolom paling kiri, kolom dk, berisikan derajat kebebasan, baris
teratas berisikan nilai peluang.
Untuk penggunaan Daftar G, perhatikan
gambar di samping. Gambar ini merupakan
Modul statistika dasar
135
grafik distribusi t dengan dk = dimana
=( −1). Luas bagian yang diarsir = p
dan dibatasi paling kanan oleh . Harga
inilah yang dicari dari daftar untuk
pasangan dan p yang diberikan.
Contoh :
1. Untuk n = 13, jadi dk = 12, dan p = 0,95 maka t = 1,78.
Ini didapat (lihat Daftar G dalam lampiran) dengan jalan maju ke kanan dari 12 dan
menurun dari 0,95.
2. Gambar grafik
Untuk n = 16, tentukan t supaya luas yang diarsir = 0,95. Dari grafik dapat dilihat
bahwa luas ujung kanan dan luas ujung kiri = 1 – 0,95 = 0,05. Kedua ujung ini sama
luas, jadi luas ujung kanan, mulai dari t ke kanan = 0,025. Mulai dari t ke kiri luasnya
= 1 – 0,025 = 0,975. Harga p inilah yang dipakai untuk daftar.
Dengan =15 (lihat Daftar G, dalam Lampiran) kita maju ke kanan dan dari p =
0,975 kita menurun, didapat t = 2,13. Jadi antara t = -2,13 dan t = 2.13 luas yang
diarsir = 0,95.
8. Distribusi Chi Kuadrat
Distribusi Chi Kuadrat merupakan distribusi dengan variable acak kontinu.
Simbolnya adalah .
Persamaan distribusi chi kuadrat adalah :
( ) = .
⁄ ⁄
(N10)
Modul statistika dasar
136
Grafik distribusi umumnya merupakan kurva positif, yaitu miring ke kanan.
Kemiringan ini makin berkurang jika derajat kebebasan makin besar.
Untuk perhitungan, daftar distribusi dapat dilihat dalam Lampiran, Daftar H
Gambar grafik
Gambar di atas memperlihatkan grafik distribusi secara umum dengan dk = .
Daftar H berisikan harga-harga untuk pasangan dk dan peluang p yang besarnya
tertentu. Peluang p terdapat pada baris paling atas dan dk ada pada kolom paling
kiri.
Luas daerah yang diarsir sama dengan peluang p, yaitu luas dari ke sebelah
kiri.
Contoh :
 Gambar grafik
Gambar di atas adalah grafik distribusi dengan dk = 9.
a) Jika luas daerah yang diarsir sebelah kanan = 0.05, maka =16,9. Ini
didapat dari dk = 9 dan p = 0.95.
b) Jika luas daerah yang diarsir sebelah kiri = 0.025, maka =2,70. Didapat
dari dk = 9 dan p = 0.025.
9. Distribusi F
Modul statistika dasar
137
Distribusi F ini juga mempunyai variable acak yang kontinu. Fungsi densitasnya
mempunyai persamaan :
( ) = .
( ) ⁄
1+
( ) ⁄
(N11)
dengan variable acak F memenuhi batas F > 0, K = bilangan tetap yang harganya
bergantung pada dan sedemikian sehingga luas di bawah kurva sama dengan
satu, = pembilang dan = penyebut.
Jadi distribusi F tidak simetrik dan umumnya sedikit positif. Daftar distribusi F telah
disediakan seperti dapat ditemukan dalam Lampiran, Daftar I. daftar tersebut
berisikan nilai-nilai F untuk peluang 0,01 dan 0,05 dengan derajat kebebasan dan
. Peluang inisama dengan luas daerah ujung kanan yang diarsir, sedangkan dk =
ada pada baris paling atas dan dk = pada kolom paling kiri.
Untuk tiap dk = , daftar terdiri atas dua baris, yang atas untuk peluang p = 0.05 dan
yang bawah untuk p = 0.01.
Contoh : Untuk pasangan derajat kebebasan = 24 dan =8, ditulis juga
( , ) = (24,8), maka untuk p = 0,05 didapat F = 3,12 sedangkan untuk p = 0,01
didapat F = 5,28 (lihat Daftar I, Lampiran). Ini didapat dengan mencari 24 pada baris
atas dan 8 pada kolom kiri. Jika dari 24 turun dan dari 8 ke kanan, maka didapat
bilangan-bilangan tersebut. Yang atas untuk p = 0,05 dan yang bawah untuk p = 0,01.
Notasi lengkap untuk nilai-nilai F dari daftar distribusi F dengan peluang p dan dk =
( , ) adalah ( , ).
Demikian untuk contoh didapat :
,
(24,8) = 3,12. Dan
,
(24,8) = 5,28.
Meskipun daftar yang diberikan hanya untuk peluang p = 0,01 dan p = 0,05, tetapi
sebenarnya masih bisa didapat nilai-nilai F dengan peluang 0,99 dan 0,95..
Modul statistika dasar
138
Untuk itu digunakan hubungan :
(1− )( , ) =
1
( , )
(N12)
Dalam rumus di atas perhatikan antara p dan (1 - p) dan pertukaran antara derajat
kebebasan ( , ) menjadi ( , ).
Contoh : Telah didapat
,
(24,8) = 3,12
Maka
,
(8,24) =
,
= 0,321.
.
SOAL LATIHAN
1. Suatu kiriman 7 pesawat televise mengandung 2 yang rusak. Sebuah
hotel membeli secara random 3 dari ketujuh televise tersebut. Bila X
menyatakan benyaknya televise yang rusak yang terbeli oleh hotel
tersebut, tentukan nikaitengah X.
2. Dalam suatu permainan judi, petaruh menerima $3 bila ia berhasil
mengambil kartu jack atau queen dan $5 bila ia berhasil mengambil
kartu king atau ace. Bila ia mengambil kartu yang lain, ia kalah. Berapa
taruhan yang harus dibayarnya agar permainan itu dapat dipandang
jujur?
3. Diketahui sebuah peubah random X memiliki distribusi peluang sebagai
berikut :
x -3 6 9
P(X = x) 1/6 ½ 1/3
Hitung
( )
, bila g(X) = (2 +1) .
Modul statistika dasar
139
4. Dari sekeranjang buah yang berisi 3 jeruk, 2 apel, dan 3 pisang, diambil
suatu contoh random 4 buah. Bila X menyatakan banyaknya jeruk dan
Y banyaknya apel yang terambil, hitunglah E(X
2
Y – 2XY).
5. Misalkan X menyatakan bilangan yang muncul bil;a sebuah dadu hijau
dilemparkan. Hitung ragam peubah random
a). 2X – Y
b). X + 3Y – 5.
6. Misalkan peluangnya seseorang akan mempercayai suatu cerita
mengenai hidup setelah mati adalah 0.8. berapa peluang bahwa
a. Orang keenam yang mendengar cerita itu adalah yang keempat
yang mempercayainya?
b. Orang ketiga yang mendengar cerita itu adalah yang pertama yang
mempercayainya?
7. Sebuah restoran menyediakan salad yang rata-rata mengandung secara
rata-rata 5 macam sayuran. Hitunglah peluang bahwa salad yang
disediakan mengandung lebih daripada 5 macam sayuran
a. Pada suatu hari tertentu
b. Pada 3 di antara 4 hari berikutnya
c. Pertama kali dalam bulan April pada tanggal 5 April.
8. Misalkan bahwa secara rata-rata 1 di antara 1000 orang membuat
kesalahan angka dalam melaporkan pajak pendapatannya. Bila 10000
formulir diambil secara random dan diperiksa, berapa peluang ada 6,7
atau 8 formulir yang mengandung kesalahan?
Modul statistika dasar
140
BAB. IX
SAMPLING DAN DISTRIBUSI SAMPLING
9.1 PENDAHULUAN
Statistik terbagi atas dua fase yaitu statistika deskriptif dan statistika induktif. Fase
pertama dikerjakan untuk melakukan fase kedua. Fase kedua ialah statistika induktif,
berusaha menyimpulkan tentang karakteristik populasi, yang pada umumnya
dilakukan berdasarkan pada data sampel yang diambil dari populasi yang
bersangkutan. Populasi adalah totalitas semua nilai yang mungkin, baik hasil
menghitung maupun pengukuran, kuantitatif maupun kualitatif, daripada karakteristik
tertentu mengenai sekumpulan obyek yang lengkap dan jelas. Sampel adalah sebagian
yang diambil dari populasi dengan menggunakan cara-cara tertentu. Untuk
mendapatkan kesimpulan yang dapat dipertanggungjawabkan haruslah ditempuh cara-
cara yang benar dalam setiapkah termasuk cara-cara pengambilan sampel atau
sampling.
Untuk mempelajari populasi kita memerlukan sampel yang diambil dari populasi yang
bersangkutan. Meskipun kita dapat mengambil lebih dari sebuah sampel berukuran n
dari populasi berukuran N, pada prakteknya hanya sebuah sampel yang bisa diambil
dan digunakan untuk hal tersebut. Sampel yang diambil ialah sampel random dan dari
sampel tersebut nilai-nilai statistiknya dihitung untuk digunakan seperlunya.
Distribusi sampling biasanya diberi nama bergantung pada nama statistic yang
digunakan. Misalnya yang kita kenal distribusi sampling rata-rata, distribusi sampling
proporsi,, distribusi sampling simpangan baku dan lain lagi.
KOMPETENSI KHUSUS, Diharapkan pada akhir perkuliahan nanti mahasiswa/I
mampu menjelaskan kembali tentang sampling atau pengambilan sampel dan dapat
mengimplementasikan dalam memecahkan masalah dalam kehidupan sehari – hari.
Modul statistika dasar
141
9.2 PENYAJIAN
1. SAMPLING ATAU PENGAMBILAN SAMPEL
A. ALASAN SAMPLING
Sensus terjadi apabila setiap anggota atau karakteristik yang ada di dalam
populasi dikenai penelitian. Jika tidak maka samplinglah yang ditempuh, yaitu
sampel diambil dari populasi dan datany dikumpulkan. Ada berbagai alasan
mengapa sensus tidak dapat dilakukan, antara lain :
a) Ukuran populasi
Ada dua macam ukuran populasi, ialah terhingga dan takhingga. Populasi
takhingga berisikan takhingga banyak obyek dan pada dasarnya hanya
konseptual sukarlah untuk melakukan sensus terhadapnya. Maskipun kita
punya populasi terhingga, sensus belum tentu bisa dilaksanakan.
b) Masalah biaya
Jika biaya penelitian yang tersedia terbatas,, maka samplinglah satu-satunya
pilihan, terkecuali jika ukuran populasi sedikit sekali sehingga sensus bisa
dilaksanakan.
c) Masalah waktu
Sensus memerlukan waktu yang lama dibandingkan dengan sampling. Dengan
demikian sampling dapat memberikan data lebih cepat.
d) Percobaan yang sifatnya merusak
Jika penelitian terhadap obyek sifatnya merusak, maka jenis sampling harus
dilakukan.
e) Masalah ketelitian
Data yang dikimpulkan harus benar dan pengumpulannya harus teliti. Begitu
pula dengan pencatatan dan penganalisisannya.
f) Factor ekonomis
Dengan factor ekonomis diartikan apakah kegunaan dari hasil penelitian
sepadan dengan biaya, waktu dan tenaga yang telah dikeluarkan untuk itu atau
tidak.
Modul statistika dasar
142
B. RANCANGAN SAMPLING
Beberapa hal yang perlu diperhatikan dalam perancanaan sampling yaitu :
a). Rumuskan persoalan yang ingin diketahui.
b). Tentukan dengan jelas batas populasi mengenai persoalan yang ingin
diketahui.
c). Definisikan dengan jelas dan tepat segala unit dan istilah yang diperlukan.
d). Tentukan unit sampling yang diperlukan.
e). Tentukan dan rumuskan cara-cara pengukuran dan penilaian yang akan
dilakukan.
f). Kumpulkan, jika ada, segala keterangan tentang hal yang ingin diteliti yang
pernah dilakukan masa lampau.
g). Tentukan ukuran ampel, yakni beberapa unit sampling yang harus diambil dari
populasi.
h). Tentukan cara sampling yang mana yang akan ditempuh agar sampel yang
diperoleh representative.
i). Tentukan cara pengumpulan data yang akan dilakukan.
j). Tentukan metode analisis mana yang akan digunakan.
k). Sediakan biaya dan minta bantuan ahli baik berbentuk pembantu tetap ataupun
hanya berbentuk konsultan.
C. BEBERAPA CARA SAMPLING
1) Sampling dengan pengembalian.
Contoh : Untuk populasi berukuran N = 4 dengan anggota-anggota : A, B, C, D
dan sampel yang diambil berukuran n = 2, termasuk sampel beranggotakan
sama, didapat :
Sampel 1 : AA Sampel 9 : CA
Sampel 2 : AB Sampel 10: CB
Sampel 3: AC Sampel 11: CC
Modul statistika dasar
143
Sampel 4 : AD Sampel 12: CD
Sampel 5 : BA Sampel 13: DA
Sampel 6: BB Sampel 14: DB
Sampel 7: BC Sampel 15: DC
Sampel 8: BD Sampel 16: DD
Semuanya ada 4
2
= 16 buah sampel.
Secara umum : jika dari populsi berukuran N diambil sampel berukuran n
dengan pengembalian, maka semuanya ada N
n
buah sampel yang mungkin
diambil.
2) Sampling tanpa pengembalian
Contoh : Misalkan populasi beranggotakan N = 5 terdiri atas A,B,C, D, E.
Sampel berukuran n = 2 akan diambil dari populasi itu dengan cara tanpa
pengembalian. Maka didapat :
Sampel 1 : AB Sampel 6 : BD
Sampel 2 : AC Sampel 7 : BE
Sampel 3: AD Sampel 8 : CD
Sampel 4 : AE Sampel 9 : CE
Sampel 5 : BC Sampel 10 : DE
Semuanya ada 10 buah sampel yang berlainan.
Jika N = 4 dengan anggota A,B,C,D dan n = 3, maka semuanya ada 4
buah sampel yang berlainan ialah ABC, ABD, ACD, BCD.
Secara umum : banyak sampel berukuran n yang dapat diambil (dengan cara
tanpa pengembalian) dari sebuah populasi berukuran N adalah :
=
!
!( − )!
Beberapa cara sampling yang mungkin dapat digunakan untuk keadaan
tertentu agar diperoleh sampel yang representative yaitu :
a). Sampling seadanya
Pengambilan sebagian dari populasi berdasarkan seadanya data atau
kemudahannya mendapatkan data tanpa perhitungan apapun mengenai
Modul statistika dasar
144
derajat representative. Ini mengakibatkan bahwa kesimpulan yang ditarik
sangat bersifat kasar dan sementara.
b). Sampling purposif
Sampling purposif (sampling pertimbangan) terjadi apabila pengambilan
sampel dilakukan berdasarkan pertimbangan perorangan atau pertimbangan
peneliti.
c). Sampling peluang
jika peluang digunakan ketika pengambilan sampel dilakukan, maka kita
melakukan sampling peluang. Sampel yang didapat dinakan sampel peluang
yaitu sebuah sampel yang anggota-anggotanya diambil dari populasi
berdasarkan peluang yang diketahui
D. BEBERAPA MACAM SAMPLING UNTUK MENDAPATKAN SAMPEL
REPRESENTATIF
Untuk populasi yang heterogen harus digunakan sampling lain dari
sampling di atas yaitu sampling petala, sampling proporsional, sampling klaster,
dan sampling area.
Sampling petala. Jika populasi heterogen, biasanya akan lebih baik dibuat
menjadi beberapa strata atau petala atau lapisan. Pembuatan petala ditentukan
berdasarkan karakteristik tertentu sedemikian sehingga petala itu menjadi
homogen. Dari setiap petala lalu diambil secara random anggota-anggota yang
diperlukan, atau dengan kata lain dilakukan pengrandoman di dalam setiap petala.
Gabungan antara anggota-anggota yang didapat akan membentuk sebuah sampel
petala.
Sampling petala biasanya diperbaiki dengan menggunakan cara
proporsional. Dengan ini dimaksudkan bahwa banyak anggota dari setiap petala
diambil sebanding dengan ukuran tiap petala. Cara ini dinamakan cara sampling
random proporsional dan sampelnya dinamakan sampel random proporsional.
Sampling klaster. Dalam sampling ini, populasi dibagi-bagi menjadi
beberapa kelompok atau klaster. Secara random klaster-klaster yang diperlukan
diambil dengan proses pengrandoman. Setiap anggota yang berada di dalam
Modul statistika dasar
145
klaster-klaster yang diambil secara random tadi merupakan sampel yang
diperlukan.
Selain sampling yang diuraikan di atas masih ada lagi yang lainnya ialah :
a). Sampling sistematik. Dalam sampling sistematik, anggota sampel diambil dari
populasi pada jarak interval waktu, ruang atau urutan yang uniform. Jika
populasi berukuran N dan sampel beranggotakan n, maka jarak interval
besarnya (N/n). dengan demikian didapatkan n buah interval dan dari tiap buah
interval diambil sebuah anggota. Pengambilan anggota pertama yang ada di
dalam interval pertama dilakukan secara random. Anggota-anggota
selanjutnya diambil pada jarak setiap (N/n).
b). Sampling ganda. Jika untuk menyimpulkan populasi dilakukan sampling, maka
pada umumnya hanya sebuah sampel berukuran tertentu dan diambil dengan
cara tertentu pula yang biasa digunakan. Sampling yang demikian disebut
sampling tunggal. Sering ternyata sampling tunggal kurang efisien karena bisa
terjadi terlalu banyak anggota yang diambil dan karenanya menyebabkan
pemborosan biaya dan waktu. Untuk mengatasi hal ini digunakan sampling
ganda. Dalam sampling ganda, penelitian penelitian dilakukan dimulai dengan
menggunakan sebuah sampel yang ukurannya relative kecil. Berdasarkan ini
kesimpulan mengenai populsai diadakan.
c). Sampling multiple. Dalam hal ini pengambilan sampel dilakukan lebih dari dua
kali dan tiap kali digabungkan menjadi sebuah sampel. Pada tiap gabungan,
analisis dilakukan lalu kesimpulan diadakan dan sampling berhenti apabila
hasilnya sudah memenuhi criteria yang telah direncanakan.
d). Sampling sekuensial. Sampling ini sebenarnya juga sampling multiple.
Perbedaannya ialah dalam sampling sekuensial tiap anggota sampel diambil
satu demi atu dan pada tiap kali selesai mengambil anggota, analisis dilakukan
lalu berdasarkan ini kesimpulan diadakan : apakah sampling berhenti ataukah
dilanjutkan. Tentu saja setiap anggota yang diambil disatukan dengan anggota-
anggota yang diambil terlebih dahulu sebelum kesimpulan diadakan pada
tingkat itu.
Modul statistika dasar
146
E. KEKELIRUAN SAMPLING DAN KEKELIRUAN NON SAMPLING
Dalam penelitian ada dua macam kekeliruan yang pokok yang bisa terjadi,
ialah kekeliruan sampling dan kekeliruan non-sampling.
Kekeliruan non-sampling. Kekeliruan ini bisa terjadi dalam setiap penelitian,
apakah itu berdasarkan sampling ataukah berdasarkian sensus. Beberapa
penyebab terjadinya kekeliruan non-sampling adalah :
a. Populasi tidak didefinisikan sebagaimana mestinya.
b. Populasi yang menyimpang dari populasi yang seharusnya dipelajari.
c. Kuesener tidak dirumuskan sebagaimana mestinya.
d. Istilah-istilah telah didefinisikan secara tidak tepat atau telah digunakan secara
tidak konsisten.
e. Para responden tidak memberikan jawab yang akurat, menolak untuk
menjawab atau tidak ada di tempat ketika petugas dating untuk melakukan
wawancara.
Kekeliruan non-sampling bisa terjadi pada waktu mencatat data, melakukan
tabulasi dan melakukan perhitungan-perhitungan.
Kekeliruan sampling. Kekeliruan ini timbul disebabkan oleh kenyataan
adanya pemeriksaan yang tidak lengkap tentang populasi dan penelitian hanya
dilakukan berdasarkan sampel. Jelaslah bahwa penelitian terhadap sampel
yang diambil dari sebuah populasi dan penelitian terhadap populasi itu sendiri,
kedua penelitian dilakukan dengan prosedur yang sama, hasilnya akan
berbeda. Perbedaan antara hasil sampel dan hasil yang akan dicapai jika
prosedur yang sama yang digunakan dalam sampling juga yang digunakan
dalam sensus dinamakan kekeliruan sampling.
2. DISTRIBUSI SAMPLING
A. DISTRIBUSI RATA-RATA
Misalkan kita mempunyai sebuah populasi berukuran terhingga N dengan
parameter rata-rata dan simpangan baku . Dari populasi ini diambil sampel
random berukuran n. jika sampling dilakukan tanpa pengembalian, kita tahu
semuanya ada buah sampel yang berlainan. Untuk semua sampel-sampel yang
didapat masing-masing dihitung rata-ratanya. Dengan demikian diperoleh buah
Modul statistika dasar
147
rata-rata. Anggap semua rata-rata ini sebagai data baru, jadi di dapat kumpulan data
yang terdiri atas rata-rata dari sampel-sampel. Dari kumpulan ini kita dapat
menghitung rata-rata dan simpangan bakunya. Jadi didapat rata-rata daripada rata-
rata diberi symbol dan simpangan baku daripada rata-rata diberi symbol .
Contoh : diberikan sebuah populasi dengan N = 10 yang ditanya :
98,99,97,98,99,98,97,97,98,99. Jika dihitung, populasi ini mempunyai = 98 dan
=0,78
Diambil sampel berukuran n = 2. Semuanya ada =45 buah sampel. Untuk
setiap sampel kita hitung rata-ratanya. Dan dalam tiap sampel dan rata-rata tiap
sampel diberikan dalam daftar berikut ini.
DAFTAR A1
SEMUA SAMPEL BERUKURAN n = 2 DAN RATA-RATANYA
DIAMBIL DARI POPULASI UKURAN N = 10
SAMPEL RATA2 SAMPEL RATA2 SAMPEL
RATA2
(98,99) 981/2 (99,98) 981/2 (99,98) 981/2
(98,97) 971/2 (99,99) 99 (99,97) 98
(98,98) 98 (97,98) 971/2 (99,97) 98
(98,99) 981/2 (97,99) 98 (99,98) 981/2
(98,98) 98 (97,98) 971/2 (99,99) 99
(98,97) 971/2 (97,97) 97 (98,97) 971/2
(98,97) 971/2 (97,97) 97 (98,97) 971/2
(98,98) 98 (97,98) 971/2 (98,98) 98
(98,99) 981/2 (97,99) 98 (98,99) 981/2
(99,97) 98 (98,99) 981/2 (97,97) 97
(99,98) 981/2 (98,98) 98 (97,98) 971/2
Modul statistika dasar
148
(99,99) 99 (98,97) 971/2 (97,99) 98
(99,98) 981/2 (98,97) 971/2 (97,98) 971/2
(99,97) 98 (98,98) 98 (97,99) 98
(99,97) 98 (98,99) 981/2 (98,99) 981/2
Jumlah semua rata-rata = 4410
Jumlah ke-45 buah rata-rata = 4.410. Maka rata-ratanya untuk ke-45 rata-rata
ini =
.
=98. Jadi = 98.
Simpangan baku ke-45 rata-rata di atas juga dapat dihitung. Besarnya adalah :
= . .
Tetapi rata-rata populasi =98 dan simpangan baku =0,78. Selanjutnya
kita hitung :
=
,

= 0,52.
Ternyata bahwa berlaku :
=
=

(A1)
Jika N cukup besar dibandingkan terhadap n, maka barlaku hubungan :
=
=

(A2)
Untuk penggunaan rumus di atas cukup baik apabila (n/N) ≤5%. Dari uraian
di atas didapat : jika sampel random berukuran n diambil dari sebuah populasi
berukuran N dengan rata-rata dan simpangan baku , maka distribusi rata-rata
sampel mempunyai rata-rata dan simpangan baku seperti pada rumus A1 jika (n/N)
> 5%, seperti dalam rumus A2 jika (n/N)≤5%. dinamakan kekeliruan standar
Modul statistika dasar
149
rata-rata atau kekeliruan baku atau pula galat baku rata-rata. Ini merupakan
ukuran variasi rata-rata sampel sekitar rata-rata populasi .
mengukur besarnya perbedaan rata-rata yang diharapkan dari sampel ke
sampel.
Dari daftar A1 kita dapat menghitung frekuensi rata-rata dan juga
peluangnya. Untuk rata-rata 97 misalnya, frekuensinya f = 3 sedangkan peluangnya
p = 3/45 = 1/15. Frekuensi dan peluang untuk rata-rata lainnya dapat dihitung.
Hasilnya dapat dilihat dalam daftar A2.
DAFTAR A2
FREKUENSI DAN PELUANG RATA-RATA
DARI DAFTAR A1
Rata-rata Frekuensi Peluang
97 3 1/15
971/2 12 4/15
98 15 1/3
981/2 12 4/15
99 3 1/15
Jumlah 45 1
Kita lihat bahwa rata-rata untuk semua sampel membentuk sebuah distribusi
peluang. Untuk penggunaanya, kita perlu mengetahui bentuk atau model distribusi
tersebut. Ternyata bahwa untuk ini berlaku sebuah dalil yang dinamakna dalil limit
pusat seperti tertera di bawah ini :
Jika sebuah populasi mempenyai rata-rata dan simpangan baku yang besarnya
terhingga, maka untuk ukuran sampel random n cukup besar, distribusi rata-rata
sampel mendekati distribusi normal dengan rata-rata = dan simpangan baku
=

. Perhatikan bahwa dalil di muka berlaku untuk distribusig model populasi
asalkan simpangan bakunya terhingga besarnya.jadi, bagaimanapun model populasi
yang disampel, asal saja variansnya terhingga, maka rata-rata sampel akan
Modul statistika dasar
150
mendekati distribusi normal. Pendekatan kepada normal ini makin baik jika ukuran
sampel n makin besar. Biasanya, untuk ≥30 pendekatan ini sudah mulai
berlaku.
Apabila populasi yang disampel sudah berdistribusi normal, maka rata-rata sampel
juga berdistribusi normal meskipun ukuran sampel n < 30.
Distribusi normal yang didapat dari distribusi rata-rata perlu distandarkan agar
daftar distribusi normal baku dapat digunakan. Ini perlu untuk perhitungan-
perhitungan. Untuk ini digunakan transformasi.
=

(A3)
Contoh : Tinggi badan mahasiswa rata-rata mencapai 165 cm dan simpangan
baku 8,4 cm. Telah diambil sebuah sampel random terdiri atas 45
mahasiswa. Tentukan berapa peluang tinggi rata-rata ke-45 mahasiswa
tersebut :
a). antara 160 cm dan 168 cm
b). paling sedikit 166 cm
Jawab : Jika ukuran populasi tidak dikatakan besarnya, selalu dianggap cukup
besar untuk berlakunya teori. Ukuran sampel n = 45 tergolong sampel
besar sehingga dalil limit pusat berlaku. Jadi rata-rata untuk tinggi
mahasiswa akan mendekati distribusi normal dengan :
Rata-rata =165
Simpangan baku =
,

=1,252
a). Dari rumus A3 dengan =160 didapat :
=
160−165
1,252
=−3,99 =
168−165
1,252
=2,40.
Penggunaan daftar distribusi normal baku memberikan luas kurva =
0,5 + 0,4918 = 0,9918.
Peluang tinngi rata-rata ke-45 mahasiswa antara 160 cm dan 168 cm
adalah 0,9918.
Modul statistika dasar
151
b). Rata-rata tinggi paling sedikit 166 cm memberikan angka z paling
sedikit =
,
=0,80.
Dari daftar normal baku, luas kurva = 0,5 – 0,2881 = 0,2119.
Peluang yang dicari = 0,2119.
Apabila dari populasi variansnya diketahui dan perbedaan antara rata-rata dari
sampel ke sampel diharapkan tidak lebih dari sebuah harga d yang ditentukan,
maka berlaku hubungan :

(A4)
Dari rumus A4 ini, ukuran sampel yang paling kecil sehubungan dengan
distribusi rata-rata, dapat ditentukan.
Contoh : Untuk contoh di atas, misalkan harga-harga dari sampel yang satu
dengan sampel lainnya diharapkan tidak mau lebih dari 1 cm. Jika populasi cukup
besar, maka :


,

≤1
Atau ≥70,58.
Paling sedikit perlu diambil sampel terdiri atas 71 mahasiswa.
B. DISTRIBUSI PROPORSI
Misalkan populasi diketahui berukuran N yang di dalamnya didapat peristiwa A
sebanyak Y di antara N. Maka didapat parameter proporsi peristiwa A sebesar =
(Y/N).
Dari populasi ini diambil sampel random berukuran n dan dimisalkan di dalamnya
ada peristiwa A sebanyak x. Sampel ini memberikan statistic proporsi peristiwa A
= x/n. Jika semua sampel yang mungkin diambil dari populasi itu maka didapat
sekumpulan harga-harga statistic proporsi. Dari kumpulan ini kita dapat
menghitung rata-ratanya, diberi symbol
/
dan simpangan bakunya diberi
symbol
/
.
Untuk ini ternyata bahwa, jika ukuran populasi kecil dibandingkan dengan ukuran
sampel, yakni (n/N) > 5%, maka :
Modul statistika dasar
152
/
=
/
=
( )
(A5)
Dan jika ukuran populasi besar dibandingkan dengan ukuran sampel, yakni (n/N) ≤5%
Maka :
/
=
/
=
( )
(A6)
/
dinamakan kekeliruan baku proporsi atau galat baku proporsi.
Untuk ukuran sampel n cukup besar, berlakulah sifat berikut : Jika dari populasi
yang berdistribusi binom dengan parameter untuk peristiwa A, 0 < < 1, diambil
sampel random berukuran n dimana statistic proporsi untuk peristiwa A = (x/n),
maka untuk n cukup besar, distribusi proporsi (x/n) mendekati distribusi normal
dengan parameter seperti dalam rumus A5 jika (n/N) > 5%, dan seperti dalam
rumus A6 jika (n/N) ≤5%.
Seperti dalam distribusi rata-rata, disinipun akan digunakan ≥30untuk memulai
berlakunya sifat di atas.
Untuk perhitungan, daftar distribusi normal baku dapat digunakan dan untuk itu
diperlukan transformasi :
=
/
(A7)
Jika perbedaan antara proporsi sampel yang satu dengan sampel yang lainnya
diharapkan tidak lebih dari sebuah harga d yang ditentukan, maka berlaku :
Modul statistika dasar
153
/

(A8)
Karena
/
mengandung factor dengan = populasi maka
rumus A8 berlaku jika parameter sudah diketahui besarnya. Jika tidak dapat
ditempuh cara conservative dengan mengambil harga kekeliruan baku atau galat
baku yang terbesar,
yaitu : (1− ) = .
Contoh :
Ada petunjuk kuat bahwa 10% anggota masyarakat tergolong ke dalam golongan A.
sebuah sampel random terdiri atas 100 orang telah diambil.
a. Tentukan peluangnya bahwa dari 100 orang itu akan ada paling sedikit 15 orang
dari golongan A.
b. Berapa orang harus diselidiki agar persentase golongan A dari sampel yang satu
dengan yang lainnya diharapkan berbeda paling besar dengan 2%?
Jawab : populasi yang dihadapi berukuran cukup besar dengan =0,10 1−
=0,90.
a. Untuk ukuran sampel 100, diantaranya paling sedikit 15 tergolong kategori A,
maka paling sedikit x/n = 0,15.
Kekeliruan bakunya adalah :
/
=
( )
=
, ,
= 0,03
Bilangan z paling sedikit =
, ,
,
=1,67
Dari daftar normal baku, luasnya = 0,5 – 0,4525 = 0,0475.
Peluang dalam sampel itu aka nada paling sedikit 15 kategori A adalah 0,0475.
b. Dari rumus A8 dengan =0,1 1− =0,9sedangkan d = 0,02, maka :
, ,
≤0,02 ≥225.
C. DISTRIBUSI SIMPANGAN BAKU
Seperti biasa kita mempunyai populasi berukuran N. diambil sampel-sampel
random berukuran n, lalu untuk tiap sampel dihitung simpangan bakunya, yaitu s.
Modul statistika dasar
154
dari kumpulan ini sekarang dapat dihitung rata-ratanya, diberi symbol dan
simpangan bakunya, diberi symbol .
Jika populasi berdistribusi normal atau hamper normal, maka distribusi
simpangan baku, untuk n besar biasanya ≥100, sangat mendekati distribusi
normal dengan :
=
=
√2
(A9)
Dengan = .
Transformasi yang diperlukan untuk membuat distribusi menjadi normal baku
adalah :
=

(A10)
Untuk populasi tidak berdistribusi normal dan untuk sampel berukuraj kecil, n
< 100, rumus-rumus sangat sulit dan karena penggunaannya tidak banyak.
Contoh : Varians sebuah populasi yang berdistribusi normal 6,25. Diambil sampel
berukuran 225. Tentukan peluang sampel tersebut akan mempunyai simpangan
baku lebih besar dari 3,5.
Jawab : Varians = 6,25. Ukuran sampel cukup besar, maka distribusi simpangan
baku mendekati distribusi normal dengan rata-rata =2,5 dan simpangan baku
=
,

=0,118.
Bilangan z untuk s = 3,5 adalah :
=
, ,
,
=8,47.
Praktis tidak terjadi sampel berukuran 225 dengan simpangan baku lebih dari 3,5.
D. DISTRIBUSI MEDIAN
Jika populasi berdistribusi normal atau hampir normal maka, untuk sampel random
berukuran ≥30, distribusi Median Me akan mendekati distribusi normal dengan
rata-rata dan simpangan baku
.
:
Modul statistika dasar
155
=
.
=
1,2533

(A11)
Dengan dan merupakan parameter populasi.
E. DISTRIBUSI SELISIH DAN JUMLAH RATA-RATA
Misalkan kita mempunyai dua populasi masing-masin berukuran dan
. Populasi ke satu mempunyai rata-rata dan simpangan baku sedangkan
populasi kedua mempunyai rata-rata dan simpangan baku . Dari setiap
populasi secara independen kita ambil sampel-sampel random berukuran dari
populasi kesatu dan berukuran dari populasi kedua. Untuk membedakan
populasi kesatu dimisalkan mempunyai variable X dan populasi kedua mempunyai
variable Y. dari sampel-sampel ini, seperti biasa dihitung rata-ratanya. Didapat
kumpulan rata-rata sampel :
, , . . . , dan , , . . . , dengan k = banyak sampel yang dapat diambil
dari populasi kesatu, dan r = banyak sampel yang dapat diambil dari populasi
kedua.
Kumpulan selisih rata-rata sampel akan membentuk distribusi selisih rata-
rata. Dari kumpulan ini, kita dapat menghitung rata-ratanya, diberi symbol
dan menghitung simpangan bakunya, diberi symbol . Ternyata bahwa, untuk
dan cukup besar dan sampel-sampel random diambil secara independen
satu sama lain, didapat hubungan :
= −
= +
(A12)
Modul statistika dasar
156
Kita juga dapat mengambil selisih rata-rata − dalam hal ini berlaku :
= −
= +
(A13)
Untuk ukuran-ukuran sampel cukup besar, maka selisih rata-rata −
akan mendekati distribusi normal dengan rata-rata dan simpangan baku seperti
pada rumus A12. Untuk membuat distribusi normal ini menjadi distribusi normal
baku digunakan transformasi.
=
( − ) −( − )
(A14)
Apabila dari dua kumpulan rata-rata sampel dengan I = 1, 2, . . . , k dan
dengan j = 1, 2, .. . , r, sekarang dibentuk jumlahnya, maka diperoleh jumlah
rata-rata sampel + . Seperti di atas dari kumpulan ini dapat dihitung rata-
ratanya, diberi symbol dan simpangan bakunya diberi symbol . Untuk
sampel-sampel random yang independen, berlaku :
= +
= +
(A15)
Distribusi jumlah rata-rata ini, untuk sampel-sampel berukuran cukup
besar, akan mendekati distribusi normal dengan parameter rata-rata dan simpangan
baku seperti dalam rumus A15. Untuk membuat menjadi normal baku perlu
digunakan transformasi.
=
( + ) −( + )
(A16)
Contoh : Rata-rata tinggi mahasiswa laki-laki 163 cm dan simpangan bakunya 5,2
cm, sedangkan untuk mahasiswa perempuan parameter tersebut
Modul statistika dasar
157
berturut-turut 152 cm dan 4,9 cm. Dari kedua kelompok mahasiswa itu
masing-masing diambil sebuah sampel random, secara independen
berukuran sama, ialah 140 orang. Berapa peluang rata-rata tinggi
mahasiswa laki-laki paling sedikit 10 cm lebihnya dari rata-rata tinggi
mahasiswa perempuan?
Jawab : Misalkan masing-masing menyatakan rata-rata tinggi dari sampel
untuk mahasiswa laki-laki dan perempuan. Yang ditanyakan adalah
peluang − paling sedikit 10 cm. Dari yang diketahui, didapat
= =163 cm, = =152 , = =5,2 , = =
4,9 dan = = 140. Menurut reori di muka − berdistribusi
normal dengan rata-rata = (163 - 152) cm = 11 cm dan
Simpangan baku =
( , )
+
( , )
=0,6038cm.
Menurut rumus A14, maka =
,
=−1,66.
Luas daerah normal baku yang diperlukan adalah 0,5 + 0,4515 = 0,9515.
Jadi peluang yang dicari = 0,9515.
F. DISTRIBUSI SELISIH PROPORSI
Selisih proporsi − dapat dibentuk sehingga terdapat kumpulan
selisih proporsi. Dari kumpulan ini dapat dihitung rata-ratanya, diberi symbol
dan simpangan bakunya, diberi symbol , dengan sp = − = selisih antara
proporsi sampel kesatu dan proporsi sampel kedua. Ternyata untuk ini berlaku :
= −
=
( )
+
( )
(A17)
Untuk ukuran-ukuran sampel dan , cukup besar biasanya ≥
30 ≥30, maka distribusi selisih proporsi ini akan mendekati distribusi
normal dengan parameter seperti tertera pada rumus A17. Agar supaya distribusi
normal ini menjadi distribusi normal baku maka diperlukan transformasi.
Modul statistika dasar
158
=
− −( − )
(A18)
G. DISTRIBUSI SAMPLING LAINNYA
Misalkan kita punya sebuah populasi yang berdistribusi normal atau
hamper normal dengan rata-rata dan simpangan baku . Dari populasi tersebut
diambil sampel random berukuran n lalu dihitung rata-rata dan simpangan baku
s.
Sehubungan dengan ini, didapat dua hal :
1. Statistic t, yang ditentukan oleh :
=
̅ −
/ √
(A19)
Ternyata berdistribusi student dengan derajat kebebasan = −1.
2. Statistic χ
2
yang ditentukan oleh :
χ
2
=
( )
=
∑( ̅ )
(A20)
Dengan , I = 1, 2, …, n merupakan data dalam sampel, akan berdistribusi
chi-kuadrat dengan derjat kebebasan = −1.
Dari sampel kesatu simpangan baku dihitung, dan demikian pula
simpangan baku dari sampel kedua. Kita bentuk statistic F yang ditentukan
oleh :
=
/
/
(A21)
Ternyata bahwa statistic F ini berdistribusi F dengan dk pembilang
= −1dan dk penyebut = −1.
Modul statistika dasar
159
SOAL LATIHAN
1. Populasi yang terdiri atas 3000 obyek, 1000 di antaranya bernilai 0, dan
sisanya bernilai 1. Berapa dan ? Diambil 100 buah sampel random
yang masing-masing berukuran 10 lalu dihitung rata-rata tiap sampel.
Berapa diharapkan harga rata-rata dan varians rata-rata 100 sampel ini?
2. Simpangan baku berat anak laki-laki berumur 15-20 tahun besarnya 3,8 kg.
Diambil semua sampel random yang masing-masing berukuran 230 dan
lalu varians tiap sampel dihitung. Tentukan :
a. Rata-rata dan varians untuk distribusi sampling simpangan baku.
b. Ada berapa % dari sampel-sampel itu yang mempunyai simpangan baku
lebih dari 4,5 kg?
3. Pengalaman mencatat bahwa 65% dari penduduk ternyata menyenangi
pemimpin A. Dua buah sampel random telah diambil masing-masing
berukuran 250. Tentukan bagaimana peluangnya bahwa kedua sampel itu
akan memperlihatkan perbedaan persentase lebih dari 12% yang
menyenangi pemimpin A.
4. Diberikan dua buah populasi dengan data populasi I : 3, 2, 3, 5, 4, 8. Data
populasi II : 10, 12, 15, 10.
Dari populasi I diambil semua sampel random berukuran 3 dan dari
populasi II semua yang berukuran dua. Tulislah semua sampelnya, lalu :
a. Hitung rata-rata kedua populasi
b. Hitung rata-rata distribusi sampling rata-rata dari kedua populasi itu.
Sebut ini dan .
c. Hitung
̅
− dan bandingkan dengan selisih rata-ratapopulasi I dan
populasi II. Apa yang nampak?
Berlakukah rumus A12?
d. Bagaimana untuk
̅
+ ?
Berlakukah rumus A

Sign up to vote on this title
UsefulNot useful