Professional Documents
Culture Documents
Disusun untuk memenuhi salah satu tugas mata kuliah Probabilitas dan Statistik
Disusun Oleh :
Nama : Hafiz Muhammad.
NRP / Kelas : 15-2013-056 / B
Jurusan Teknik Informatika
Fakultas Teknologi Industri
Institut Teknologi Nasional Bandung
2014
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
KATA PENGANTAR
Puji syukur kehadirat Allah SWT, karena berkat limpahan rahmat dan karunia-Nya penyusun
dapat menyelesaikan makalah mengenai makalah mata kuliah probabilitas dan statistika tepat
pada waktunya.
Makalah ini disusun untuk memenuhi salah satu tugas mata kuliah Probabilitas dan
Statistika. Dalam penyusunan makalah ini penyusun memperoleh banyak pengetahuan dari
berbagai sumber salah satunya pada kegiatan perkuliahan di ITENAS.
Penyusun menyadari makalah yang disusun ini jauh dari kata sempurna namun penyusun
berharap semoga makalah ini dapat berguna untuk berbagai pihak. Oleh sebab itu penyusun
mengharapkan kritik dan saran dari para pembaca pada umumnya dan secara khusus dari Dosen
Probabilitas dan Statistika ITENAS guna perbaikan di masa yang akan datang.
Akhir kata penyusun ucapkan terimakasih.
Bandung, 14 Mei 2014
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
DAFTAR ISI
Kata Pengantar ................................................................................................................................i
Daftar Isi .........................................................................................................................................ii
Statistika dan Statistik .....................................................................................................................1
Penyajian Data ................................................................................................................................8
Distribusi Frekuensi ...................................................................................................................... 27
Skewness ....................................................................................................................................... 32
Probabilitas ................................................................................................................................... 34
Distribusi ....................................................................................................................................... 38
Estimasi ......................................................................................................................................... 44
Uji Hipotesis ................................................................................................................................. 47
Analisis Regresi Linier ................................................................................................................. 57
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
A. Statistika dan Statistik
1. Statistika
Statistika adalah ilmu pengetahuan yang berhubungan dengan cara-cara
pengumpulan dan penyusunan data, pengolahan data, dan penganalisisan data, serta
penyajian data berdasarkan kumpulan dan analisis data yang dilakukan. Salah satu ilmu
yang mendasari dalam mempelajari statistika adalah peluang atau probabilitas.
Berdasarkan kegiatannya, statistika dikelompokkan menjadi dua macam, yaitu
Statistika deskriptif (statistika deduktif) dan statistika inferensi (statistika induktif).
1.1 Statistika deskriptif adalah statistika yang meliputi kegiatan-kegiatan pengumpulan,
penyajian, penyederhanaan atau penganalisisan, dan penentuan ukuran-ukuran khusus
dari suatu data tanpa penarikan kesimpulan. Sedangkan,
1.2 Statistika inferensi adalah ilmu mengenai penarikan kesimpulan dan pengambilan
keputusan tentang makna statistik yang telah dihitung.
2. Statistik
Statistik adalah hasil-hasil pengolahan dan analisis data. Statistik dapat berupa
mean, modus, median, dan sebagainya. Statistik dapat digunakan untuk menyatakan
kesimpulan data berbentuk bilangan yang disusun dalam bentuk tabel atau diagram yang
menggambarkan karakteristik data.
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
A. Data dan Datum
1. Data
Data adalah suatu bahan material atau inmaterial yang kaya kandungan informasi atau
disebut juga bahan mentah-original, natural dari bahan apa pun yang diolah dengan pola
tertentu agar menjadi informasi. Data juga dapat dikatakan sebagai sesuatu yang
memerlukan penetapan sebagai data, pengolahan, dan analisa untuk kepentingan
pendidikan. Data itu bersifat individual, dan ketika data dipecah maka data tersebut akan
menunjukkan kedatumannya.
2. Datum
Datum adalah karakter data yang melekat dalam konteks individual. menunjukkan
adanya suatu sifat data tunggal, adanya menyatu dengan ketunggalan. Datum merupakan
elemen utama peneliti dalam menentukan penelitiannya, berangkat dari kedatuman itu
sendiri ataupun masalah-masalah yang muncul dari karakter kedatuman itu sendiri.
Datum juga merupakan kapasitas, potensi, kebiasaan yang ada pada individu, dan
merupakan ciri dari kedatuman itu sendiri yang tidak dimiliki datum yang lain. Datum
berpotensi atau berkemungkinan terjadi masalah jika berhubungan dengan datum yang
lain. contoh: spidol dikatakan sebagai datum. jika spidol dipakai di papan tulis, maka
spidol akan berfungsi pada papan. sehingga kedatuman spidol itu sendiri akan berubah
fungsi ketika ia dihubungkan dengan papan tersebut.
Sehingga, data itu dapat juga dikatakan sebagai kumpulan datum-datum yang
dalam analisis manapun diperhitungkan secara individual.
contoh: Si A adalah datum dari mahasiswa PGPAUD
3. Pembagian Data
3.1 Jenis Data Menurut Cara Memperolehnya
1. Data Primer
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Data Primer adalah secara langsung diambil dari objek, atau objek penelitian oleh
peneliti perorangan maupun organisasi. Data primer disebut juga data asli atau data
baru. Contoh: Mewawancarai langsung penonton bioskop 21 untuk meneliti
preferensi konsumen bioskop.
2. Data Sekunder,
Merupakan data yang didapat tidak secara langsung dari objek
penelitian.
Peneliti mendapatkan data yang sudah jadi yang dikumpulkan oleh pihak lain dengan
berbagai cara atau metode baik secara komersial maupun non komersial. Data
sekunder disebut juga data tersedia. Contohnya adalah pada
peneliti yang
menggunakan data statistik hasil riset dari surat kabar atau majalah.
3.2 Macam-Macam Data Berdasarkan Sumber Data
1. Data Internal, adalah data yang menggambarkan situasi dan kondisi pada
suatu organisasi secara internal. Misal : data keuangan, data pegawai, data
produksi, dsb.
2. Data Eksternal, adalah data yang menggambarkan situasi serta kondisi yang ada
di luar organisasi. Contohnya adalah data jumlah penggunaan suatu produk
pada konsumen, tingkat preferensi pelanggan, persebaran penduduk, dan lain
sebagainya.
3.3 Klasifikasi Data Berdasarkan Jenis Datanya
1. Data Kuantitatif, adalah data yang dipaparkan dalam bentuk angka-angka.
Misalnya adalah jumlah pembeli saat hari raya idul adha, tinggi badan siswa kelas
3 ips 2, dan lain-lain.
2. Data Kualitatif, adalah data yang disajikan dalam bentuk kata-kata yang
mengandung makna. Contohnya seperti persepsi konsumen terhadap botol
air minum dalam kemasan, anggapan para ahli terhadap psikopat dan lain-lain.
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
D. Pembagian Jenis Data Berdasarkan Sifat Data
1. Data Diskrit, adalah data yang nilainya adalah bilangan asli. Contohnya
adalah berat badan ibu-ibu pkk sumber ayu, nilai rupiah dari waktu ke
waktu, dan lain sebagainya.
2. Data Kontinu, adalah data yang nilainya ada pada suatu interval tertentu atau
berada pada nilai yang satu ke nilai yang lainnya. Contohnya
penggunaan kata sekitar, kurang lebih, kira-kira, dan sebagainya.
Probabilitas dan Statistika
Hafiz Muhammad S (15-2013-056)
4. Skala Pengukuran
Salah satu aspek penting dalam memahami data untuk keperluan analisis
terutama statistika inferensia adalah Skala Pengukuran. Secara umum terdapat 4
tingkat/jenis skala pengukuran yaitu :
4.1 Skala nominal
Skala nominal adalah skala yang hanya mempunyai ciri untuk membedakan skala
ukur yang satu dengan yang lain. Contoh skala nominal seperti tabel dibawah ini
Jenis dan Jumlah buah-buahan yang
Diproduksi suatu Daerah pada Tahun 1998
Jenis Buah-Buahan
Pepaya
Mangga
Apel
Duku
Manggis
Sumber: Data Buatan
Probabilitas dan Statistika
Jumlah
2 ton
1,5 ton
1 ton
1,4 ton
1,3 ton
Hafiz Muhammad (15-2013-056)
4.2 Skala Ordinal
Skala ordinal adalah skala yang selain mempunyai ciri untuk membedakan juga
mempunyai ciri untuk mengurutkan pada rentang tertentu. Contoh skala ordinal
seperti tabel dibawah ini :
Penilaian Anggota Kelompok Belajar
Bina Pintar
Kategori Nilai
Istimewa
Baik
Rata-rata
Kurang
Kurang sekali
Sumber : Data
Buatan
4.3 Skala Interval
Banyaknya
6 orang
18 orang
15 orang
7 orang
0 orang
Skala interval adalah skala yang mempunyai ciri untuk membedakan,
mengurutkan dan mempunyai ciri jarak yang sama. Contoh, suhu tertinggi pada bulan
Desember dikota A, B dan C berturut-turut adalah 28, 31 dan 20 derajat Fahrenheit.
Kita dapat membedakan dan mengurutkan besarnya suhu, sebab satu derajat
Fahrenheit merupakan suatu besaran yang tetap, namun pada saat suhu menunjukkan
nol derajat Fahrenheit tidak berarti tidak adanya panas pada kondisi tersebut. Hal ini
dapat dijelaskan, misalnya kota A bersuhu 30 derajat Fahrenheit dan kota B bersuhu
60 derajat Fahrenheit, tidak dapat dikatakan bahwa suhu dikota B dua kali lebih panas
dari pada suhu dikota A, karena suhu tidak mempunyai titik nol murni (tulen).
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
4.4 Skala ratio
Skala ratio adalah skala yang mempunyai 4 ciri yaitu membedakan, mengurutkan,
jarak yang sama dan mempunyai titik nol yang tulen (berarti). Contoh : Pak Asmuni
mempunyai uang nol rupiah, artinya pak Asmuni tidak mempunyai uang.
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
5. PENYAJIAN DATA
Secara garis besar ada dua cara penyajian data yaitu dengan tabel dan grafik. Dua cara
penyajian data ini saling berkaitan karena pada dasarnya sebelum dibuat grafik data tersebut
berupa tabel. Penyajian data berupa grafik lebih komunikatif.
Dilihat dari waktu pengumpulannya, dikenal dua jenis data yaitu :
Cross section data adalah data yang dikumpulkan pada suatu waktu tertentu.
Data berkala adalah data yang dikumpulkan dari waktu ke waktu. Dengan data
berkala dapat dibuat garis kecenderungan atau trend.
Penyajian data dengan tabel
Tabel atau daftar merupakan kumpulan angka yang disusun menurut kategori atau
karakteristik data sehingga memudahkan untuk analisis data.
Ada tiga jenis tabel yaitu :
Tabel satu arah atau satu komponen adalah tabel yang hanya terdiri atas satu kategori
atau karakteristik data. Tabel berikut ini adalah contoh tabel satu arah.
Banyaknya Pegawai Negeri Sipil
Menurut Golongan Tahun 1990
Golongan
I
II
III
IV
Jumlah
Banyaknya (orang)
703.827
1.917.920
309.337
17.574
2.948.658
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Sumber : BAKN, dlm Statistik Indonesia,
1986
Tabel dua arah atau dua komponen adalah tabel yang menunjukkan dua kategori atau
dua karakteristik. Tabel berikut ini adalah contoh tabel dua arah.
Jumlah Mahasiswa UPH menurut
Fakultas dan Kewarganegaraan 1995
Fakultas WNI WNA Jumlah
Fak. Ekonomi
Fak. Teknologi Industri
Fak. Seni Rupa & Design
Fak. Pasca Sarjana
Jumlah
Sumber : Data Buatan
1850
1320
530
250
3950
40
10
5
10
65
1890
1330
535
260
4015
Tabel tiga arah atau tiga komponen adalah tabel yang menunjukkan tiga kategori atau
tiga karakteristik. Contoh tabel berikut ini.
Jumlah Pegawai Menurut Golongan,
Umur dan Pendidikan pada Departeman A
Tahun 2000
Golongan
Umur (tahun)
25 35 > 35
Pendidikan
Bukan
Sarjana
Sajana
I
II
III
IV
Jumlah
400
450
1200
0
2.050
500
520
2750
250
4020
900
970
1850
0
3720
0
0
2100
250
2350
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Sumber : Data Buatan
Penyajian data dengan grafik/diagram
Penyajian data dengan grafik dianggap lebih komunikatif karena dalam waktu singkat
dapat diketahui karakteristik dari data yang disajikan.
Terdapat beberapa jenis grafik yaitu :
Grafik garis (line chart)
Grafik garis atau diagram garis dipakai untuk menggambarkan data berkala. Grafik
garis dapat berupa grafik garis tunggal maupun grafik garis berganda.
Grafik batang / balok (bar chart)
Grafik batang pada dasarnya sama fugsinya dengan grafik garis yaitu untuk
menggambarkan data berkala. Grafik batang juga terdiri dari grafik batang tunggal
dan grafik batang ganda.
Grafik lingkaran (pie chart)
Grafik lingkaran lebih cocok untuk menyajikan data cross section, dimana data
tersebut dapat dijadikan bentuk prosentase.
Grafik Gambar (pictogram)
Grafik ini berupa gambar atau lambang untuk menunjukkan jumlah benda yang
dilambangkan.
Grafik Berupa Peta (Cartogram).
Cartogram adalah grafik yang banyak digunakan oleh BMG untuk menunjukkan
peramalan cuaca dibeberapa daerah.
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Contoh-contoh grafik :
30
25
20
15
10
5
0
Grafik Garis (pie chart)
DATA 1
DATA 2
1 2 3 4
Data
5 6 7 8
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
F
r
e
k
u
e
n
s
i
30
25
20
15
10
5
0
1
2
Grafik Batang (Bar Chart)
3 4 5
Frekuensi
DATA 1 DATA 2
6
7
8
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
D
a
t
a
Probabilitas dan Statistika
PIE CHART
Hafiz Muhammad (15-2013-056)
Rata-rata Hitung
Misal terdapat n buah data yang terdiri dari
x
1
,
x2, x3, x4,...., xn, maka rata-rata hitung n
data tersebut dilambangkan dengan x . Rata-rata hitung untuk data kuantitatif yang terdapat
dalam populasi tertentu berukuran n dinyatakan dengan
x x x x
x
x
1 2 3 4
n
n
x
x
i
secara lebih sederhana ditulis dengan notasi
Contoh
n
Nilai 10 mahasiswa yang mengikuti kuliah statistika di Jurusan Informatika ITENAS adalah
sebagai berikut: 56, 76, 34, 59, 62, 56, 68, 60, 73, dan 81.
Berdasarkan nilai 10 mahasiswa tersebut, rata-rata hitung nilai mahasiswa ditentukan dengan
x
humus
x
i
n
,
sehingga diperoleh
x
56
x
625
10
x
10
Adakalanya sebaran data terpola dan tersusun dalam bentuk sebagai berikut:
data
x
1 dengan frekuensi
f
1
data
x
2 dengan frekuensi
f
2
data
x
3 dengan frekuensi
f
3
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
............................................
...........................................
data
x
n dengan frekuensi
f
n
Jika data berbentuk seperti di atas, maka rata-rata hitung dapat ditentukan dengan menggunakan
rumus
f x
i i
x i
fi
i
Contoh
Tinggi badan 30 orang siswa SD disajikan pada tabel berikut ini
Tinggi Badan (dalam cm)
123,4
130,5
132,2
135,0
136,3
138,5
140,2
Jumlah
Banyaknya Siswa
6
4
2
5
6
4
3
30
Rata-rata hitung data di atas dapat ditentukan dengan menggunakan rumus:
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
x
n
f x
i i
i n
fi
i
x
(6
x
(4
x
(2
x
(5
x
(6
x136,3)
x138,5)
x140,2)
x
x
3
0
39
94,
2
3
30
(554) (
420,6)
x
Sifat-sifat rata-rata hitung
Jumlah simpangan, selisih antara tiap data dengan rata-rata hitungnya adalah 0 atau ditulis dalam
bentuk
Jumlah kuadrat dari simpangan-simpangan selalu lebih kecil atau sama dengan jumlah kuadrat
antara bilangan-bilangan tersebut dikurangi oleh suatu bilangan sebarang a. Secara matematis
ditulis dengan notasi
xi x
2
xi a
2
Jika
n
1 data mempunyai rata-rata x1, jika
n
2 data mempunyai rata-rata x2, Jika
n
3 data
mempunyai rata-rata
x
3 , Jika
n
4 data mempunyai rata-rata x4......., Jika
n
k data mempunyai
rata-rata
x
k maka rata-rata gabungan data tersebut adalah:
x
n1x1.n1x2.n x
3 3
3
n1 n2n
x
.......nkk
n
k
Misal M adalah rata-rata dugaan dan
d
1 xi M maka rata-rata hitungnya dinyatakan dengan
rumus
1
x M di
n
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Jika data tersusun dalam daftar distribusi frekuensi, maka rumus rata-rata hitung data dapat
ditentukan dengan beberapa cara.
Cara I :
f x
x
i i
fi
dimana
fi : frekuensi
xi : tanda kelas
Contoh
Tentukan rata-rata hitung data yang tersajikan dalam daftar distribusi frekuensi berikut ini:
Kelas Interval
fi
xi
fixi
13,0-17,4
17,5-21,9
22,0-26,4
26,5-29,9
31,0-35,4
35,5-39,9
40,0-44,4
2
3
1
10
28
18
13
15,2 30,4
19,7 59,1
24,2 24,2
28,7 287
33,2 929,6
37,7 678,6
42,2 551,2
sehingg
a
x
Jumlah
f x
i i
fi
2560,1
75 - 2560,1
75
= 34,14 (dibulatkan 2 desimal)
Cara II
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
f d
ii
x M
n
dimana
M : rata-rata dugaan
n : banyaknya data
fi: frekuensi
di:
x
i M
Contoh
Tentukan rata-rata hitung data berikut:
Kelas Interval
fi
xi
M
di xi M )
fidi
13,0-17,4
17,5-21,9
22,0-26,4
26,5-29,9
31,0-35,4
35,5-39,9
40,0-44,4
2
3
1
10
28
18
13
15,2 33,2
19,7 33,2
24,2 33,2
28,7 33,2
33,2 33,2
37,7 33,2
42,2 33,2
-18,0
-13,5
-9,0
-4,5
0
4,5
9,0
-36,0
-40,5
-9,0
-45
0
81
117
Jumlah
sehingga
75 - - - 108
x
3
3,
2
= 34,64
Cara III
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
x
M p
diman
a
f c
ii
n
M : rata-rata dugaan
n : banyaknya data
fi: frekuensi
c i : Angka Cooding
Perhatikan Contoh berikut:
Tentukan rata-rata hitung data yang tersajikan dalam daftar distribusi frekuensi berikut ini:
Kelas Interval
fi
xi
ci
fici
13,0-17,4
17,5-21,9
22,0-26,4
26,5-29,9
31,0-35,4
35,5-39,9
40,0-44,4
Jumlah
f c
2
3
1
10
28
18
13
75
15,2 -4
19,7 -3
24,2 -2
28,7 -1
33,2 0
37,7 1
42,2 2
-
-8
-9
-2
-10
0
18
26
15
sehingg
a
x
M p
ii
n
33,2
0,9
=
34,1
4.3 Rata-rata Ukur
Probabilitas dan Statistika Hafiz Muhammad (15-2013-056)
Misalkan terdapat n data yang terdiri
dari
sebagai
x1, x2,
x x
3, 4
,
..... , xn, maka rata-rata ukur didefinisikan
U n
x1.x2.
x x
3
.
4 .......x
5 yaitu akar pangkat n dari
perkalian
x1.x2.
x x
3
.
4
.
..... , xn.
Jika perbandingan tiap data berurutan tetap atau hampir tetap, rata-rata ukur lebih baik digunakan
daripada rata-rata hitung. Untuk bilangan-bilangan bernilai besar, rata-rata ukur dapat ditentukan
dengan rumus:
log U log xi
n
Jika data disusun dalam daftar distribusi frekuensi rata-r ata ukurnya dinyatakan dengan
menggunakan rumus
f log x
log U
dimana
i
fi
i
xi: tanda kelas
fi : frekuensi yang sesuai dengan
x
i
Contoh:
Dalam bentuk paling sederhana, jika diketahui 3 buah data masing-masing 2, 4, 8 maka rata-rata
ukurnya adalah:
U
n
3
.
4
x1.x2.x x
.....
..xn
, sehingga
U 3
U 3 64
U
(2)(4)(8)
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Rata-rata ukur untuk data yang tersusun dalam daftar distribusi dibawah ini adalah:
Kelas Interval
fi
xi
log xi
f log x
log U
13,0-17,4
17,5-21,9
22,0-26,4
26,5-29,9
31,0-35,4
35,5-39,9
40,0-44,4
Jumlah
filog xi
fi
14,60
2
3
1
10
28
18
13
75
42,56
28,4
15,2
19,7
24,2
28,7
33,2
37,7
42,2
21,19
1,18
1,30
1,38
1,46
1,52
1,58
1,63
i
2,36
3,90
1,38
14,60
42,56
28,44
21,19
114,43
i
log U
log U
log U
114,43
75
1,525733....
75
U
4.4 Rata-rata Harmonik
Misalkan terdapat n data yang terdiri dari
didefinisikan sebagai:
x1, x2,
x x
3, 4
,
..... , xn, maka rata-rata harmonik
H
n
1
1 1
x1x x
1
xn
atau
n
2 3
H
xi
Jika data tersusun dalam daftar distribusi frekuensi, maka rata-rata harmonik dinyatakan dengan:
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
fi
H
f
i
x
i
dimana
xi: tanda kelas
fi : frekuensi yang sesuai dengan
x
i
Secara umum, untuk sekumpulan data berlaku H U X
Contoh
Nilai 10 mahasiswa yang mengikuti kuliah statistika di Jurusan Informatika ITENAS adalah
sebagai berikut: 56, 76, 34, 59, 62, 56, 68, 60, 73, dan 81.
Rata-rata harmonik diperoleh
n
H
xi
10
H 1 1 1 1 1 1 1 1 1
H
H
10
10
0 169
H
Jika data disusun dalam daftar distribusi di bawah ini,
Kelas Interval
Probabilitas dan Statistika
fi
xi
fi
xi
Hafiz Muhammad (15-2013-056)
13,0-17,4
17,5-21,9
22,0-26,4
26,5-29,9
31,0-35,4
35,5-39,9
40,0-44,4
Jumlah
2
3
1
10
28
18
13
75
fi
H
f
15,2 0,13
19,7 0,15
24,2 0,04
28,7 0,35
33,2 0,84
37,7 0,48
42,2 0,31
2,3
maka rata-rata harmonik ditentukan oleh
75
i
x
i
sehingg
a
H
2,3
Rata-rata harmonik data di atas
adalah
4.5 Modus
H
Untuk menyatakan fenomena yang paling banyak terjadi atau paling banyak terdapat digunakan
ukuran modus dan dinotasikan dengan M o . Penggunaan modus secara tidak sadar sering
digunakan untuk menentukan rata-rata data yang bersifat kualitatif, Misalnya:
Kecelakaan lalu lintas di jalan raya pada umumnya disebabkan oleh kelalaian cara mengemudi.
Secara umum kelulusan siswa SMU di Indonesia nilainya di atas rata-rata.
Jumlah jamaah haji Indonesia tahun 1432 H, rata-rata berusia diatas 56 tahun
Hutan lindung di Indonesia sudah banyak yang terjamah oleh perambah hutan dan tidak
bertanggung jawab.
Jika data berupa data kuntintatif, maka modus ditentukan melalui cara menentukan frekuensi
terbanyak data tersebut. Sebaliknya jika data tersusun dalam daftar distribusi frekuensi, maka
modusnya ditentukan dengan menggunakan rumus:
Mo
b
b p
1
b
1 b2
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
dimana
M o : Modus
b
p
b 1
: batas bawah kelas modal yaitu kelas interval dengan frekuensi terbanyak
: panjang kelas interval
: frekuensi kelas modal dikurangi frekuensi kelas interval dengan tanda kelas yang lebih
kecil sebelum tanda kelas modal
b 2
: frekuensi kelas modal dikurangi frekuensi kelas interval dengan tanda kelas yang lebih
besar sesudah tanda kelas modal
Dibandingkan dengan ukuran yang lain, modus tidak tunggal adanya, sehingga sekelompok data
modusnya dapat lebih dari satu.
Contoh
Nilai 10 mahasiswa yang mengikuti kuliah statistika di Jurusan Informatika ITENAS adalah
sebagai berikut: 56, 76, 34, 59, 62, 56, 68, 60, 73, dan 81.
Modus data nilai di atas setelah data diurutkan 34, 56, 56, 59, 60, 62, 68, 73, 76, 81. Diperoleh
modusnya yaitu 56
2. Modus data yang tersusun dalam daftar distribusi frekuensi di bawah ini adalah:
Kelas Interval
13,0-17,4
17,5-21,9
22,0-26,4
26,5-29,9
31,0-35,4
35,5-39,9
40,0-44,4
Jumlah
Probabilitas dan Statistika
fi
2
3
1
10
28
18
13
75
xi
15,2
19,7
24,2
28,7
33,2
37,7
42,2
Hafiz Muhammad (15-2013-056)
b
Mob p
1
b
b12
12
Mo31
Mo 0,5454
Mo
Mo
4.6 Median
Median menentukan letak data setelah disusun menurut urutan monoton naik dan sesuai dengan
urutannya. Median sekelompok data dinotasikan dengan M e . Jika banyaknya data ganjil, maka
nilai median adalah data paling tengah setelah disusun menurut urutannya. Sebaliknya untuk data
yang banyaknya genap, setelah data disusun sesuai urutannya maka median sama dengan rata-
rata dua data tengah.
Untuk data yang telah disusun dalam daftar distribusi frekuensi, maka mediannya dinyatakan
dengan rumus:
1
n
F
Meb p 2
f
dimana
M e : Median
b
p
n
f
F
: batas bawah kelas median, yaitu kelas dimana median terletak
: panjang kelas interval
: banyaknya data
: frekuensi kelas median
: Jumlah semua frekuensi dengan tanda kelas lebih kecil dari tanda kelas median.
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Contoh
Nilai 10 mahasiswa yang mengikuti kuliah statistika di Jurusan Informatika ITENAS adalah
sebagai berikut: 56, 76, 34, 59, 62, 56, 68, 60, 73, dan 81.
Median data nilai di atas setelah data diurutkan 34, 56, 56, 59, 60, 62, 68, 73, 76, 81. Diperoleh
median 2 (karena banyaknya data genap yaitu 10 data)
Median data yang tersusun dalam daftar distribusi frekuensi di bawah ini adalah
Kelas Interval
13,0-17,4
17,5-21,9
22,0-26,4
26,5-29,9
31,0-35,4
35,5-39,9
40,0-44,4
Jumlah
Probabilitas dan Statistika
fi
2
3
1
10
28
18
13
75
xi
15,2
19,7
24,2
28,7
33,2
37,7
42,2
Hafiz Muhammad (15-2013-056)
Contoh Soal
Diketahui data :
49 46 43 25 40 16
21 47 60 46 63 28
50 56 25 43 37 53
32 27 46 41 58 36
42 55 58 44 66 56
21 55 74 44 51 39
R : Dmax Dmin
R = 74 16
= 58
Banyak kelas Interval
K = 1 +3,3 log n
K = 1 + 3,3 log 36
=
= 6
Tabel data
Panjang kelas interval
I =
I =
= 9,6
= 10
Kelas Interval
Fi
xi
Fi.xi
16 - 25
26 35
36 - 45
46 55
56 65
66 75
Probabilitas dan Statistika
5
3
10
10
6
2
20,5 102,5
30,5 91,5
40,5 405
50,5 505
60,5 363
70,5 141
Hafiz Muhammad (15-2013-056)
12
10
8
6
4
2
0
Histogram
o 16 0,5 = 15,5
o 25 + 0,5 = 25,5
25,5 35,5
Distribusi Frekuensi
total 36
19
45,5
55,5
65,5
75,5
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Kelas
Interval
< 15,5
< 25,5
< 35,5
< 45,5
< 55,5
< 65,5
< 75,5
Grafik Ogive
40
35
30
25
20
15
10
5
0
<15,5 <25,5
F
0
5
8
18
28
34
36
<35,5
<45,5
Kelas
Interval
> 15,5
> 25,5
> 35,5
> 45,5
> 55,5
> 65,5
> 75,5
<55,5 <65,5
F
36
31
21
11
5
3
0
<75,5
>15,5 >25,5 >35,5 >45,5 >55,5 >65,5 >75,5
Rata Rata Dikelompokkan
=
= 44,67
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Kelas Interval
16 - 25
26 35
36 - 45
46 55
56 65
66 75
5 20,5 102,5
3 30,5 91,5
10 40,5 405
10 50,5 505
6 60,5 363
2 70,5 141
Pengkodean
total 36 1608
Kelas
interval
16 25
5 20,5 102,5
-3
-15
26 55 3 30,5 91,5 -2 -6
36 45 10 40,5
46 71 10 50,5
405
505
-1
0
-10
0
56 79
66 87
total
Titik tengah
=
(
)
= 50,5 (
)
6 60,5
2 70,5
36
363
141
1054
1
2
6
4
-21
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Modus
45,5
(
) =
Median
= 45,5
(
(
)
)
Rata Rata
geometri
Kelas
interval
16 25
26 55
5
3
20,5 1,311
30,5 1,484
6,555
4,452
36 45 10 40,5 1,607
46 71 10 50,5 1,703
16,07
17,03
56 79
66 87
total
= 1,624
= 42,072
Probabilitas dan Statistika
6
2
36
60,5 1,781
70,5 1,848
10,686
3,696
58,498
Hafiz Muhammad (15-2013-056)
Rata Rata Harmonik
Kelas
interval
Fi
xi
Fi/xi
16 25
26 55
5
3
20,5
30,5
0,243
0,098
36 45 10
46 71 10
40,5
50,5
0,246
0,198
=
39,47
56 79
66 87
total
6
2
36
60,5
70,5
0,099
0,028
0,912
Ukuran Letak
Q1
(
(
Desil 7
)
Q3
(
) = 46,5
(
Persentil 65
)
) = 36,5
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
(
=
52,7
(
)
)
(
(
)
)
= 50,9
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Class Interval
16 25
26 35
36 45
46 55
56 65
66 75
5
3
10
10
6
2
36
20,5 420,25
30,5 930,25
40,5 1640,25
50,5 2550,25
60,5 3660,25
70,5 4970,25
102,5
91,5
405
505
363
141
1608
2101,25
2790,75
16402,5
25502,5
21961,5
9940,5
78699
Standar Deviasi
Probabilitas dan Statistika
Koefisien Variasi
= 30,937
Hafiz Muhammad (15-2013-056)
SKEWNESS
Skewness adalah suatu bilangan yang dapat menunjukkan miring atau tidaknya bentuk kurva
suatu distribusi frekuensi. Skewness adalah derajat ketidak simetrisan suatu distribusi. Jika kurva
frekuensi suatu distribusi memiliki ekor yang lebih panjang ke kanan (dilihat dari mean) maka
dikatakan positif dan jika ebaliknya maka negatif. Secara perhitungan, skewness adalah momen
ketiga terhadap mean.
Beberapa cara lain pengukuran kemiringan diantaranya :
- Memperhatikan hubungan antara rata-rata hitung, median dan modus.
- Menggunakan koefisien Pearson.
- Menggunakan momen ketiga.
- Menggunakan kotak diagram garis.
Batas nilai ukuran kemiringan diantaranya :
- Jika SK = 0 maka berbentuk simetris, sedangkan
- Jika SK > 0 maka positif, dan
- Jika SK < 0 maka negative
- Rumus Pearson
- Rumus Bowley
Probabilitas dan Statistika
atau
atau
Hafiz Muhammad (15-2013-056)
KURTOSIS
Keruncingan distribusi data adalah derajat atau ukuran untuk menentukan tinggi
rendahnya puncak suatu distribusi data terhadap distribusi normalnya data. Keruncingan
data tersebut dinamakan dengan Kurtosis.
- Jenis derajat keruncingan data diantaranya :
o Leptokurtis
Leptokurtis adalah distribusi data yang puncaknya relaatif tinggi.
o Mesokurtis
Mesokurtis adalah distribusi data yang puncaknya normal.
o Platikurtis
Platikurtis adalah distribusi data yang puncaknya terlalu rendah dan terlalu mendatar.
- Beberapa kondisi untuk menentukan keruncingan data :
Jika K = 0 maka mesokurtis
Jika K > 0 maka leptokurtis
Jika K < 0 maka platikurtis
- Rumus Kurtosis (K) adalah :
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
PROBABILITAS
Probabilitas adalah peluang atau kemungkinan suatu kejadian, suatu ukuran tentang
kemungkinan atau derajat ketidak pastian suatu peristiwa yang akan terjadi. Rentang probabilitas
antara 0 sampai dengan 1. Jika probabilitas suatu peristiwa adalah 0 maka peristiwa
tersebut
tidak mungkin terjadi. Sebaliknya jika probabilitas dari suatu peristiwa adalah 1 maka peristiwa
tersebut pasti terjadi.
Ada 3 cara pendekatan dalam probabilistik, yaitu :
- Pendekatan Klasik
Probabilitas/peluang yang menghitung banyaknya kemungkinan-kemungkinan pada
suatu kejadian berdasarkan frekuensinya.
Jika ada a kemungkinan yang dapat terjadi pada kejadian A dan ada b kemungkinan
yang dapat terjadi pada kejadian A, serta masing-masing kejadian mempunyai
kesempatan yang sama dan saling asing, maka probabilitas/peluang bahwa akan
terjadi a adalah:
P (A) = a/a+b ; dan peluang bahwa akan terjadi b adalah: P (A) = b/a+b
- Pendekatan Subyektif
Nilai probabilitas/peluang adalah tepat/cocok apabila hanya ada satu kemungkinan
kejadian terjadi dalam suatu kejadian ditentukan berdasarkan tingkat kepercayaan
yang bersifat individual (misalnya berdasarkan pengalaman).
- Pendekatan Empirik
Nilai probabilitas/peluang ditentukan atas dasar proporsi dari kemungkinan yang
dapat terjadi dalam suatu observasi/percobaan (pengumpulan data).
Jika pada data sebanyak N terdapat a kejadian yang bersifat A, maka
probabilitas/peluang akan terjadi A untuk N data adalah: P (A) = a/N
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Probabilitas disajikan dengan symbol P, sehingga P(A) menyatakan probabilitas bahwa
kejadian A akan terjadi dalam observasi atau percobaan tunggal, dengan 0 P(A) 1.
Jenis Kejadian Peluang :
- Berdasarkan peluang terjadinya.
o Kejadian Saling Meniadakan (Mutually Exclusive), yaitu kejadian yang tidak
dapat terjadi secara bersama-sama dengan kejadian lainnya.
o Kejadian Tidak Saling Meniadakan (Non-Mutually Exclusive), yaitu kejadian
yang dapat terjadi secara bersama-sama dengan kejadian lainnya.
- Berdasarkan pengaruh/hubungannya
o Kejadian Independen, yaitu apabila terjadi atau tidaknya suatu kejadian tidak
berpengaruh pada probabilitas/peluang kejadian yang lain.
o Kejadian Dependen, yaitu apabila terjadi atau tidaknya suatu kejadian
berpengaruh pada probabilitas/peluang kejadian yang lain.
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
A. Definisi Distribusi Poisson
Distribusi Poisson diberi nama sesuai dengan penemunya yaitu Siemon D.
Poisson. Distibusi ini merupakan distribusi probabilitas untuk variabel diskrit acak yang
mempunyai nilai 0,1, 2, 3 dst. Suatu bentuk dari distribusi ini adalah rumus pendekatan peluang
Poisson untuk peluang Binomial yang dapat digunakan untuk pendekatan probabilitas Binomial
dalam situasi tertentu.
Rumus Poisson dapat digunakan untuk menghitung probabilitas dari jumlah kedatangan,
misalnya : probabilitas jumlah kedatangan nasabah pada suatu bank pada jam kantor. Distribusi
Poisson ini digunakan untuk menghitung probabilitas menurut satuan waktu.
B. Rumus Pendekatan Peluang Poisson untuk Binomial
Pendekatan Peluang Poisson untuk Peluang Binomial dilakukan untuk mendekatkan
probabilitas probabilitas dari kelas sukses (x) dari n percobaan Binomial dalam situasi dimana n
sangat besar dan probabilitas kelas sukses (p) sangat kecil. Aturan yang diikuti oleh kebanyakan
ahli statistika adalah bahwa n cukup besar dan p cukup kecil, jika n adalah 20 atau lebih dari
20 dan p adalah 0.05 atau kurang dari 0.05. Pada pendekatan ini rumusnya lebih mudah untuk
digunakan dibandingkan dengan rumus Binomial.
Rumus pendekatannya adalah :
P ( x ; ) = e .
X
X ! Dimana : e = 2.71828
= rata ratakeberhasilan = n . p
x = Banyaknya unsur berhasil dalam sampel
n = Jumlah / ukuran populasi
p = probabilitas kelas sukses
Contoh soal :
1. Dua ratus penumpang telah memesan tiket untuk sebuah penerbangan luar negeri. Jika
probabilitas penumpang yang telah mempunyai tiket tidak akan datang adalah 0.01 maka
berapakah peluang ada 3 orang yang tidak datang.
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
2. Rata rata seorang sekretaris baru melakukan lima kesalahan mengetik per halaman.
Berapakah peluang bahwa pada halaman berikut ia :
1. Tidak ada kesalahan ( x = 0 )
2. Tidak lebih dari tiga kesalahan ( x 3) atau ( 0,1,2,3 )
3. Lebih dari tiga kesalahan ( x > 3 ) atau ( 4,,15)
Jawab :
1. Dik : n = 200, P = 0.01, X = 3, = n . p = 200 . 0.01 = 2
P ( x ; ) = e .
X
X!
= 2.71828 2 . 2
3
= 0.1804 atau 18.04 %
3!
2. Dik : = 5
a. x = 0 P ( x ; ) = e .
X
X!
P ( 0 ; 5 ) = 2.71828 5 . 5
0
= 0.0067
0!
b. x 3 ; P ( x ; ) = e .
X
X!
P (x 3 , 5) = P( x 1, ) +.+p(x3, )
= P( 0, 5 ) + P (1, 5 ) + P ( 2, 5 ) + P ( 3, 5 )
= 0.0067 + 0.0337 + 0.0842 + 0.1404
= 0.2650 atau 26.5 %
c. X > 3 ; P ( x ; ) = e .
X
X!
P (X > 3 , 5) = P( X 4, ) +.+p(X 15, )
= P( 4, 5 ) + P (5, 5 ) + + P ( 15, 5 ) atau
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
P (X > 3 , 5) = 1 [P ( X 3 , 5 ) ]
= 1 [ P ( X 0, ) +.+ p (X 3, ) ]
= 1 [ P ( 0, 5 ) +.+p ( 3, 5 ) ]
= 1 [ 0.2650 ]
= 73.5 %
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Distrubusi Normal
- Distribusi normal merupakan salah satu distribusi yang paling penting dalam statistika.
Disebut pula dengan distribusi Gauss (Gaussian distribution).
- Fungsi dentitas dari variable random X dengan mean dan variansi adalah :
Gambar Kurva Normal
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Gambar Kurva Normal dengan simpangan bauk sama
- Karakteristik Distribusi Normal
o Data merupakan data kontinu ( interval atau rasio).
o Sebaran bersifat simetris dengan modus tunggal (unimodal).
o Mean = Median = Modus
o Batas nilai memungkinkan untuk seluruh bilangan rill tak terbatas kekiri
maupun kekanan
o Secara umum karakteristik ditentukan oleh dua parameter yaitu mean dan
standar deviasi
- Perhitungan Probabilitas pada Distribusi Normal
o
o
o Integral di atas tidak dapat diselesaikan secara analitis. Untuk memudahkan
perhitungan tersedia table normal yang berisikan luas di bawah area kurva
normal baku
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
- Sifat Distribusi Normal
o Grafik simetri terhadap sumbu tegak
o Grafik selalu berada di atas sumbu
o Mempunyai satu nilai Modus
o Grafik mendekati sumbu X (tidak akan memotong sumbu X)
o Luas di bawah kurva
- Kurva Normal
dan diatas sumbu sama dengan satu
Kurva normal yang dibentuk oleh normal, memiliki bentuk lonceng simetris dan lebih
lanjut memiliki property sebagai berikut :
1. Memiliki modus, median, dan mean pada satu titik
2. Kurva berbentuk simetri terhadap sumbu vertical yang melewati
3. Kurva memiliki titik belok pada
4. Kurva normal mencapai sumbu horizontal secara asimptot
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Probabilitas
ditentukan oleh luas daerah di bawah kurva
Dengan transformasi tersebut maka diperoleh distribusi normal Z yang mempunyai rata-rata =
0 dan simpangan baku = 1. Distribusi Normal Z ini disebut dengan distribusi normal standar.
Probabilitas menjadi P(Z1 < Z < Z2).
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Estimasi
Estimasi titik
Bila parameter dr populasi hanya dididuga dengan memakai satu nilai statistic
dari sampel yang diambil dari populasi tersebut.
Estimasi Interval
->
->
->
untuk
untuk
untuk P
Bila nilai parameter dari populasi diduga dengan memakai beberapa nilai statistic
dari interval. Contoh
Sampel besar
o Estimasi parameter rata-rata , bila diketahui adalah :
Bila tidak diketahui, maka dapat digunakan estimasi dari adalah S.
o Estimasi parameter Proporsi P
Interval kepercayaan (1 ) untuk menduga proporsi P adalah :
o Estimasi Parameter beda 2 dara-rata
Interval kepercayaan (1 ) untuk menduga beda 2 rata-rata
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Contoh Soal :
Seorang peneliti yang sedang melakukan penelitian di desa tegalarang. Dari
hasil penelitian menemukan bahwa rata-rata usia penduduk di desa tersebut
adalah 36,3 tahun dengan standar deviasi 13,3 yang didapat dengan menggunakan
sampel sebanyak 120 orang. Tentukan estimasi interval dengan kepercayaan 95%.
Dik :
Sampel Kecil
o Estimasi parameter rata-rata
o Estimasi parameter beda 2 rata-rata
o Simpangan baku gabungan
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Contoh Soal :
Universitas terbuka menyatakan bahwa rata-rata kenaikan jumlah
mahasiswa mencapai 13,17 dengan melakukan penelitian terhadap 36 universitas
dengan standar deviasi 2,9 dengan taraf kepercayaan 95%. Hitung estimasi
interval.
Dik :
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Uji Hipotesis
Hipotesis statistik merupakan pernyataan sementara tentang satu populasi atau lebih.
Dalam statistika, pengujian hipotesis merupakan bagian terpenting untuk mengambil keputusan.
Dengan melakukan pengujian hipotesis seorang peneliti akan dapat menjawab pertanyaan-
pertanyaan yang diajukan dengan menyatakan penolakan atau penerimaan terhadap hipotesis.
Kebenaran hipotesis secara pasti tidak pernah diketahui kecuali jika dilakukan pengamatan
terhadap seluruh anggota populasi. Untuk melakukan hal ini sangatlah tidak efisien apalagi bila
ukuran populasinya sangat besar.
Penarikan sejumlah sampel acak dari suatu populasi, diamati karakteristiknya dan
kemudian dibandingkan dengan hipotesis yang diajukan merupakan suatu langkah melakukan uji
hipotesis. Apabila sampel acak ini memberikan indikasi yang mendukung hipotesis yang
diajukan maka hipotesis tersebut diterima, sedangkan bila sampel acak itu memberikan indikasi
yang bertentangan dengan hipotesis yang diajukan, maka hipotesis tersebut ditolak.
Dalam pengujian hipotesis ada dua jenis tipe kesalahan yaitu kesalahan jenis I dan
kesalahan jenis kedua. Kesalahan jenis I adalah kesalahan yang terjadi akibat menolak H0
padahal H0 benar, sedangkan kesalahan jenis II adalah kesalahan yang terjadi akibat menerima
H0 padahal H1 benar. Secara ringkas tabel dari dua jenis tipe kesalahan tersebut adalah :
Keputusan
Terima Ho
Tolak Ho
Ho benar
Keputusan benar
Galat jenis I
Ho salah
Galat jenis II
Keputusan benar
Galat jenis I = P (menolak Ho Ho benar)
= taraf nyata
Galat jenis II = P (menerima Ho o salah)
SOAL 1 :
Suatu jenis vaksin influenza yang beredar di pasaran diketahui hanya 25% efektif setelah periode
dua tahun. Untuk menentukan apakah suatu vaksin baru lebih unggul dalam memberikan
perlindungan terhadap virus yang sama untuk periode yang lebih lama, dilakukan penelitian. 20
orang diambil secara acak dan diinokulasi dengan vaksin baru tersebut. Bila 9 atau lebih di
antara yang menerima vaksin baru terbebas dari virus tersebut selama periode 2 tahun,
maka
vaksin baru dinilai lebih unggul.
a. Hitung peluang melakukan galat jenis I.
b. Jika Ho salah, dan yang benar H1 : p = , maka hitung peluang melakukan galat jenis II.
c. Jika Ho salah, dan yang benar H1 : p = 0,7, maka hitung peluang melakukan galat jenis II.
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
d. Misalkan kriteria pengujiannya diubah menjadi : jika 8 atau lebih berhasil melampaui
periode 2 tahun dengan baik, maka vaksin baru dinilai lebih unggul. Tentukan peluang
melakukan galat jenis I dan II (dengan H1 : p = ).
e. Misalkan ukuran sampel diperbesar menjadi 100 orang, dan kriteria pengujiannya : jika 37
orang berhasil melampaui periode 2 tahun tersebut, maka vaksin baru dinilai lebih unggul.
Tentukan peluang melakukan galat jenis I dan II (dengan H1: p = ).
Jawab :
a. t jenis I)
20
=
x 9
8
b(x; 20, ) = 1 -
x 0
b(x; 20, ) = 1 0,9591
= 0,0409
b.
= P (x < 9 bila p = )
8
= b(x; 20, ) = 0,2517
x 0
8
c.
x 0
d.
20 7
b(x; 20, 0,7 ) = 0,0051
= b(x; 20, ) = 1 -
x 8 x 0
= 0,1018
7
8 bila p = ) =
x 0
e. Digunakan hampiran normal :
Bila Ho benar
b(x; 20, ) = 1 0,8982
b(x; 20, ) = 0,1316
2
= n p q = 100 ( ) ( ) = 300/16
= P (x > 36,5 bila p = ) = P (z > 2,66) = 0,0039
Bila H1 benar
= n p = 100 ( ) = 50
2
= n p q = 100 () () = 25
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
= P (galat jenis II)
= P (x < 36,5 bila p = ) = P (z < -2,7) = 0,0035
Sifat-
1.
probabilitas yang lain.
2. Ukuran wilayah kritis, yang selalu berarti peluang melakukan galat jenis I, selalu dapat
diperkecil dengan mengubah nilai kritisnya.
3.
4. Bila Ho salah, nilai akan semakin besar bila parameternya dekat dengan nilai
yang
dihipotesiskan. Semakin besar jarak antara nilai yang sesungguhnya dengan nilai yang
Suatu uji hipotesis statistik yang alternatifnya bersifat satu-arah dinyatakan sebagai :
Ho o
H1 o
atau
Ho o
H1 o
disebut uji satu arah.
Sedangkan uji hipotesis statistik yang alternatifnya bersifat dua-arah seperti
Ho o
H1 o
disebut uji dua arah.
Ho selalu dituliskan dengan tanda kesamaan, sehingga menspesifikasi suatu nilai tunggal.
Dengan cara ini peluang melakukan galat jenis I dapat dikendalikan.
Langkah-langkah pengujian hipotesis :
1. Nyatakan hipotesis nol (Ho), yaitu Ho : = o
2. Pilih hipotesis alternatif H1 yang sesuai.
3.
4. Pilih statistik uji yang sesuai dan tentukan wilayah kritisnya.
5. Hitung nilai statistik uji berdasarkan data sampel.
6. Ambil keputusan :
a. Tolak Ho bila nilai statistik uji terletak dalam wilayah kritis,
b. Terima Ho bila nilai statistik uji jatuh di luar wilyah kritis.
5.1. PENGUJ IAN RATA-RATA
Secara ringkas uji mengenai rata-rata disajikan dalam tabel berikut :
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
No
HIPOTESIS
NILAI STATISTIK UJI
WILAYAH KRITIS
1. Ho o
lawan
H1 o
H1 o
H1 o
z
x
0
n
z < -z
z > z
z < -z dan z > z
2. Ho o
lawan
H1 o
x
t
0, v=n-1
t < -t
H1 o
H1 o
s
n
t > t
t < -t dan t > t
3. Ho 1- 2= do
(
x d
lawan
H1 1- 2 < do
z
x12
2
)
2
0
z < -z
H1 1- 2 > do
(
1
n
1
) (
2
n2
)
z > z
H1 1- 2 o
4. Ho 1- 2= do
lawan
12 22 diketahui
(
x ) d
z < -z dan z > z
t
x12 0
;
H1 1- 2< do
s
( 1 )
t < -t
H1 1- 2> do
p
n
1
n
2
t > t
H1 1- 2 o
v = n1 + n2 - 2
12
= 22 , tapi tidak diketahui
s
2
2
t < -t dan t > t
2
sp
(n1
1
(n
2
1)
s
2
n
2
5. Ho 1- 2 = do
lawan
t
'
n12
( x1x2)
d
0
H1 1- 2 < do
(
s
2
s
2
t < -t
H1 1- 2 > do
H1 1- 2 o
1
s
2
n
1
) ( 2
2
n
2
2
)
t > -t
t < -t dan t > t
v (
2
1
s n2)
n12
2 2
2
(s1n1)
n1
(s2n2)
n2
6. Ho D = do
lawan
12 22 , dan tidak diketahui
d d
H1 D < do
t
0; v = n 1
t < -t
H1 D > do sd
n t > t
H1 D o
Probabilitas dan Statistika
data berpasangan
t < -t dan t > t
Hafiz Muhammad (15-2013-056)
SOAL 2 :
Perusahaan farmasi Pharos memproduksi obat jenis tertentu yang masa pakainya menghampiri
distribusi normal dengan rata-rata 800 hari dan simpangan baku 40 hari. Sampel acak 30 obat
jenis tersebut menghasilkan masa pakai rata-rata 788 hari. Ujilah hipotesis bahwa masa
pakai
obat tersebut tidak sama dengan 800 hari dengan tingkat signifikan = 4%
Jawab :
1. Ho : = 800 hari
2. H1 : 800 hari
3. = 0,04
4. Daerah kritis : z : < -2,06 dan z > 2,06
5. x = 788 hari, n = 30, dan = 40
hari
6. Keputusan : Terima Ho
z
788
40 / 30
Kesimpulan : masa pakai obat jenis tersebut adalah
800 hari
5.2. PENGUJ IAN VARIANS
Secara ringkas uji mengenai varians disajikan dalam tabel
berikut :
No HIPOTESIS NILAI STATISTIK UJI
1. Ho
2
o2
lawan (n s
2
WILAYAH KRITIS
H1
2
o
2
2
2
;
2
2
1-
2 0 2
2
H1
2
o
H1
2
o
2
2. Ho 1
2
2
2
lawan
dengan v = n - 1
2
2
2
1-
2
2
H1 12
< 2
2
f
s
1
s
2
f < f1- (v1,v2)
H1 1
2
2
2
H1 1
2
2
2
catat an :
f1- (v1,v2)= 1 / f (v2,v1)
Probabilitas dan Statistika
2
dengan
v1 = n1 1
v2 = n2 1
f > f (v1,v2)
f < f1-
(v
1
,v
2) dan f > f
(v
1
,v
2
)
Hafiz Muhammad (15-2013-056)
SOAL 3 :
Sebuah perusahaan farmasi Zeneca menyatakan bahwa daya kerja obat tertentu hasil
produksinya berdistribusi normal dengan simpangan baku 0,9 menit. Jika sampel acak 10 obat
jenis tersebut menghasilkan simpangan baku 1,2 menit, apakah menurut anda > 0,9 menit ?
(Gunakan = 5%)
Jawab :
1. Ho :
2
= 0,81 menit
2. H1 :
2
> 0,81 menit
3. = 0,05
4. Daerah
kritis
2 2
(0,05;9
)
atau
2
16,919
5. s
2
= 1,44 menit, n = 10 2
6. Keputusan : Terima Ho
9(1
,44
)
0,8
1
16
Kesimpulan : simpangan baku daya kerja obat tersebut adalah 0,9 menit.
SOAL 4 :
Sebuah penelitian di perusahaan farmasi Roche bermaksud membandingkan waktu yang
diperlukan oleh karyawan laki-laki dan wanita untuk membuat obat jenis tertentu dalam jam.
Pengalaman lalu menunjukkan distribusi waktu yang diperlukan karyawan tersebut berdistribusi
normal, tetapi varians bagi wanita lebih kecil daripada varians bagi laki-laki. Suatu sampel acak
11 karyawan laki-laki dengan simpangan baku 6,1 jam, sedangkan 14 karyawan wanita dengan
simpangan baku 5,3 jam. Ujilah hipotesis Ho : 12
=
2
2 lawan H1 : 12
>
2
2 , dengan 12 dan
2
2 masing-masing variansi populasi bagi laki-laki dan wanita ? ( Gunakan = 1% )
Jawab :
s1= 6,1, s2 = 5,3
F
37
28,09
= 0,01, n1 = 11, n2 = 14
F0,
01(10,13)
karena F <
F0,01(10,13)
, maka terima Ho
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Kesimpulan :
Variansi sebenarnya waktu pembuatan obat jenis tertentu bagi karyawan laki-laki dan wanita
sama.
5.3. PENGUJ IAN PROPORSI
Secara ringkas uji mengenai proporsi untuk sample besar disajikan dalam tabel berikut :
No
1.
HIPOTESIS
Ho : p = po
lawan
H1 : p < po
z
NILAI STATISTIK UJI
x np
o
q
WILAYAH KRITIS
z < -z
H1 : p > po
H1 o
atau
npoo
p p
z o
p q
,dengan
p
x
n
z > z
z < -z dan z > z
2.
Ho : p1 = p2
lawan
H1 : p1 < p2
H1 : p1 > p2
z
o o
n
1 2
p [(1 n1 n2)]
z < -z
z > z
H1 : p1 2
dengan , x n
1 x1n12 2 2
x ) (
( n )
z < -z dan z > z
3.
Ho:p1- p2= d0
lawan
H1:p1- p2< d0
z
1
x12
2
n12
z < -z
H1:p1- p2> d0
H1:p1-p2 0
SOAL 5 :
1 1
n
1
q
2 2
n
2
z > z
z < -z dan z > z
Suatu obat penenang ketegangan syaraf diduga hanya 60% efektif. Seorang peneliti bermaksud
melakukan percobaan obat penenang jenis baru dengan memberikan kepada 100 orang dewasa
penderita ketegangan syaraf yang dipilih secara acak, hasilnya menunjukkan bahwa obat baru
tersebut 70% efektif. Apakah ini merupakan bukti yang cukup untuk menyimpulkan bahwa obat
baru lebih baik daripada yang beredar sekarang ? (Gunakan = 5%)
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Jawab :
1. Ho : p = 0,6
2. H1 : p > 0,6
3. = 0,05
4. Daerah kritis : z > 1,645
5. Untuk x = 70 , n = 100, p0 = 0,6, dan q0 = 0,4, maka
z
x
n.
p
0
70 60
2,04
p q
n. .
0 0
6. Keputusan : Tolak Ho
(100)(0,6)(0,4)
Kesimpulan : Obat baru tersebut memang lebih manjur
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Analisis Regresi Linier
Analisis regresi merupakan alat statistik yang memanfaatkan hubungan antara dua
atau lebih
peubah kuantitatif sehingga salah satu peubah bisa diramalkan dari peubah-peubah lainnya. Misalnya, jika
kita tahu hubungan antara kemampuan awal siswa dan prestasi belajarnya pada tahun pertama di Sekolah
Menengah Pertama (SMP), maka kita dapat meramal prestasi belajar siswa melalui analisis regresi
jika
kemampuan awal siswa telah kita ketahui.
Pada modul ini, kita akan membahas analisis regresi dengan satu peubah peramal untuk meramal
peubah yang menarik perhatian kita. Di dalam modul ini khususnya, kita kupas gagasan dasar analisis
regresi dan membahas pendugaan paramter-parameter yang ada di dalam model.
9.1.1 Hubungan Antara Peubah-peubah
Konsep suatu hubungan antara dua peubah, seperti misalnya antara pendapatan keluarga dan pengeluaran
keluarga untuk perumahan, sudah sangat kita kenal. Kita akan membe-dakan antara hubungan
fungsional
dan hubungan statistik, dan akan mengupas masing-masing itu.
Hubungan Fungsional antara Dua Peubah
Suatu hubungan fungsional antara dua peubah dinyatakan melalui suatu rumus matematis. Jika X peubah
bebas (independent variable) dan Y peubah takbebas (dependent variable), hubungan fungsional adalah
berbentuk:
Y = f(X)
Jika suatu nilai X diketahui, fungsi f dapat menunjukkan nilai Y padanannya.
Contoh 9.1.1 Perhatikan hubungan antara volume penjualan dalam rupiah (Y) sebuah produk yang dijual
pada harga tetap tertentu dan banyaknya unit barang yang terjual (X). Jika harga jualnya adalah
Rp
2.000,- per unit, maka hubungan antara keduanya dapat dinyatakan oleh persamaan:
Y = 2X
Hubungan fungsional ini ditunjukkan dalam Gambar 9.1. Banyaknya unit terjual dan volume
penjualan
selama tiga periode terakhir (harga jual tetap konstan pada Rp 2.000,- per unit) ialah sebagai berikut:
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Ribuan Rp
Y
300
200
100
Y = 2X
0 50 100 X
Unit terjual
Gambar 9.1.1 Teladan Hubungan Fungsional
Tabel 9.1.1 Banyaknya unit terjual pada setiap periode
Periode
1
2
3
Banyaknya Unit
Terjual
75
25
130
Volume Penjualan
(Ribuan Rupiah)
150
50
260
Amatan-amatan ini kemudian diplotkan dalam Gambar 9.1.1 Perhatikan bahwa semua titik amatan
jatuh
tepat pada garis hubungan fungsional. Inilah ciri hubungan fungsional.
Hubungan Statistik antara Dua Peubah
Hubungan statistik, tidak seperti fungsional, tidaklah sempurna. Pada umumnya, amatan-amatan untuk
suatu hubungan statistik tidak jatuh tepat pada kurva hubungan tersebut.
Contoh 9.1.2. Suatu penelitian ingin mengetahui hubungan antara Perhatian Orang Tua (POT) dengan
Prestasi Belajar Siswa. Tabel 9.1.1. mencantumkan data skore POT dan prestasi belajar siswa untuk 10
siswa yang dipilih secara acak dari suatu sekolah. Data ini diplotkan dalam Gambar 9.1.2a. Prestasi
belajar siswa diambil sebagai peubah takbebas atau peubah respons Y, sedangkan skore POT
sebagai
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
peubah bebas atau peubah peramal X. Pengeplotannya dilakukan seperti sebelumnya.
Sebagai misal,
siswa pertama diplotkan sebagai X = 30, Y = 44.
Regression Plot
Y = 15.5941+ 1.09412X
R-Sq= 0.975
105
95
85
75
100
90
80
70
60
50
40
20 30 40 50 60 70 80
X
a
Y
65
55
45
35
20 30 40 50 60 70 80
X
b
Gambar 9.1.2 Hubungan Statistik antara POT dan Prestasi Belajar Siswa
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Y
Gambar 9.1.2a secara jelas mengindikasikan adanya suatu hubungan antara skore POT dengan
prestasi
belajar siswa, dalam pengertian bahwa semakin besar skore POT, semakin besar pula prestasi belajarnya.
Akan tetapi, hubungan ini tidak sempurna. Titik-titiknya agak memencar, menunjukkan bahwa ada
keragaman prestasi belajar yang tidak bisa dijelaskan oleh skore POT. Misalnya, dua siswa runtutan
(1
dan 8) yang sama-sama memiliki skore POT 30, namun keduanya memiliki prestasi belajar yang sedikit
berbeda. Karena perpencarannya titik-titik di dalam suatu hubungan statistik, maka Gambar 9.1.2a
dinamakan diagram pencar atau plot pencar. Dalam terminologi statistika, setiap titik dalam
diagram
pencar menyatakan suatu tindakan (trial) atau suatu kasus.
Dalam Gambar 9.1.2b, kita telah memplot suatu garis yang menggambarkan hubungan statistik
antara prestasi belajar siswa dengan POT. Garis ini mengindikasikan kecenderungan umum
bervariasinya
prestasi belajar siswa berkaitan dengan berubahnya skore POT. Perhatikan bahwa sebagian besar titik
tidak jatuh tepat pada garis hubungan statistik tersebut. Perpencaran titik-titik di sekitar garis ini
menggambarkan keragaman prestasi belajar siswa yang tidak ada kaitannya dengan skore POT dan
biasanya dianggap bersifat acak. Hubungan statistik bisa sangat bermanfaat, walaupun hubungan
semacam ini tidak memiliki kepastian seperti halnya hubungan fungsional.
Contoh 9.1.3. Gambar 9.1.3. menyajikan data umur dan kandungan sejenis steroid di dalam plasma untuk
17 perempuan sehat yang berumur antara 8 dan 25 tahun. Data ini mengindikasikan adanya suatu
hubungan statistik yang kurvilinear (tidak linear). Kurva ini mengimplikasikan bahwa sejalan dengan
semakin tingginya umur, kandungan steroid naik sampai suatu titik tertentu dan kemudian mulai
menurun. Perhatikan sekali lagi memencarnya titik-titik di sekitar kurva hubungan statistik ini, yang
tipikal pada semua hubungan statistik.
Tingkat
Y
30
25
20
15
10
5
0 5 10 15
Umur (th)
20 25 X
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Gambar 9.1.3. Hubungan Statistik Kurvilinear antara Umur dan Kandungan Steroid pada
Perempuan
Sehat Berumur 8 sampai 25.
9.1.2. Model Regresi dan Kegunaannya
Konsep Dasar
Model regresi merupakan suatu cara formal untuk mengekspresikan dua unsur penting suatu
hubungan
statistik :
1. Suatu kecenderungan berubahnya peubah tidak bebas Y secara sistematis sejalan dengan berubahnya
peubah besar X.
2. Perpencaran titik-titik di sekitar kurva hubungan statistik itu.
Kedua ciri ini disatukan dalam suatu model regresi dengan cara mempostulatkan bahwa :
1. Ada suatu rencana peluang peubah Y untuk setiap taraf (level) peubah X.
2. Rataan sebaran-sebaran peluang berubah secara sistematis sejalan dengan berubahnya nilai peubah X.
Contoh 9.1.4. Misalkanlah Y menyatakan prestasi belajar siswa dan X menyatakan skore perhatian orang
tua (POT). Dalam hal ini di dalam model regresi peubah Y diperlakukan sebagai suatu peubah acak.
Untuk setiap skore perhatian orang tua, ada sebaran peluang bagi Y. Gambar 9.1.4. menunjukkan sebaran
peluang demikian ini untuk X = 30, yaitu skore POT sebesar 30. Tabel 9.1.1. Nilai amatan
Y yang
sesungguhnya (44 dalam contoh kita ini) dengan demikian dipandang sebagai suatu amatan acak
dari
Skore POT
X
70
50
Garis Regresi
Distribusi Peluang bagi Y
30
0
Probabilitas
dan
Statistika
Prestasi Belajar
Hafiz Muhammad
(15-2013-056)
sebaran peluang ini.
Gambar 9.1.4. Representasi Gambar bagi Model Regresi Linear
Gambar 9.1.4. juga menunjukkan sebaran peluang Y untuk ukuran lot X = 50 dan
X = 70.
Perhatikan bahwa rataan sebaran-sebaran peluang ini mempunyai hubungan yang sistematis
dengan taraf-
taraf peubah X. Hubungan sistematis ini dinamakan fungsi regresi Y terhadap X. Grafik fungsi regresi
ini
dinamakan kurva regresi. Perhatikan bahwa fungsi regresi dalam Gambar 9.1.4. adalah linear. Ini
berimplikasi untuk contoh kita bahwa prestasi belajar siswa rata-rata bervariasi secara linear dengan skore
POT. Tentu saja tidak ada alasan apriori mengapa prestasi belajar siswa mempunyai hubungan
linear
dengan skore POT.
Dua model regresi mungkin saja berbeda dalam hal bentuk fungsi regresinya, dalam hal bentuk
sebaran peluang bagi peubah Y, atau dalam hal lainnya lagi. Apapun perbedaannya, konsep sebaran
peluang bagi Y untuk X yang diketahui merupakan pasangan formal bagi diagram pencar dalam suatu
relasi statistik. Begitu pula, kurva regresi, yang menjelaskan hubungan antara rataan sebaran-sebaran
peluang bagi Y dengan X, merupakan pasangan formal bagi kecenderungan umum bervariasinya Y secara
sistematis terhadap X dalam suatu hubungan statistik.
Catatan :
Ungkapan peubah bebas atau peubah peramal bagi X dan peubah takbebas atau peubah respons
bagi Y dalam suatu model regresi adalah kebiasaan saja. Tidak ada implikasi bahwa Y bergantung secara
kausal pada X. Betapa pun kuatnya suatu hubungan statistik, ini tidak berimplikasi adanya
hubungan
sebab-akibat. Dalam kenyataannya, suatu peubah bebas mungkin saja sesungguhnya bergantung
secara
kausal pada peubah responsnya, seperti bila kita menduga suhu (respons) dari tinggi air raksa (peubah
bebas) dalam suatu termometer.
Bentuk Fungsional Hubungan Regresi
Pemilihan bentuk fungsional hubungan regresi terkait dengan pemilihan peubah bebasnya. Ada kalanya,
teori bilang ilmu bersangkutan bisa menunjukkan bentuk fungsional yang cocok. Teori belajar, misalnya,
mungkin mengindikasikan bahwa fungsi regresi yang menghubungkan biaya produksi dengan berapa kali
suatu item tertentu telah pernah muncul harus memiliki bentuk tertentu dengan sifat-sifat asimtotik
tertentu pula.
Yang lebih sering dijumpai adalah bahwa bentuk fungsional hubungan regresi tersebut
tidak
diketahui sebelumnya, sehingga harus ditetapkan setelah datanya diperoleh dan dianalisis. Oleh
karenanya, fungsi regresi linier atau kuadratik sering digunakan sebagai suatu hampiran
yang cukup
memuaskan bagi fungsi regresi yang tidak diketahui bentuknya. Bahkan, kedua jenis fungsi regresi yang
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
sederhana itu masih juga sering digunakan meskipun teori yang mendasarinya menunjukkan
bentuk
fungsionalnya, terutama bila bentuk fungsional yang ditunjukkan oleh teori terlalu rumit namun secara
logis bisa dihampiri oleh suatu fungsi linier atau kuadratik.
Cakupan Model. Ketika memformulasikan suatu model regresi, kita biasanya harus membatasi cakupan
model ke suatu selang atau daerah nilai-nilai tertentu peubah bebasnya. Cakupan ini ditentukan oleh
rancangan penelitian atau oleh jangkauan data yang tersedia. Misalnya, sebuah perusahaan yang
mempelajari pengaruh harga terhadap volume penjualan menyelidiki enam tingkat harga, mulai dari Rp
4.950,- sampai Rp 6.950,-. Disini cakupan model akan dibatasi pada harga-harga yang berkisar dari dekat
Rp 5.000,- ke dekat Rp 7.000,-. Bentuk fungsi regresi akan cukup meragukan di luar kisaran harga ini
sebab penelitian tidak memberikan informasi mengenai sifat hubungan statistik di bawah Rp 4.950,- dan
di atas Rp 6.950,-.
Kegunaan Analisis Regresi
Analisis regresi mempunyai tiga kegunaan utama: (1) deskripsi, (2) kontrol atau kendali, dan (3)
peramalan. Ketiga kegunaan itu telah diilustrasikan oleh ketiga contoh yang telah dikemukakan
di atas. Studi tentang pembelian traktor mempunyai tujuan deskripsi. Dalam studi biaya
pengoperasian kantor cabang, tujuannya adalah pengendalian administrasi; dengan
mengembangkan suatu hubungan statistik yang bermanfaat antara biaya dengan peubah-peubah
bebas di dalam sistem itu, maka pihak menejemen berhasil menetapkan biaya standart untuk
setiap kantor cabang. Dalam studi medis terhadap anak-anak pendek, tujuannya adalah
peramalan. Dokter dapat menggunakan hubungan statistik untuk meramalkan kekurangan
hormon pertumbuhan pada anak-anak pendek dengan menggunakan indikator-indikator
sederhana yang mudah diukur.
Di dalam praktek, beberapa kegunaan regresi sering ditemukan dalam suatu analisis regresi,
misalnya ialah contoh hubungan POT dengan prestasi belajar siswa. Pengetahuan mengenai
hubungan antara skore POT dengan prestasi belajar siswa, di masa datang dapat digunkan untuk
memberikan pengetahuan pada orang tua bahwa anaknya perlu mendapatkan perhatian
dalam
belajarnya, jika ingin anaknya mempunyai prestasi belajar yang cukup baik.
9.1.3 Model Regresi Linear Sederhana dengan sebaran Suku-suku Galat Tidak Diketahui
Model
Pada Kegiatan Belajar I ini, kita akan membahas suatu model regresi dasar yang melibatkan
hanya
satu peubah bebas dan fungsi regresinya linear. Adapun model regresinya dapat dituliskan sebagai
berikut:
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
Yi 0 1Xi i
Dalam hal ini :
Yi adalah nilai perubahan respons dalam amatan ke-i
0 1 adalah parameter
Xi adalah konstanta yang diketahui, yaitu nilai peubah bebas dari
amatan ke-i
(9.1.1)
1 i 2
{ i} = 2
; i dan
jtidak
berkorelasi sehingga peragam (covariance { I j} = 0 untuk semua i, j; i j
i = 1, 2, . . . ., n
Model regresi (9.1.1) dikatakan sederhana, linear dalam parameter, dan linier dalam peubah bebas.
Dikatakan sederhana karena hanya ada satu peubah bebas, linear dalam parameter karena tidak
ada parameter yang muncul sebagai salah satu eksponen atau dikalikan atau dibagi oleh
parameter
lain, dan linear dalam peubah bebas sebab peubah ini di dalam model berpangkat satu. Model yang
linear dalam parameter dan linear dalam peubah bebas juga dinamakan model ordo-pertama.
Ciri-Ciri Penting Model
1. Nilai Yi teramati pada amatan ke-i 0 +
1Xi
i. Jadi Yi adalah suatu peubah acak.
2. Karena E{ i} = 0, maka kita peroleh :
E{Yi} = E{ 0 1Xi i} = 0 1Xi + E{ i} = 0 1Xi
0 1Xi memainkan peranan sebagai konstanta. Jadi, respons Yi bila nilai X
pada amatan ke-i adalah Xi berasal dari suatu sebaran peluang yang rataannya adalah :
E{Yi} = 0 1Xi
oleh karena itu kita peroleh fungsi regresi bagi model (9.1.1), yaitu
:
E{Y} = 0 1X
(9.1.2)
(9.1.3)
Karena fungsi regresi menghubungkan rataan sebaran peluang bagi Y untuk X
tertentu dengan
nilai X itu sendiri.
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)
3. Nilai teramati Y pada amatan ke-i lebih besar atau lebih kecil daripada nilai fungsi regresi dengan
selisih sebesar i.
i
2
. oleh karenanya,
respons Yi
mempunyai ragam yang sama pula :
2
{Yi} =
2
Karena, berdasarkan sifat variansi, kita memperoleh :
2
{ 0 1Xi i} = 2
{ i 2
(9.1.4)
Jadi, model regresi (9.1.1) mengasumsikan bahwa sebaran peluang bagi Y
mempunyai ragam
2, tidak tergantung pada nilai peubah bebas X.
5. Suku-suku galat diasumsikan tidak berkorelasi. Oleh karenanya, hasil dari setiap amatan
manapun yang mempengaruhi galat dari amatan lain yang manapun baik posotof atau negatif,
i j tidak berkorelasi, maka begitu juga dengan
respons Yi
dengan Yj.
6. Ringkasan model regresi (9.1.1) mengimplementasikan bahwa peubah respons Yi bersal dari
sebaran peluang dengan rataan E{Yi 0 1Xi 2 yang sama untuk semua nilai X.
lebih lanjut, dua amatan sembarang Yi dan dan Yj tidak berkorelasi.
Contoh 9.1.5.
Misalkan bahwa model regresi (9.1.1) dapat diterapkan pada Contoh Hubungan Skore Perhatian
Orang Tua dengan Prestasi Belajar Siswa dan model itu ialah sebagai berikut:
Yi = 15.6 + 1.09Xi i
Pada Gambar 9.1.5 dapat dilihat fungsi regresi :
E{Y} = 15.6 + 1.09X
Y1 = 62
1) = 2.8
E(Y1) = 59.2
E(Y) =15.6 +1.09X
Probabilitas dan Statistika
40
Skore POT
Hafiz Muhammad (15-
2013-056)
Gambar 9.1.5
Misalnya bahwa suatu skore POT Xi = 40 dan ternyata prestasi belajar siswa yang teramati ialah
Y1 =
I = +2.8 sebab
E{Y1) = 15.6 + 1.09(40) = 59.2
dan
Yi = 62 = 59.2+2.8
Gambar 9.1.5 memperlihatkan sebaran peluang bagi Y untuk X= 40, dan memperlihatkan dari
mana
di dalam sebaran ini amatan Y1 = 62 beasal. Perhatikan sekali lagi bahwa suku galat
I tidak lain
adalah simpangan Yi dari nilai rataannya E(Yi).
Gambar 9.1.5 juga memperhatikan sebaran peluang bagi Y bila X = 20.
Perhatikan bahwa
sebaran ini mempunyai ragam yang sama seperti sebaran peluang bagi Y untuk X = 45, sesuai
dengan
persyaratan model regresi (9.1.1).
Probabilitas dan Statistika
Hafiz Muhammad (15-2013-056)