Statistik Pentaabiran Berkaitan

Dua Populasi
Setakat ini, semua perbincangan selang keyakinan dan ujian hipotesis adalah
berkaitan sampel yang diambil dari populasi tunggal. Kita telah mempelajari
berkenaan min populasi tunggal, perkadaran populasi tunggal, dan varian
populasi tunggal. Selalunya, terdapat minat yang sama unruk membuat
pentaabiran berkenaan dua populasi. Penyelidik mungkin mahu membandingkan
perbelanjaan isirumah tahun 1990 dengan perbalanjaan isirumah tahun 2000
didalam usaha untuk menentukan sama ada terdapat perubahan mengikut masa.
Penyelidik juga mungkin ingin menganggar atau menguji untuk menentukan
perbezaan didalam perkadaran dua syarikat atau perkadaran bahagian pemasaran
satu syarikat didalam dua kawasan yang berbeza.
Didalam bab ini, kita akan mempertimbangkan beberapa teknik yang
berebza untuk menganalisis data yang datangnya dari dua sampel. Satu teknik
adalah digunakan dengan perkadaran, satu teknik menggunakan varian, dan yang
lain menggunakan min. Teknik untuk menganalisis min adalah diasingkan
kepada teknik yang menggunakan sampel yang besar dan teknik yang
menggunakan sampel kecil. Daripada empat daripada lima teknik yang akan
dibincangkan didalam bab ini, dua sampel adalah diandaikan sampel bebas.
Sampel adalah bebas disebabkan item atau manusia yang disampel didalam
setiap kumpulan tidak berkaitan dengan kumpulan yang lain. Sebarang
kesamaan di antara item atau manusia didalam dua sampel adalah kebetulan dan
disebabkan oleh peluang. Satu daripada teknik yang dibincangkan didalam bab
ini ialah untuk menganalisis data daripada rekabentuk penyelidikan dengan
sampel tidak bebas atau berhubungan, dimana sampel yang dipilih dengan cara ia
berhubungan dan berkaitan. Didalam kes ini, versi khusus adalah sebelum dan
selepas rekabentuk dimana manusia atau item adalah diukur sebelum dan selepas
sesuatu ujikaji, menghasilkan apa yang dilihat sebagai dua sampel pengukuran
yang berbeza tetapi sebenarnya dua pengukuran sampel yang berpadanan keatas
manusia atau item yang sama. Contoh lain sampel yang berhubungan atau
10
Pengenalan kepada Statistik Ekonomi dan Perniagaan
berkaitan ialah apabila sepasang manusia seperti kembar, suami-isteri, rakan
sekerja dan lain-lain adalah digunakan sebagai pasangan sepadan dimana dua
pengukuran adalah diambil (satu dari setiap ahli pasangan). Data ini kadang kala
dirujukkan sebagai data pasangan sepadan, data berpasangan, atau pengukuran
berhubungan. Ia dianalisis berbeza daripada data yang diperolehi dari
rekabentuk penyelidikan yang mengandungi dua sampel bebas. Untuk empat
dari lima teknik, kita akan menguji kedua-dua ujian hipotesis dan selang
keyakinan. Kita mulakan dengan teknik untuk menganalisis perbezaan di antara
dua min didalam dua sampel besar yang besar menggunakan min.
10.1 Ujian Hipotesis dan Selang Keyakinan berkaitan
Perbezaan Dua Min: Saiz Sampel Besar atau
Varian Diketahui, Sampel Bebas
Didalam rekabentuk penyelidikan tertentu, rancangan persampelan memilih dua
sampel bebas yang berbeza. Objek mungkin untuk menentukan sama ada dua
sampel datangnya dari populasi yang sama atau, jika ia datangnya dari populasi
yang berbeza, untuk menentukan jumlah perbezaan didalam populasi. Jika
penyelidik memilih min sebagai statistik dan jika dua sampel adalah dipilih
secara rawak, penyelidik mempunyai dua min sampel untuk dibandingkan.
Analisis jenis ini adalah khusus berguna didalam perniagaan apabial penyelidik
cuba untuk menentukan, sebagai contoh, sama ada terdapat perbezaan didalam
keberkesanan dua jenis ubat gigi atau perbezaan dua jenis jenama tayar.
Penyelidikan mungkin dijalankan untuk mengkaji perbezaan didalam produktiviti
lelaki dan wanita didalam barisan keluaran di bawah keadaan tertentu. Jurutera
mungkin mahu menentukan perbezaan didalam kekuatan aluminium yang
dikeluarkan di bawah dua jenis suhu. Adakah terdapat perbezaan di antara purat
kos rumah satu tingkat dua bilik di antara Johor Bahru dan Kuala Lumput? Jika
ada, berapa banyak perbezaannya? Soalan ini dan banyak lagi persoalan yang
lain boleh dikaji dengan membandingkan keputusan yang diperolehi dari dua
sampel rawak.
Bagaimanakah penyelidik menyelesaikan analisis perbezaan di antara
dua sampel dengan menggunakan min sampel? Teorem had memusat
menyatakan perbezaan didalam dua min sampel,
2 1
X X − , adalah bertaburan
normal untuk saiz sampel yang besar (kedua-dua n1 dan n2 ≥ 30) bergantung
kepada bentuk populasi. Ia juga boleh ditunjukkan sebagai
2 1 X - X
-
2 1
µ µ µ ·
2
Statistik Pentaabiran Berkaitan Dua Populasi

n

n
2
2
2
1
2
1
X - X
2 1
σ σ
σ + ·
Pernyataan ini memboleh kita menggunakan formula Z untuk perbezaan
di antara dua min sampel.
Formula Z untuk Perbezaan didalam Dua Min Sampel
untuk n1 dan n2 ≥ 30 (sampel bebas)
(10.1)
2
2
2
1
2
1
2 1 2 1

) - ( - ) X - X (
Z
n n
σ σ
µ µ
+
·
dimana
µ1 = min populasi 1
µ2 = min populasi 2
n1 = saiz sampel 1
n2 = saiz sampel 2

Formuala ini membolehkan kita menyelesaikan masalah yang melibatkan
dua sampel rawak bebas dan min mereka
1
.
Disamping itu, varian sampel boleh digunakan didalam Formula 10.1
untuk menggantikan varian populasi apabila varian populasi tidak diketahui and
saiz sampel adalah besar (n1, n2 ≥ 30) disebabkan dengan saiz sampel yang besar
varian sampel adalah penghampiran yang baik bagi varian populasi.
Sebagai contoh bagaimana Formula 10.1 boleh digunakan, katakan pada
bulan Januari purata bil letrik isirumah di Pulau Pinang ialah RM185, dengan
sisihan piawai RM35. Katakan juga pada bulan yang sama, purata bil letrik di
Kota Bahru ialah RM91, dengan sisihan piawai RM22. Jika sampel rawak 40
1
Jika dua populasi adalah diketahui bertaburan normal keatas pengukuran yang hendak dikaji dan
jika varia populasi diketahui, Formula 10.1 boleh digunakan untuk sampel bersaiz kecil.
3
3
Pengenalan kepada Statistik Ekonomi dan Perniagaan
isirumah di Pulau Pinang dan 32 isirumah di Kota Bahru diambil, apakah
kebarangkalian perbezaan di antara purata sampel ialah RM100?
Didalam kes ini, µ1 = 185, µ2 = 91, σ1 = 35, σ2 = 22, n1 = 40 dan n2 = 32.
Perbezaan didalam min sampel,
2 1
X X − ialah 100. Formula 10.1
menghasilkan
2
2
2
1
2
1
2 1 2 1

) - ( - ) X - X (
Z
n n
σ σ
µ µ
+
·
=
0.89
6.764
6

32
22

40
35
91) - (185 - 100
2 2
· ·
+
Daripada Jadual A.5, kebarangkalian memperolehi nilai Z di antara 0 dan
0.89 ialah 0.3133. Kebarangkalian memperolehi nilai Z yang lebih besar
daripada 0.89 ialah 0.5000 – 0.3133 = 0.1867. Apabila berpezaan di antara min
populasi RM185 – RM91 = RM94, perbezaan RM100 atau lebih bagi min
sampel terjadi 18.67% daripada masa. Masalah ini dan penyelesaiannya boleh
ditunjukkan secara grafik didalam Rajah 10.1.
Rajah 10.1
Taburan Kebarangkalian Contoh Bil Letrik
10.1.1 Ujian Hipotesis
4
0.1867
0.3133
Z=0.0 Z=0.89
µ1-µ2 = 94
2 1
X X − =100
2 1
X X −
Z
Statistik Pentaabiran Berkaitan Dua Populasi
Didalam banyak keadaan, penyelidik mahu menguji perbezaan didalam
nilai min dua populasi. Satu contoh mungkin untuk menguji perbezaan di antara
nilai min pencapaian, kepintaran, atau ciri-ciri lelaki dan wanita. Persatuan
pengguna mungkin mahu menguji jenama mentol lampu untuk menentukan sama
ada satu jenama lebih panjang tempoh hanyatnya berbanding satu jenama yang
lain. Kerajaan mungkin ingin menentukan sama ada terdapat purata perbezaan
harga rumah di antara Kuala Lumpur dan Johor Bahru. Formula 10.1 boleh
digunakan untuk menguji perbezaan di antara dua min populasi.
Sebagai contoh yang khusus, diawal tahun 1990an kajian oleh Jabatan
Buruh Malaysia mendapati purata anggaran upah lebihmasa sejam di antara
juruanalisis komputer dan jurutera adalah hampir sama. Katakan kita mahu
menjalankan ujian hipotesis untuk menentukan sama ada ia masih lagi sama
sekarang ini. Hipotesis bagi masalah ini ialah H0: µ1 - µ2 = 0 melawan Ha: µ1 - µ2
≠ 0. Sampel rawak 32 juruanalisis komputer dan 34 jurutera diseluruh Malaysia
diambil dan ditanya gaji lebih masa mereka. Data upah lebih masa sejam
ditunjukkan didalam Jadual 10.1, bersama-sama dengan min sampel, sisihan
piawai sampel, dan saiz sampel bagi setiap kumpulan.
Jadual 10.1
Upah Juruanalisis Komputer Sementara dan Jurutera Sementara
Juruanalisa Komputer Jurutera
24.10 25.00 24.25 20.75 23.30 22.75
23.75 22.70 21.75 23.80 24.00 23.00
24.25 21.30 22.00 22.00 21.75 21.25
22.00 22.55 18.00 21.85 21.50 20.00
23.50 23.25 23.50 24.16 20.40 21.75
22.80 22.10 22.70 21.10 23.25 20.50
24.00 24.25 21.50 23.75 19.50 22.60
23.85 23.50 23.80 22.50 21.75 21.70
24.20 22.75 25.60 25.00 20.80 20.75
22.90 23.80 24.10 22.70 20.25 22.50
23.20 23.25 22.45
23.55 21.90 19.10
n1 = 32
1
X = RM23.14
S1 = 1.373
2
1
S = 1.885
n2 = 34
2
X =RM21.99
S2 = 1.403
2
2
S = 1.968
5
5
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Didalam masalah ini, penyelidik mahu menguji hanya untuk menentukan
sama ada terdapat perbezaan didalam purata upah lebih masa sejam bagi
juruanalisis komputer dan jurutera, oleh itu ia merupakan ujian dua hujung. Jika
penyelidik mempunyai hipotesis satu kumpulan dibayar lebih berbanding dengan
kumpulan yang lain, ujian hipotesis merupakan ujian satu hujung.
Katakan α = 0.02. Disebabkan ia ujian dua hujung, setiap dua kawasan
penolakan mempunyai keluasan 0.01, meninggalkan 0.49 keluasan didalam
taburan di antara setiap nilai kritikal dan min taburan. Jadual kritikal yang sesuai
nagi Z
α/2 bagi kawasan ini ialah Z0.01 - t2.33. Rajah 10.2 menunjukkan nilai jadual
kritikal Z bersama-sama dengan kawasan penolakan.
Rajah 10.2
Nilai Kritikal dan Kawasan Penolakan bagi Contoh Gaji
Perhatikan bahawa varian populasi tidak diberikan didalam masalah ini.
Selagi saiz sampel besar, S
2
adalah penghampiran yang terbaik untuk σ
2
. Oleh
itu formula berikut adalah sama dengan Formula 10.1 untuk sampel besar.
Formula Z untuk Perbezaan didalam Dua Min Sampel

2
2
2
1
,σ σ tidak diketahui dan n1 dan n2 ≥ 30 (sampel bebas)
(10.2)
2
2
2
1
2
1
2 1 2 1

) - ( - ) X - X (
Z
n
S
n
S
+
·
µ µ
dimana
µ1 = min populasi 1
µ2 = min populasi 2
n1 = saiz sampel 1
n2 = saiz sampel 2
6
Z0.01=-2.33 Z=0.0 Z0.01=+2.33
Z
2
α
=0.01
2
α
=0.01
Statistik Pentaabiran Berkaitan Dua Populasi
Formula 10.2 dan data didalam Jadual 10.1 menghasilkan nilai Z untuk
melengkapkan ujian hipotesis.
3.36
0.342
1.15

34
1.968

32
885 . 1
(0) - 21.99) - (23.14
2 2
· ·
+
Nilai Z yang dikira ialah 3.36 adalah lebih besar daripada nilai kritikal
yang diperolehi dari jadual Z = 2.33. Penyelidik menolak hipotesis nul dan boleh
menyatakan terdapat perbezaan yang signifikan di antara purata upah lebih masa
sejam bagi juruanalisis komputer dan jurutera. Penyelidik boleh menguji min
sampel dan menggunakan pertimbangan am untuk membuat kesimpulan bahawa
upah lebih masa sejam bagi juruanalisis komputer, secara puratanya, adalah lebih
tinggi berbanding jurutera. Rajah 10.3 menunjukkan perhubungan di antara nilai
Z yang dikira dan Z
α/2.
Kesimpulan ini boleh diperolehi dengan menggunakan kaedah nilai-p.
Melihat kepada kebarangkalian Z ≥ 3.36 didalam jadual taburan Z, Jadual A.5
menghasilkan keluasan 0.5000 – 0.4994 = 0.0006. Nilai ini adalah kurang
daripada
2
α
= 0.1. Keputusan ini adalah menolak hipotesis nul.
Rajah 10.3
Kedudukan Nilai Z Dikira bagi Contoh Gaji
7
7
Z=-2.33 Z=0.0 Z=2.33
Z dikira=3.36

2 1
X X −
µ1-µ2=0.0
2 1
X X − =1.15
Kawasan Penolakan
Kawasan Penolakan
Z
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Contoh 10.1
Sampel 87 orang pekerja wanita profesional menunjukkan purata jumlah tahunan
yang dibayar kepada KWSP ialah RM3352 saorang, dengan sisihan piawai
RM1100. Sampel 76 pekerja profesional lelaki pula menunjukkan purata jumlah
tahunan yang dibayar kepada KWSP ialah RM5727 dengan sisihan piawai
sampel RM1700. Kumpulan pergerakan wanita mahu membuktikan bahawa
wanita tidak membayar sebanyak mana yang dibayar oleh kaum lelaki setahun
kepada KWSP. Jika mereka menggunakan α = 0.001 dan data tersebut, bolehkah
mereka menolak hipotesis nul dimana sumbangan tahunan kepada KWSP oleh
kaum wanita dalah sama atau lebih besar daripada lelaki. Gunakan lapan langkah
proses pengujian hipotesis.
Penyelesaian
Langkah 1: Ujian ini ialah ujian satu hujung. Disebabkan kumpulan pergerakan
wanita mahu membuktikan bahawa kaum wanita membayar kurang
daripada lelaki kepada KWSP setahun, oleh itu hipotesisnya adalah:
H0: µW - µM = 0
Ha: µW - µM < 0
Langkah 2: Ujian statistik adalah
2
2
2
1
2
1
2 1 2 1

) - ( - ) X - X (
Z
n
S
n
S
+
·
µ µ
Langkah 3: Alpa telah ditentukan sebagai 0.001.
Langkah 4: Dengan menggunakan nilai alpha, nilai kritikal Z0.001 = -0.308 boleh
ditentukan. Peraturan keputusan ialah menolak hipotesis nul jika
nilai yang dikira bagi ujian statistik, Z, kurang daripada –3.08.
Langkah 5: Data sampel adalah seperti berikut.
Perempuan Lelaki
n1 = 87
1
X = RM3352
S1 = RM1100
n2 = 76
2
X =RM5727
S2 = RM1700
8
Statistik Pentaabiran Berkaitan Dua Populasi
Langkah 6: Menyelesaikan untuk Z, memberikan
10.42 -
227.9
2375 -

76
700 1

87
1100
(0) - 5727) - (3352
2 2
· ·
+
Langkah 7: Niali Z yang dikira ialah –10.42 adalah jauh kedalam kawasan
penolakan, kuarng daripada nilai jadual Zc = -3.08. Walaupun
dengan nilai alpha = 0.001, hipotesis nul adalah ditolak.
Langkah 8: Bukti telah menunjukkan bahawa wanita, secara puratanya,
membayar kurang berbanding lelaki kepada KWSP. Rajah di
bawah menunjukkan keputusan ini.
Kebarangkalian memperolehi nilai Z yang dikira –10.42 melalui peluang
sebenarnya sifar, disebabkan nilainya diluar daripada had jadual Z. Melalui
kaedah nilai-p, hipotesis nul adalah ditolak kerana kebarangkaliannya ialah 0.000
atau kurang daripada α = 0.001.
9
9
Z0.001=-3.08 Z=0.0
Z dkira = -10.42
2 1
X X −

2 1
X X − =-701.9 µ1-µ2=0.0

2 1
X X − =-2.375
Z
Kawasan Penolakan
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Jika masalah ini diselesaikan menggunakan kaedah nilai kritikal, apakah nilai
kritikal perbezaan di antara dua min yang mesti diperolehi untuk menolak
hipotesis nul bagi nilai jadual Z sama dengan –3.08? Jawapannya ialah
2
2
2
1
2
1
2 1 c 2 1
Z - ) - ( ) X - X (
n
S
n
S
+ · µ µ
= 0 - 3.08(227.9) = -701.9
Perbezaan didalam min sampel perlu sekurang-kurangnya 701.9 untuk menolak
hipotesis nul. Perbezaan sampel sebenar didalam masalah ini ialah –2375=
(3352 – 5727), dimana dipertimbangkan lebih besar daripada pertbezaan nilai
kritikal. Oleh itu, dengan kaedah nilai kritikal, hipotesis nul juga ditolak.
10.1.2 Selang Keyakinan
Kadangkala kita boleh untuk menganggarkan perbezaan didalam min dua
populasi adalah adalah berguna. Dengan berapa banyakkah dua populasi berbeza
didalam saiz atau berat atau usia? Berapa banyakkah dua keluaran berbeza
didalam keberkesanannya? Adakah dua kaedah yang berbeza memberikan min
hasil yang berbeza? Jawapan kepada persoalan ini adalah sukar untuk diperolehi
melalui teknik bancian. Alternatifnya ialah untuk mengambil sampel rawak bagi
setiap populasi dan mengkaji perbezaan di antara min sampel.
Secara aljabarnya, Formula 10.1 boleh diubahsuaikan untuk
menghasilkan formula untuk membina selang keyakinan untuk dua min populasi
yang berbeza.
Selang keyakinan untuk menganggar µ1 dan µ2
(10.3)
n2 n
Z ) X - X ( -
n2 n
Z - ) X - X (
2
2
1
2
1
2 1 2 1
2
2
1
2
1
2 1
σ σ
µ µ
σ σ
+ + ≤ ≤ +
Sebagaimana yang telah dinyatakan, sisihan piawai sampel adalah
penghampiran yang terbaik bagi sisihan piawai populasi jika saiz sampel
mencukupi besarnya. Disebabkan Formula 10.3 adalah berdasarkan kepada
10
Statistik Pentaabiran Berkaitan Dua Populasi
teorem had memusat untuk sampel besar, ia boleh diubahsuaikan untuk
menggunakan sisihan piawai sampel berbanding nilai populasi sebagai
penghampiran selang keyakianan kepada penganggaran, µ1 - µ2.
Selang keyakinan untuk menganggar µ1 - µ2 apabila n1 dan n2
adalah Besar dan
2
2
2
1
,σ σ tidak di ketahui
(10.4)
n2 n
Z ) X - X ( -
n2 n
Z - ) X - X (
2
2
1
2
1
2 1 2 1
2
2
1
2
1
2 1
S S S S
+ + ≤ ≤ + µ µ
Sebagaimana yang telah dibincangkan didalam Bab 8, tidak ada jaminan
bahawa parameter yang dianggarkan (didalam kes ini µ1 - µ2) adalah berada
didalam selang keyakinan. Kita mempunyai (1 - α)% keyakinan bahawa
parameter berada didalam selang. Oleh itu, adalah lebih tepat untuk menyatakan
Formula 10.3 sebagai
α
σ σ
µ µ
σ σ
- 1
n2 n
Z ) X - X ( -
n2 n
Z - ) X - X ( Prob
2
2
1
2
1
2 1 2 1
2
2
1
2
1
2 1
·
1
1
]
1

¸

+ + ≤ ≤ +
Katakan satu kajian telah dijalankan untuk menganggar perbezaan purata
perbelanjaan di antara pelanggan berpendapatan sederhana dan pelanggan
berpendapatan rendah disebuah kedai menggunakan kupon. Sampel rawak 60
pelanggan berpendapatan sederhana dan 80 pelanggan berpendapatan rendah
diambil, dan perbelanjaan mingguan mereka dipantau selama 1 minggu. Purata
jumlah yang dapat dijimatkan dengan menggunakan kupon, dan saiz sampel serta
sisihan piawai sampel adalah sebagaimana berikut.
Pelanggan Berpendapatan
Sederhana
Pelanggan Berpendapatan
Rendah
n1 = 60
1
X = RM5.84
S1 = RM1.41
n2 = 80
2
X =RM2.67
S2 = RM0.54
11
11
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Maklumat ini boleh digunakan untuk membina selang keyakinan 98%
untuk menganggarkan perbezaan di antara min penjimatan dengan kupon oleh
dua kumpulan pelanggan tersebut.
Nilai Zc yang berkaitan dengan paras 98% keyakinan ialah 2.33. Nilai
ini, data yang ditunjukkan dan Formula 10.4 boleh digunakan untuk menentukan
selang keyakinan.
2 1
2 2
-
80
0.54

60
1.41
2.33 - 2.67) - (5.84 µ µ ≤ +

80
0.54

60
1.41
2.33 - 2.67) - (5.84
2 2
+ ≤
3.17 – 0.45 ≤ µ1 - µ2 ≤ 3.17 + 0.45
2.72 ≤ µ1 - µ2 ≤ 3.62
Prob[2.72 ≤ µ1 - µ2 ≤ 3.62] = 0.98
Terdapat 0.98 kebarangkalian perbezaan sebenar didalam min populasi
purata penjimatan melalui kupon seminggu di antara pelanggan berpendapatan
sederhana dan pelanggan berpendapatan rendah ialah di antara RM2.72 dan
RM3.62. Oleh itu, perbezaannya ialah sekecil RM2.72 dan sebesar RM3.62.
Penganggaran titik bagi perbezaan didalam min penjimatan ialah RM3.17.
Perhatikan perbezaan sifar didalam min populasi bagi dua kumpulan pelanggan
ini adalah tidak mungkin, kerana sifar tidak berada didalam jeda 98%.
Contoh 10.2
Kajian telah dijalankan untuk menentukan perbezaan penggunaan minyak kereta
menggunakan minyak tanpa plumbum regular dan minyak tanpa plumbum
premium. Penyelidik bagi kumpulan membahagikan 100 kereta dengan sama
banyak untuk diuji dengan kedua-dua jenis minyak tersebut. Lima puluh kereta
diisi dengan minyak regular dan 50 buah kereta lagi diisi dengan minyak
premium. Purata sampel bagi kereta yang menggunakan minyak regular ialah
21.45 km/liter dengan sisihan piawai 3.46 km/liter. Min sampel bagi kereta yang
menggunakan minyak premium ialah 24.6 km/liter dan sisihan piawai ialah 2.99
km/liter. Lakukan 95% selang keyakinan untuk menganggarkan perbezaan
penggunaan minyak oleh kereta menggunakan kedua-dua jenis minyak tersebut.
Penyelesaian
12
Statistik Pentaabiran Berkaitan Dua Populasi
Nilai Z bagi 95% selang keyakinan ialah 1.96. Lain-laim maklumat sampel
adalah sebagaimana berikut.
Regular Premium
n1 = 50
1
X = 21.45
S1 = 3.46
n2 = 50
2
X = 24.6
S2 = 2.99
Berdasarkan kepada maklumat tersebut, selang keyakinan ialah

2 1
2 2
-
50
99 . 2

50
46 . 3
1.96 - 24.6) - (21.45 µ µ ≤ +

50
99 . 2

50
46 . 3
1.96 - 24.6) - (21.45
2 2
+
-3.15 – 1.27 ≤ µ1 - µ2 ≤ -3.15 + 1.27
-4.42 ≤ µ1 - µ2 ≤ -1.88
Prob[-4.42 ≤ µ1 - µ2 ≤ -1.88] = 0.95
Kita mempunyai 95% keyakinan bahwa perbezaan sebenar jarak perjalanan di
antaran penggunaan dua jenis minyak ialah di antara –1.88 km/liter dan –14.42
kg/liter. Titik penganggaran ialah –3.15 km/liter
Menandakan satu kumpulan sebagai kumpulan 1 dan kumpulan lain
sebagai kumpulan 2 adalah keputusan yang abritrari. Jika dua kumpulan didalam
Contoh 10.2 disongsangkan, selang keyakinan masih lagi sama, tetapi tandanya
juga songsang dan ketaksamaan juga berubah. Oleh itu penyelidik mesti
mentafsirkan selang keyakinan berpandukan kepada maklumat sampel. Untuk
selang keyakinan didalam contoh 10.2, perbezaan populasi didalam min jarak
perjalanan di antara penggunaan minyak regular dan minyak premium adalah
sebesar –4.42 km/liter. Keputusan ini bermakna penggunaan minyak premium
mempunyai purata 4.42 km/liter lebih daripada minyak regular. Disebelah lain
selang pula menunjukkan, berdasarkan kepada maklumat sampel, perbezaan di
antara penggunaan minyak premium dan regular adalah sekecil 1.88 km/liter.
Selang keyakinan tidak mengandungi nilai 0, yang menunjukkan penemuan tiada
13
13
Pengenalan kepada Statistik Ekonomi dan Perniagaan
perbezaan didalam purata populasi penggunaan dua minnya ini adalah tidak
mungkin. Jika kedua-dua tanda adalah sama didalam selang keyakinan bagi
perbezaan di antara dua min, keseluruhan selang menunjukkan arah perbezaan
yang sama, dan nilai tersebut memberitahu magnitud perbezaan.
Jika selang keyakinan digunakan untuk menguji hipotesis dimana
terdapat perbezaan di antara jarak km/liter di antara minyak regular dan
premium, selang keyakinan memberitahu kita untuk menolak hipotesis nul
disebabkan selang tersebut tidak mengandungi nilai 0. Apabila kedua-dua
hujung selang keyakinan mempunyai tanda yang sama, 0 tidak berada didalam
selang. Didalam contoh 10.2, tanda selang adalah kedua-duanya negatif. Kita
mempunyai keyakinan 95% menyatakan terdapat perbezaan bukan sifar didalam
min. Untuk ujian tersebut, α = 1 – 0.95 = 0.05.
Jika tanda selang keyakinan untuk perbezaan di antara min sampel
berbeza, selang keyakinan mempunyai nilai 0 dan penemuan tidak terdapat
perbezaan yang signifikan didalam min populasi adalah mungkin.
10.2 Ujian Hipotesis dan Selang Keyakinan berkaitan
Perbezaan didalam Dua Min: Sampel Kecil Bebas
dan Varian Tidak Diketahui
Teknik yang dibincangkan didalam Bahagian 10.1 adalah untuk penggunaan
apabila saiz sampel adalah besar atau varian populasi diketahui. Terdapat banyak
keadaan apabila ahli statistik menguji hipotesis atau membina selang keyakinan
berkaitan dua min populasi dan varian populasi tidak diketahui. Jika saiz sampel
adalah kecil, kaedah Z adalah tidak sesuai digunakan. Bahagian ini akan
membincangkan metodologi untuk menguruskan situasi saiz sampel kecil dan
varian populasi tidak diketahui.
10.2.1 Ujian Hipotesis
Ujian hipotesis yang dibincangkan dibahagian ini adalah ujian untuk
membandingkan min dua sampel untuk menentukan sama ada terdapat perbezaan
didalam min dua populasi daripada mana sampel tersebut diambil. Teknik ini
digunakan apabila saiz sampel adalah kecil (n1,n2 < 30), varian populasi tidak
diketahui (dan oleh itu varian sampel akan digunakan) dan sampel adalah bebas.
Andaian disebalik teknik ini ialah pengukuran atau ciri-ciri yang hendak dikaji
mestilah bertaburan normal bagi kedua-dua populasi. Didalam Bahagian 10.1,
perbezaan didalam min sampel bersaiz besar adalah dianalisis menggunakan
Formula 10.1:
14
Statistik Pentaabiran Berkaitan Dua Populasi
2
2
2
1
2
1
2 1 2 1

) - ( - ) X - X (
Z
n n
σ σ
µ µ
+
·
Jika
2
2
2
1
σ σ · , Formula 10.1 secara aljabarnya menjadi
2 1
2 1 2 1
1

1
) - ( - ) X - X (
Z
n n
+
·
µ µ
Jika σ tidak diketahui, ia boleh dianggarkan dengan mengumpulkan dua
varian sampel dan mengira sisihan piawai terkumpul sampel
2
) 1 ( ) 1 (
2 1
2
2
2 1
2
1
− −
− + −
· ≈
n n
n S n S
S σ
S
2
adalah wajaran purata dua varian sampel,
2
1
S dan
2
2
S .
Menggantikan pernyataan ini untuk σ dan mengubah Z kepada t menghasilkan
formula untuk menguji perbezaan didalam mni.
Formula t untuk Menguji Perbezaan di antara
Min dengan Andaian
2
2
2
1
σ σ ·
(10.5)
2 1 2 1
2
2
2 1
2
1
2 1 2 1
1 1
2
) 1 ( ) 1 (
) ( ) (
n n n n
n S n S
X X
t
+
− −
− + −
− − −
·
µ µ
df = n1 + n2 – 2
Formula 10.5 adalah dibina dengan andaian bahawa dua populasi varian,
2
1
σ dan
2
2
σ adalah sama. Oleh itu, apabila menggunakan Formula 10.5 untuk
menguji hipotesis berkaitan perbezaan dua min untuk sampel bersaiz kecil dan
15
15
Pengenalan kepada Statistik Ekonomi dan Perniagaan
bebas serta varian populasi tidak diketahui, kita mesti mengandaikan dua sampel
datangnya dari populasi dimana variannya adalah sama. Jika tidak, formula
berikut mesti digunakan.
Formula t untuk Menguji Perbezaan didalam Min
(10.6)
2
2
2
1
2
1
2 1
n
S

n
S
X - X
t
+
·

2 -
n
S

1
n
S
n
S

n
S
df
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
n n

,
_

¸
¸
+

,
_

¸
¸
1
]
1

¸

+
·
Didalam Formula 10.6, varain populasi tidak diandaikan sama. Oleh
kerana formula ini mempunyai komponen darjah kebebasan yang lebih rumit, ia
tidak menarik minat pengguna. Banyak pakej komputer statistik menawarkan
pilihan formula “terkumpul” dan formula “tidak terkumpul”. Formula
‘terkumpul” didalam pakej komputer Formula 10.5 digunakan apabila diandaikan
varian populasi adalah sama. Formula “tidak terkumpul” adalah pakej komputer
Formula 10.6 yang digunakan apabila varian populasi tidak diandaikan sama.
Sekali lagi, didalam setiap formula ini, populasi dimana dua sampel ini diambil
adalah diandaikan bertaburan normal.
Katakan satu syarikat pengendali seminar mahu menguji perbezaan
didalam min sampel kecil ketibaan peserta seminar. Pekerja baru adalah
dijangkakan hadir 3 hari seminar untuk mempelajari selok belok syarikat. Pada
akhir seminar, ia diuji untuk mengukur pengetahuan mereka berkaitan syarikat.
Kaedah latihan tradisional adalah melalui kuliah dan sesi soal jawab. Pihak
pengurusan mahu mengadakan ujian untuk menentukan perbezaan kaedah
latihan, dimana pekerja baru dilatih selama dua hari menggunakan video kaset da
16
Statistik Pentaabiran Berkaitan Dua Populasi
tidak mempunyai sesi soal jawab. Jika kaedah ini berjaya, ia dapat menjimatkan
perbelanjaan syarikat beribu-ribu ringit untuk beberapa tahun. Walau
bagaimanapun, terdapat kebimbangan keberkesanan kaedah 2-hari tersebut, dan
pengurus syarikat mahu mengetahui sama ada terdapat sebarang perbezaan
didalam keberkesanan dua kaedah latihan tersebut.
Untuk menguji perbezaan didalam dua kaedah ini, pengurus mengambil
sampel rawak 15 orang untuk kumpulan pertama pekerja baru dengan
menggunakan kaedah seminar 3-hari (Kaedah A) dan kumpulan kedua 12 pekerja
baru untuk kaedah video kaset selama dua hari (kaedah B). Jadual 10.2
menunjukkan skor ujian bagi dua kumpulan tersebut. Menggunakan α = 0.05,
pengurus mahu menentukan sama ada terdapat perbezaan yang signifikan
didalam min skor dua kumpulan latihan tersebut. Ia mengandaikan skor bagi
ujian adalah bertaburan normal dan varian populasi adalah sama.
Jadual 10.2
Skor Ujian Bagi Pekerja Naru Selepas Latihan
Kaedah Latihan A Kaedah Latihan B
56 50 52 44 52 59 54 55 65
47 47 53 45 48 52 57 64 53
42 51 42 43 44 53 56 43 57
Langkah 1: Hipotesis bagi ujian ini ialah seperti berikut.
H0: µ1 - µ2 = 0
Ha: µ1 - µ2 ≠ 0
Langka 2: Ujian statistik adalah

2 1 2 1
2
2
2 1
2
1
2 1 2 1
1 1
2
) 1 ( ) 1 (
) ( ) (
n n n n
n S n S
X X
t
+
− −
− + −
− − −
·
µ µ
df = n1 + n2 – 2
Langkah 3: Nilai alpha ialah 0.05
Langkah 4: Disebabkan hipotesis adalah = dan ≠, ujian ini adalah ujian dua
hujung. Darjah kebebasan adalah 25 (15 + 12 – 2 = 25) dan alpha
ialah 0.05. Jadual t memerlukan nilai alpha dipecahkan daripada
0.05 kepada 0.025 untuk memperolehi nilai t: t0.025,25 = t2.060.
17
17
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Langkah 5: Data sampel adalah diberikan didalam Jadual 10.2. Daripada data
tersebut, kita boleh mengira statistik sampel. Min dan varian
sampel adalah sebagaimana berikut.
Kaedah A Kaedah B
n1 = 15
1
X = 47.73
2
1
S = 19.495
n2 = 12
2
X =56.500
2
2
S = 18.273
Langkah 6: Nilai t yang dikira ialah
5.20 -
12
1

15
1
) 2 12 15 (
1) (18.273)(1 4) (19.495)(1
0 - 56.50) - (47.73
t ·
+
− +
+
·
Langkah 7: Disebabkan nilai dikira t = -5.20, adalah kurang daripada nilai jadual
kritikal, t = - 2.06, nilai t yang dikira berada didalam kawasan
penolakan. Hipotesis nul adalah ditolak Oleh itu terdapat perbezaan
yang signifikan didalam min skor bagi dua ujian tersebut.
Langkah 8: Rajah 10.5 menunjukkan kawasan kritukal, nilai t yang dikira, dan
keputusan bagi ujian ini. Perhatikan nilai t yang dikira ialah –5.20,
dimana cukup untuk menyebabkan pengurus pengendali seminar
untuk menolak hipotesis nul. Kesimpulannya ialah terdapat
perbezaan yang signifikan didalam keberkesanan kaedah latihan.
Berdasarkan min sampel, kita menyedari bahawa kaedah B (kaedah
2-hari menggunakan video kaset) sebenarnya memberikan purata
skor 8 markah lebih berbanding dengan kumpulan yang dilatih
menggunakan kaedah A.
Didalam ujian seperti ini, manakah kumpulan yang ditandakan kumpulan
1 dan manakah yang ditandakan sebagai kumpulan 2 adalah keputusan yang
arbitrari. Jika dua sampel ditandakan secara sebaliknya, nilai t yang dikira adalah
t = +5.20 (magnitud yang sama tetapi tanda yang berlawanan), dan keputusan
masih lagi sama.
18
Statistik Pentaabiran Berkaitan Dua Populasi
Rajah 10.5
Nilai t untuk Contoh Kaedah Latihan
Contoh 10.2
Adakah terdapat perbezaan nilai budaya Cina yang memberi kesan terhadap
strategi pembeli industri di Taiwan dan Cina? Kajian oleh penyelidik untuk
menentukan sama ada terdapat perbezaan yang signifikan didalam strategi
pembelian oleh pembeli industri didalam dua negara keatas dimensi budaya yang
dilabelkan sebagai “integrasi”. Integrasi adalah harmoni didalam diri sendiri,
keluarga dan kumpulan. Untuk kajian tersebut, 46 pembeli Taiwan dan 26
pembeli Cina telah dipilih secara rawak dan ditanya melalui soal selidik.
Pembeli tersebut telah ditanya sebanyak 35 soalan menggunakan skala likert 1-9
dimana pemeringkatannya ialah (1) amat tidak penting dan (9) amat penting.
Keputusan statistik bagi dua kumpulan adalah ditunjukkan didalam Langkah 5.
Menggunakan α = 0.05, uji untuk menentukan sama ada terdapat perbezaan yang
signifikan di antara pembeli dua negara ini keatas integrasi.
Penyelesaian.
Langkah 1: Jika ujian dua hujung dijalankan, hipotesis dan nilai jadual t adalah
sebagaimana berkkut.
19
19
t
Kawasan penolakan
Kawasan penolakan
t=-2.06 t=0.0 t=+2.06
t=-5.20

2 1
X X −
µ1-µ2=0.0

2 1
X X − =-8.77
Pengenalan kepada Statistik Ekonomi dan Perniagaan
H0: µ1 - µ2 = 0
Ha: µ1 - µ2 ≠ 0
Langkah 2: Ujian statistik yang sesuai ialah
2 1 2 1
2
2
2 1
2
1
2 1 2 1
1 1
2
) 1 ( ) 1 (
) ( ) (
n n n n
n S n S
X X
t
+
− −
− + −
− − −
·
µ µ
Langkah 3: Nilai alpha ialah 0.01
Langkah 4: Oleh kerana saiz sampel adalah 46 dan 26, maka terdapat 70 darjah
kebebasan. Dengan angka ini dan
2
α
= 0.005, nilai kritikal jadual t
boleh ditentukan sebagai
t0.005,70 = 2.660
Langkah 5: Data sampel adalah
INTEGRASI
Pembeli Taiwan Pembeli Cina
n1 = 46
1
X = 5.42
2
1
S = (0.58)
2
= 0.3364
n2 = 26
2
X = 5.04
2
2
S = (0.49)
2
= 0.2401
df = n1 + n2 – 2 = 46 + 26 – 2 = 70
Langkah 6: Nilai t yang dikira ialah
2.82
26
1

46
1
) 2 26 46 (
) 25 )( 2401 . 0 ( ) 45 )( 3364 . 0 (
0 - 5.04) - (5.42
t ·
+
− +
+
·
Langkah 7: Disebabkan nilai t yang dikira t = 2.82 lebih besar daripada nilai
kritikal jadual t = 2.66, keputusannya ialah menolak hipotesis nul.
20
Statistik Pentaabiran Berkaitan Dua Populasi
Langkah 8: Pembeli industri dari Taiwan mempunyai skor yang signifikan lebih
tinggi berbanding pembeli dari Cina terhadap integrasi. Oleh itu
pengurus perlu memberi perhatian bahawa dengan pembeli dari
Taiwan mereka lebih memberikan ketaatan kepada diri sendiri dan
hiraki sosial berbanding dengan pembeli Cina.
Geraf berikut menunjukkan nilai kritikal t, kawasan penolakan, nilai t yang dikira
dan perbezaan di antara min.
10.2.2 Selang Keyakinan
Formula selang keyakinan boleh diterbitkan untuk menganggarkan
perbezaan didalam min populasi bagi sampel bebas bersaiz kecil apabila vaarian
populasi tidak diketahui. Tumpuan didalam bahagian ini hanyalah selang
keyakinan apabila varian populasi diandaikan sama dan populasi adalah
bertaburan normal.
21
21
t=-2.66 t=0.0 t=2.66
t=2.82

2 1
X X −
µ1-µ2=0.00
2 1
X X − =0.38
t
Kawasan Kawasan
Penolakan Penolakan
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Selang Keyakinan untuk Menganggar µ1 - µ2 dengan sampel kecil
Mengandaikan Varian Populasi Tidak Diketahui dan Sama
(10.7)
2 1 2 1
2
2
2 1
2
1
2 1
1 1
) 2 (
) 1 ( ) 1 ( S
t ) X - X (
n n n n
n S n
+
− +
− + −
t
df = n1 + n2 – 2
Oleh kerana tiada jaminan bahawa perbezaan didalam min populasi
boleh berada didalam selang, formula tersebut boleh disusun semula sebagai
kenyataan kebarangkalian sebagaimana berikut.
α
µ µ
- 1
1 1
) 2 (
) 1 ( ) 1 ( S
t ) X - X (
2 - 1
1 1
) 2 (
) 1 ( ) 1 ( S
t ) X - X ( Prob
2 1 2 1
2
2
2 1
2
1
2 1
2 1 2 1
2
2
2 1
2
1
2 1
·
1
1
]
1
+
− +
− + −
+ ≤

¸

≤ +
− +
− + −

n n n n
n S n
n n n n
n S n
Satu kumpulan penyelidik telah menjalankan kajian untuk menentukan
sama ada terdapat perbezaan di antara wanita dan lelaki didalam ujian kepintaran.
Kajian adalah berdasarkan kepada soalan bertulis yang sama terhadap kumpulan
tersebut. Katakan sampel rawak keputusan ujian 9 wanita dan 10 lelaki telah
diambil didalam kajian ini. Keputusan ujian tersebut berdasarkan markah 50%
adalah ditunjukkan didalam Jadual 10.3.
Nilai jadual t untuk 99% selang keyakinan dan 17 darjah kebebasan
ialah t0.005,17 = 2.898. Selang keyakinan ialah
10
1

9
1

2 10 9
(9) (1.253) (8) (1.727)
2.898 34.99) - (37.09
2 2
+
− +
+
t
-2.10 t 1.99
0.11 ≤ µ1 - µ2 ≤ 4.09
22
Statistik Pentaabiran Berkaitan Dua Populasi
Prob[0.11 ≤ µ1 - µ2 ≤ 4.99] = 0.99
Jadual 10.3
Markah Bagi Ujian Kepintaran
Wanita Lelaki
35.38 35.03
37.06 33.90
37.74 34.56
36.97 36.24
37.84 34.59
37.50 34.95
40.75 33.30
35.31 34.73
35.30 34.79
37.83
n1 = 9
1
X = 37.09
S1 = 1.727
n2 = 10
2
X =34.99
S2 = 1.253
Df = 9 + 10 – 2 = 17
Penyelidik adalah 99% yakin adalah benar terdapat perbezaan kepintaran
didalam min populasi di antara wanita dan lelaki ialah di antara 0.11 dan 4.09.
Sifar tidak berada didalam selang ini, oleh itu ia boleh membuat kesimpulan
terdapat perbezaan yang signifikan didalam markah ujian kepintaran di antara
wanita dan lelaki. Markah tertinggi menunjukkan lebih pintar. Oleh itu,
kemungkinan untuk membuat kesimpulan dari Jadual 10.3 dan selang keyakinan
ini bahawa kaum wanita mempunyai kepintaran yang lebih tinggi.
Contoh 10.4
Pengilang kopi berminat untuk menganggarkan perbezaan didalam purata
penggunaan kopi nagi peminum kopi segar dan peminum Nescafe. Penyelidik
telah memilih sampel rawak 13 peminum kopi segar dan 15 peminum Nescafe
dan ditanya berapa cawan yang diminum setiap hari. Purata untuk kopi segar
ialah 4.35 cawan dengan sisihan piawai 1.20 cawan. Purata untuk Nefcafe pula
23
23
Pengenalan kepada Statistik Ekonomi dan Perniagaan
ialah 6.84 cawan dengan sisihan piawai 1.42 cawan. Penyelidik mengandaikan,
bagi setiap populasi, penggunaan harian kopi adalah bertaburan normal, dan
menjalankan 95% selang keyakinan untuk menganggarkan perbezaan purata
didalam dua populasi in.
Penyelesaian:
Jadual t bagi masalah ini ialah t0.025,26 = 2.056. Penganggaran selang keyakinan
ialah
15
1

13
1

2 15 13
(14) (1.42) (12) (1.20)
2.056 6.84) - (4.35
2 2
+
− +
+
t
-2.49 t 1.03
-3.52 ≤ µ1 - µ2 ≤ -1.46
Prob[-3.52 ≤ µ1 - µ2 ≤ -1.46] = 0.95
Penyelidik mempunyai 95% keyakinan untuk menyatakan didalam populasi
purata penggunaan harian minuman kopi di antara kopi segar dan Nescafe oleh
penggemar kopi ialah di antara 1.46 cawan dan 3.52 cawan. Penganggaran titik
bagi perbezaan didalam min populasi ialah 2.49 cawan dengan ralat 1.03 cawan.
10.3 Statistik Pentaabiran bagi Dua Populasi Yang
Berhubungan
Didalam bahagian yang lepas, hipotesis adalah diuji dan selang keyakinan
dianggarkan berkaitan perbezaan didalam dua min populasi apabila sampel
adalah bebas. Didalam bahagian ini, kaedah yang akan dibincangkan ialah
menganalisis sampel tidak bebas atau berhubungan. Sesetangah penyelidik
merujuk ujian seperti ini sebagai ujian pasangan-berpadanan. Istilah lain pula
dipanggil sebagai ujian t untuk pengukuran yang berhubungan atau ujian t
berkorelasi.
Apakah jenis situasi dimana dua sampel yang dikaji adalah berhubungan
atau tidak bebas? Kita mulakan dengan kajian sebelum dan selepas. Kadang-
kadang sebagai ujikaji mekanisma kawalan, individu atau objek yang sama
adalah diukur sebelum dan selepas sesuatu rawatan. Sebenarnya, selepas
24
Statistik Pentaabiran Berkaitan Dua Populasi
pengukuran adalah tidak bebas daripada sebelum pengukuran disebabkan
pengukuran adalah diambil dari individu atau objek yang sama didalam kedua-
dua kes. Jadual 10.4 memberikan data daripada kajian hipotetikal dimana
individu adalah ditanya untuk memberi pemeringkatan kepada syarikat sebelum
atau selepas 1 minggu melihat 4 minit video kaset syarikat dua hari sekali. Skor
sebelum adalah satu sampel dan skor selepas adalah sampel yang kedua, tetapi
setiap pasangan skor adalah berhubungan disebabkan dua pengukuran digunakan
kepada individu yang sama. Skor sebelum dan selepas kelihatannya tidak
berbeza dari satu individu dengan individu yang lain sebagaimana skor yang
diperolehi dari sampel bebas disebabkan individu akan bias terhadap perniagaan
atau syarikat yang dikaji. Bias individu ini akan memberi kesan terhadap kedua-
dua skor sebelum dan selepas didalam cara yang sama kerana setiap pasangan
skor adalah diukur dari individu yang sama.
Jadual 10.4
Pemeringkatan Syarikat
(skala dari 0 hingga 50)
Individu Sebelum Selepas
1 32 39
2 11 15
3 21 35
4 17 13
5 30 41
6 38 39
7 14 22
Satu contoh lain yang berkaitan dengan ukuran sampel termasuklah
kajian dimana pasangan kembar, suami-isteri, atau ahli keluarga adalah padanan
dan mengambil dua kumpulan yang berbeza. Sebagai contoh, pereka fesyen
mungkin berminat didalam membandingkan persepsi lelaki dan wanita terhadap
pakaian wanita. Jika lelaki dan wanita yang diambil untuk kajian adalah
pasangan suami isteri, ia akan membuatkan hubungan didalam pengukuran dua
kumpulan tersebut. Skor yang akan diperolehi mungkin hampir sama atau
berhubungan berbanding dengan kumpulan bebas sampel lelaki dan wanita yang
dipilih secara rawak disebabkan latar belakang atau citarasa yang sama.
25
25
Pengenalan kepada Statistik Ekonomi dan Perniagaan
10.3.1 Ujian Hipotesis
Formula t untuk menguji perbezaan didalam dua populasi yang
berhubungan
(10.8)

,
_

¸
¸
·
n
S
- D d
t
d
df = n – 1
dimana
n = bilangan pasangan
d = perbezaan sampel didalam pasangan
D = perbezaan min populasi
Sd = perbezaan sisihan piawai sampel
d = perbezaan min sampel
Ujian t ini bagi pengukuran tidak bebas menggunakan perbezaan sampel,
d, di antara nilai sampel pasangan individu sebagai asas pengukuran analisis
berbanding nilai sampel individu. Analisis nilai d secara berkesan mengubah
masalah daripada masalah dua-sampel kepada perbezaan sampel tunggal, dimana
ia menerima pakasi dormula min sampel-tunggal. Ujian ini menggunakan
perbezaan min sampel, d , dan perbezaan sisihan piawai, Sd, dimana boleh
dikira menggunakan Formula (10.9) dan (10.10)
Formula untuk d dan Sd
(10.9)
n
d
d

·
(10.10)
( )
1
d
- d

1
) d - (d
Sd
2
2
2

·

·



n
n
n
26
Statistik Pentaabiran Berkaitan Dua Populasi
Andaian bagi ujian didalam analisis sampel kecil ialah perbezaan dua
populasi adalah bertaburan normal.
Menganalisis data menggunakan kaedah ini melibatkan pengiraan nilai t
dengan Formula 10.8 dan membandingkannya dengan nilai t kritikal yang
diperolehi dari jadual. Nilai t kritikal adalah diperolehi dari jadual taburan t
dengan cara yang biasa, menggunakan darjah kebebasan (n – 1), n ialah bilangan
skor pasangan.
Sebelas pekerja telah diletakkan di bawah perhatian panel kesihatan
disebabkan tingginya kandungan kolestrol didalam badan. Doktor telah memberi
nasihat tentang bahaya keadaan ini dan meletakkan mereka didalam diet
makanan yang baru. Ditunjukkan didalam Jadual 10.5 bacaan bagi 11 pekerja
tersebut sebelum dan selepas 1 bulan mengamalkan diet baru. Pengurus syarikat
pekerja tersebut mahu menjalankan ujian statistik untuk menentukan sama ada
terdapat perbezaan yang signifikan kandungan kolestrol sebelum dan selepas diet
baru tersebut diamalkan.
Jadual 10.5
Kandungan Kolestrol Sebelum dan Selepas Diet Baru
Pekerja Sebelum Selepas
1 255 197
2 230 225
3 290 215
4 242 215
5 300 240
6 250 235
7 215 190
8 230 240
9 225 200
10 219 203
11 236 223
Disebabkan ujian adalah untuk menentukan ujudnya perbezaan yang
signifikan di antara dua sampel, hipotesis adalah ujian dua hujung.

Langkah 1: Menentukan hipotesis
H0: D = 0
Ha: D ≠ 0
Langkah 2: Ujian statistik yang sesuai
27
27
Pengenalan kepada Statistik Ekonomi dan Perniagaan

,
_

¸
¸
·
n
S
- D d
t
d
Langkah 3: Gunakan α = 0.01
Langkah 4: Disebabkan α = 0.01 dan ujian ini adalah ujian dua hujung,
2
α
=
0.005 adalah digunakan untuk memperolehi nilai t jadual. Dengan
pasangan data, n = 11, df = n – 1 = 11 – 1 =10. Nilai jadual t ialah
t0.005,10 = t3.169. Jika ujian statistik yang dikira lebih besar daripada
+3.169 atau lebih kecil daripada –3.169, hipotesis nul akan ditolak.
Langkah 5: Data sampel adalah diberikan didalam Jadual 10.5
Langkah 6: Jadual 10.6 menunjukkan pengiraan yang diperolehi nilai t yang
dikira, dimana t = +3.7855
Jadual 10.6
Analisis Kandungan Kolestrol
Pekerja Sebelum Selepas d
1 255 197 58
2 230 225 5
3 290 215 75
4 242 215 27
5 300 240 60
6 250 235 15
7 215 190 25
8 230 240 -10
9 225 200 25
10 219 203 16
11 236 223 13
d = 28.0909, Sd = 24.6114, n = 11
t dikira =
3.7855
11
6114 . 24
0 - 28.0909
·

,
_

¸
¸
28
Statistik Pentaabiran Berkaitan Dua Populasi
Langkah 7: Disebabkan nilai t yang dikira lebih besar daripada nilai kritikal
jadual t (t = 3.7885 > t0.005,11 = 3.169) maka ia didalam
kawasan penolakan.
Langkah 8: Maka terdapat bukti yang mencukupi untuk menyatakan
terdapat perbezaan yang signifikan didalam purata kandungan
kolestrol sebelum dan selepas mengamalkan diet baru. Geraf
didalam rajah 10.8 menunjukkan kawasan penolakan, nilai
kritikal t, dan nilai t yang dikira nagi sampel ini.
Rajah 10.8
Geraf Menunjukkan Analisis kandungan Kolestrol
Contoh 10.5
Katakan anda mahu menjalankan kajian untuk membandingkan kelajuan menaip
menggunakan pemprosesan perkataan komputer berbanding menggunakan mesin
taip elektronik. Anda percya menggunakan komputer adalah lebih cepat
berbanding menggunakan mesin taip elektronik. Untuk menguji pendapat ini,
anda memilih secara rawak 12 orang setiausaha yang telah biasa menggunakan
mesin teip elektronik dan tahu menggunakan pemprosesan perkataan komputer.
Kelajuan menaip dikira berdasarkan bilangan perkataan seminit dan ditunjukkan
didalam jadual berikut. Menggunakan 1% selang keyakinan untuk menguji sama
29
29
t=-3.169 t=0.0 t=+3.169
t=+3.7855
d
D=0 d =28.0909
t
Kawasan Penolakan Kawasan Penolakan
Pengenalan kepada Statistik Ekonomi dan Perniagaan
ada pemprosesan perkataan berkomputer adalah lebi cepat berbanding
menggunakan mesin taip elektronik.
Setiausaha Komputer Mesin Taip
1 62 51
2 49 43
3 70 55
4 65 62
5 49 51
6 96 78
7 66 62
8 63 49
9 69 65
10 88 78
11 59 54
12 41 38
Penyelesaian:
Disebabkan kumpulan setiausaha yang diukur menggunakan mesin taip
elektronik adalah kumpulan yang sama dikaji menggunakan pemprosesan
perkataan berkomputer, ia merupakan kajian kumpulan yang berhubungan.
Hipotesis adalah ujian satu hujung.
Langkah 1: Hipotesis adalah
H0: D = 0
Ha: D > 0
Apa yang hendak anda buktikan ialah pemprosesan perkataan
berkomputer adalah lebih cepat berbanding mesin taip elektronik. Cepat
bermakna lebih perkataan seminit, oleh itu kita mahu perbezaan populasi
adalah positif. Ini menghasilkan hipotesis alternatif. Hipotesis nul ialah
pemprosesan perkataan berkomputer adalah sama dengan mesin taip
elektronik.
Langkah 2: Ujian statistik yang bersesuaian ialah
30
Statistik Pentaabiran Berkaitan Dua Populasi

,
_

¸
¸
·
n
S
- D d
t
d
Langkah 3: Kadar ralat Jenis I ialah 0.01
Langkah 4: Darjah kebebasan adalah n – 1 = 12 – 1 = 11. Untuk α = 0.01, nilai
jadual t ialah t0.01,11 = 2.718. Peraturan keputusan ialah untuk
menolak hipotesis nul jika nilai t yang dikira lebih besar daripada
nilai jadual t.
Langkah 5: Data sampel adalah sebagaimana berikut.
Setiausaha Komputer Mesin Taip d
1 62 51 11
2 49 43 6
3 70 55 15
4 65 62 3
5 49 51 -2
6 96 78 18
7 66 62 4
8 63 49 14
9 69 65 4
10 88 78 10
11 59 54 5
12 41 38 3
d = 7.583 dan Sd = 5.961
Langkah 6: Nilai t yang dikira ialah
4.41
12
5.961
0 - 7.583
t ·

,
_

¸
¸
·
Langkah 7: Oleh kerana nilai t yang dikira lebih besar daripada nilai jadual t,
maka hipotesis nul ditolak.
31
31
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Langkah 8: Terdapat bukti yang mencukupi untuk menyatakan purata perbezaan
didalam perkataan seminit di antara pemprosesan perkataan
berkomputer dan mesin taip elektronik adalah lebih besar daripada
sifar. Menggunakan pemprosesan perkataan berkomputer adalah
lebih cepat berbanding menggunakan mesin taip elektronik. Geraf
berikut menunjukkan nilai yang dikira, kawasan penolakan, dan
nilai t kritikal bagi masalah.
10.3.2 Selang Keyakinan
Kadang-kadang penyelidik berminat didalam menganggar perbezaan min dua
populasi bagi sampel yang berhubungan. Selang keyakinan untuk D, perbezaan
min populasi dua sampel yang berhubungan, boleh dibangunkan secara aljabar
dengan menyusun semula formula 10.8, yang digunakan untuk menguji hipotesis
berkaitan D. Sekali lagi andaiannya ialah sampel saiz yang kecil bagi perbezaan
populasi yang bertaburan secara normal.
32
t
t=0.00 t=2.718
t dikira = 4.41
d
D=0.0
d =7.583
Statistik Pentaabiran Berkaitan Dua Populasi
Formula Selang keyakinan untuk Menganggar
Perbezaan didalam Populasi Tidak Bebas
n
S
t d
d
t
(10.11) atau
n
S
t d D
n
S
t d
d d
+ ≤ ≤ −
Ini tidak menjamin D akan berada didalam selang. Formula 10.11 boleh
ditulis semula didalam kenyataan kebarangkalian
α − ·
1
]
1

¸

+ ≤ ≤ − 1 Pr
n
S
t d D
n
S
t d ob
d d
Contoh berikut menunjukkan penggunaan Formula 10.11. Jualan rumah
baru adalah turun naik mengikut musim. Keadaan musiman ini menunjukkan
keadaan ekonomi dan pusingan perniagaan yang memberi kesan keatas jualan
rumah. Katakan Kementerian Kerajaan Tempatan mahu menganggarkan purata
perbezaan didalam bilangan jualan rumah baru di Kuala Lumpur di antara 1998
dan 2000. Untuk melakukannya, kementerian memilih secara rawak 18 firma
pemaju perumahan dan memperolehi angka jualan untuk Mei, 1998 dan Mei,
2000. Bilangan jualan rumah baru setiap firma ditunjukkan didalam Jadual 10.7.
Menggunakan data ini, kementerian menganggar purata perbezaan bilangan
jualan rumah baru oleh firma di Kuala Lumpur untuk Mei, 1998 dan Mei, 2000
dan melakukan 99% selang keyakinan.
Bilangan pasangan, n, ialah 18, dan darjah kebebasan ialah 17. Untuk
selang keyakinan 99% dan darjah kebebasan ini, nilai jadual t, t0.005,17 = 2.898.
Nilai d, d , dan Sd adalah ditunjukkan didalam Jadual 10.8
33
33
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Jadual 10.7
Bilangan Rumah Baru Dijual Di Kuala Lumpur
Firma Mei 1998 Mei 2000
1 8 11
2 19 30
3 5 6
4 9 13
5 3 5
6 0 4
7 13 15
8 11 17
9 9 12
10 5 12
11 8 6
12 2 5
13 11 10
14 14 22
15 7 8
16 12 15
17 6 12
18 10 10
34
Statistik Pentaabiran Berkaitan Dua Populasi
Jadual 10.8
Perbezaan didalam Bilangan Rumah baru yang Dijual, 1998-2000
Firma Mei 1998 Mei 2000 d
1 8 11 -3
2 19 30 -11
3 5 6 -1
4 9 13 -4
5 3 5 -2
6 0 4 -4
7 13 15 -2
8 11 17 -6
9 9 12 -3
10 5 12 -7
11 8 6 2
12 2 5 -3
13 11 10 1
14 14 22 -8
15 7 8 -1
16 12 15 -3
17 6 12 -6
18 10 10 0
d = -3.39 Sd = 3.27
Titik penganggaran perbezaan ialah d = -3.39. Selang keyakinan 99%
ialah
n
S
t d
d
t
23 . 2 39 . 3
18
27 . 3
898 . 2 39 . 3 t − · t −
-5.62 ≤ D ≤ -1.16
Prob[-5.62 ≤ D ≤ -1.16] = 0.99
Penganalisis menganggarkan dengan 99% selang keyakinan purata
perbezaan jualan rumah baru di Kuala Lumpur di antara Mei, 1998 dan Mei,
2000 oleh firma pemaju perumahan ialah di antara –5.62 dan –1.16. Disebabkan
jualan 2000 ditolak dari jualan 1998, tanda negatif menunjukkan lebih jualan
35
35
Pengenalan kepada Statistik Ekonomi dan Perniagaan
pada tahun 2000 berbanding tahun 1998. Perhatikan bahawa selang keyakinan
mempunyai tanda negatif pada kedua-dua hujung. Keputusan ini bermakna
penganalisis yakin dengan 99% bahawa perbezaan sifar bukan merupakan purata
perbezaan. Jika penganalisis menggunakan selang keyakinan untuk menguji
hipotesis dimana tidak terdapat perbezaan min yang signifikan didalam jualan
rumah baru oleh firma di Kuala Lumpur di antara Mei, 1998 dan Mei, 2000,
maka hipotesis nul adalah ditolak untuk α = 0.01. Penganggaran titik bagi
contoh ini ialah –3.39 dengan ralat 2.23 buah rumah.
10.4 Statistik Pentaabiran berkaitan Perkadaran Dua
Populasi
Kadang-kadang penyelidik mahu untuk membuat pentaabiran berkaitan
perbezaan didalam dua perkadaran populasi. Analisis jenis ini mempunyai
banyak kegunaan didalam perniagaan, seperti membandingkan bahagian pasaran
keluaran untuk dua pasaran yang berbeza, mengkaji perbezaan didalam
perkadaran pelanggan wanita didalam dua kawasan geografi yang berbeza, atau
membandingkan perkadaran keluaran yang rosak daripada satu tempoh masa
dengan tempoh masa yang lain. Didalam membuat pentaabiran berkaitan
perbezaan didalam dua perkadaran populasi, biasanya statistik yang digunakan
ialah perbezaan didalam perkadaran sampel:
2 1
ˆ ˆ p p − . Statistik ini adalah dikira
dengan mengambil sampel rawak dan menentukan

bagi setiap sampel untuk
ciri-ciri yang diminati; kemudian mengira perbezaan didalam perkadaran sampel
ini.
Teorem had memusat menyatakan untuk sampel bersaiz besar (setiap
1 1
ˆ . p n ,
1 1
ˆ .q n ,
2 2
ˆ . p n , dan
2 2
ˆ .q n >5 dimana
p q ˆ 1 ˆ − ·
, perbezaan didalam
perkadaran sampel adalah bertaburan normal dengan perbezaan min
2 1 ˆ ˆ
2 1
- P P μ
P - P
·
dan sisihan piawai perbezaan didalam perkadaran sampel ialah
2
2 2
1
1 1
ˆ ˆ
2 1
n
Q P

n
.Q P
σ
P - P
+ ·
Dari maklumat ini, Formula Z untuk perbezaan perkadaran populasi
boleh diperolehi.
36
Statistik Pentaabiran Berkaitan Dua Populasi
Formula Z untuk Perbezaan didalam Dua Perkadaran Populasi
(10.12)
2
2 2
1
1 1
2 1 2 1
ˆ ˆ
n
Q P

n
Q P
) - P ) - (P p - p (
Z
+
·
dimana
1
ˆ p = perkadaran darai sampel 1
2
ˆ p = perkadaran dari sampel2
n1 = saiz sampel 1
n2 = saiz sampel 2
P1 = Perkadaran populasi 1
P2 = Perkadaran populasi 2
Q1 = 1 – P1
Q2 = 1 – P2
10.4.1 Ujian Hipotesis
Formula 10.12 aalah formula yang boleh digunakan untuk mengenalpasti
kebarangkalian memperolehi perbezaan tertentu didalam dua perkadaran sampel
apabila diberi nilai perkadaran populasi. Didalam menguji hipotesis berkenaan
perbezaan didalam dua perkadaran populasi, nilai khusus perkadaran populasi
biasanya tidak diketahui atau diandaikan. Hipotesis adalah berkaitan dengan
perbezaan didalam dua perkadaran populasi (P1 – P2). Perhatikan bahawa
Formula 10.12 memerlukan pengetahuan tentang P1 dan P2. Oleh itu, versi
Formula 10.12 yang diubahsuaikan adalah digunakan apabila menguji hipotesis
berkaitan P1 – P2. Formula ini menggunakan nilai terkumpul daripada
perkadaran sampel untuk menggantikan perkadaran populasi didalam
denominator Formula 10.12.
Denominator Formula 10.12 ialah sisihan piawai perbezaan didalam dua
perkadaran sampel dan menggunakan perkadaran populasi didalam
pengiraannya. Walau bagaimanapun, perkadaran populasi adalah tidak
diketahui, oleh itu anggaran sisihan piawai perbezaan didalam dua perkadaran
populasi adalah dibuat dengan menggunakan perkadaran sampel sebagai titik
penganggaran perkadaran populasi. Perkadaran sampel adalah digabungkan
dengan menggunakan purata wajaran untuk menghasilkan P , dimana didalam
hubungan dengan
Q
dan saiz sampel menghasilkan titik penganggaran bagi
sisihan piawai perbezaan didalam perkadaran sampel. Keputusannya ialah
37
37
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Formula 10.13, yang akan kita gunakan untuk menguji hipotesis berkaitan dua
perkadaran populasi.
Formula Z untuk Menguji Perbezaan Perkadaran Populasi
(10.13)

,
_

¸
¸
+
·
2 1
2 1 2 1
1 1
) Q . P (
ˆ ˆ
n n
) - P ) - (P p - p (
Z
dimana

P - 1 Q
n n
pˆ n pˆ n

n n
X X
P
2 1
2 2 1 1
2 1
2 1
·
+
+
·
+
+
·
Menguji perbezaan didalam dua perkadaran populasi adalah berguna
apabila penyelidik berminat didalam membandingkan perkadaran satu populasi
yang mempunyai ciri-ciri tertentu dengan perkadaran populasi kedua yang
mempunyai ciri-ciri yang sama. Sebagai contoh, penyelidik mungkin berminat
didalam menentukan perkadaran mereka yang gemar memandu kereta baru
(kurang dari satu tahun) di Melaka adalah berbeza dengan perkadaran di Ipoh.
Kajian boleh dilakukan dengan mengambil sampel rawak pemandu di Melaka
dan sampel rawak pemandu di Ipoh. Hasil kajian mungkin boleh digunakan
untuk membandingkan potensi kereta baru didua pasaran dan kecenderungan
pemandu didalam kawasan ini untuk membeli kereta baru.
Adakah pelanggan dan CEO mempunyai perbezaan didalam persepsi
etika perniagaan? Sekumpulan penyelidik cuba untuk menguji untuk menentuka
sama ada terdapat perbezaan didalam perkadaran pelanggan dan perkadaran CEO
yang mempercayai kehilangan satu pekerjaan mempunyai pengaruh yang kuat
terhadap gelagat etika. Didalam kajia tersebut, mereka mendapati 57% daripada
pelanggan menyatakan bahawa kehilangan satu pekerjaan mempunyai pengaruh
yang kuat keatas gelagat etika tetapi hanya 50% sahaja CEO yang beranggapan
sedemikian.
Katakan data telah dipungut dari sampel rawak 755 pelanggan dan 616
CEO. Adakah penyelidik mempunyai bukti yang mencukupi untuk menyatakan
pelanggan mempunyai perkadaran yang lebih tinggi berbanding CEO didalam
mempercayai kehilangan satu pekerjaan mempunyai pengaruh yang kuat
terhadap etika perniagaan.
38
Statistik Pentaabiran Berkaitan Dua Populasi
Langkah 1: Katakan sampel 1 ialah sampel pelanggan dan sampel 2 ialah
sampel CEO. Disebabkan kita cuba untuk membuktikan pelanggan
mempunyai perkadaran yang tertinggi berbanding CEO terhadap
etika, maka hipotesis alternatif sepatutnya P1 – P2 > 0. Hipotesis
berikut adalah diuji.
H0: P1 – P2 = 0
Ha: P1 – P2 > 0
dimana
P1 ialah perkadaran pelanggan yang memilih faktor
P2 ialah perkadaran CEO yang memilih faktor
Langka 2: Ujian statistik yang sesuai ialah

,
_

¸
¸
+
·
2 1
2 1 2 1
1 1
) Q . P (
ˆ ˆ
n n
) - P ) - (P p - p (
Z
Langkah 3: Nilai alpha ialah α = 0.10
Langkah 4: Oleh kerana ujian ini adalah ujian satu hujung, nilai kritikal jadual Z
ialah Zc = 1.28. Jika nilai Z yang dikira lebih besar daripada 1.28,
hipotesis nul ditolak. Rajah 10.11 menunjukkan kawasan penolakan
dan nilai kritikal bagi masalah ini.
Langkah 5: Maklumat sampel ialah
Pelanggan CEO
N1 = 755 n2 = 616
1
ˆ p = 0.57
2
ˆ p = 0.50
Langkah 6: Nilai statistik yang dikira
2 1
2 2 1 1
n n
pˆ n pˆ n
P
+
+
·
=
0.539
616 755
) (616)(0.50 ) (755)(0.57
·
+
+
39
39
Pengenalan kepada Statistik Ekonomi dan Perniagaan
0.461 0.539 - 1 P - 1 Q · · ·
Rajah 10.11
Kawasan penolakan untuk Masalah Etnik
Jika statistik diberi nilai data mentah berbanding perkadaran sampel,
kita perlu menggunakan formula berikut:

n n
X X
P
2 1
2 1
+
+
·
Nilai Z yang dikira ialah
2.59
616
1

755
1
) 461 . 0 )( 539 . 0 (
(0) - 0.50) 0 (0.57
Z ·

,
_

¸
¸
+
·
Langkah 7: Disebabkan Z = 2.59 adalah lebih besar daripada nilai kritikal
jadual Z, 1.28, dan ia berada didalam kawasan penolakan, maka
hipotesis nul ditolak.
40
Z=0.0 Z=1.28

2 1
ˆ ˆ p p −
P1-P2=0.00
Z
Kawasan Penolakan

α=0.10
Statistik Pentaabiran Berkaitan Dua Populasi
Langkah 8: Perkadaran pelanggan yang signifikan lebih tinggi berbanding
CEO didalam mempercayai kehilangan satu pekerjaan adalah
pengaruh yang kuat keatas gelagat etika. CEO mungkin mahu
melihat cara lain yang mempengaruhi etika perniagaan. Jika
pekerja lebih mengemari pelanggan berbanding CEO, CEO
mungkin berkebolehan untuk melihat kehilangan satu pekerjaan
sebagai alat untuk memastikan gelagat etika didalam kerja.
Contoh 10.6
Satu kajian keatas usahawan wanita telah dijalankan untuk menentukan definasi
kejayaan sebagai jualan/keuntungan. Usahawan tersebut telah dibahagikan
kepada dua kumpulan menurut jumlah jualan kasar. Perkadaran tertinggi
usahawan didalam kategori RM100,000 – RM500,000 berbanding didalam
kumpulan kurang daripada RM100,000 kelihatan sebagai kadar
jualan/keuntungan sebagai definasi kejayaan.
Katakan anda melakukan kajian untuk menguji keputusan dengan melakukan
survei sendiri dan mengenalpasti usahawan wanita melalui jualan kasar. Anda
menemuduga 100 usahawan yang mempunyai jualan kasar kurang dari
RM100,00 dan 24 daripada mereka didefinasikan sebagai berjaya. Anda
kemudiannya menemuduga 95 orang usahawan wanita yang mempunyai jualan
kasar RM100,000 – RM500,00 dan 39 daroipadanya adalah didefinasikan
sebagai berjaya. Gunakan maklumat ini untuk menguji sama ada terdapat
perbezaan yang signifikan didalam perkadaran dua kumpulan yang didefinasikan
sebagai berjaya. Gunakan α = 0.01.
Penyelesaian:
Langkah 1: Anda menguji untuk menentukan sama ada terdapat perbezaan di
antara dua kumpulan usahawan, oleh itu ujian dua hujung adalah
diperlukan. Hipotesis adalah sebagaimana berikut:
H0: P1 – P2 = 0
Ha: P1 – P2 ≠ 0
Langkah 2: Formula yang sesuai ialah seperti berikut
41
41
Pengenalan kepada Statistik Ekonomi dan Perniagaan

,
_

¸
¸
+
·
2 1
2 1 2 1
1 1
) Q . P (
ˆ ˆ
n n
) - P ) - (P p - p (
Z
Langkah 3: Alpha yang telah ditetapkan ialah 0.01
Langkah 4: Dengan α = 0.01 anda memperolehi nilai kritikal Z dari Jadual A.5
untuk
2
α
= 0.005, Z0.005 = t2.575. Jika nilai Z yang dikira
kurang daripada –2.575 atau Z lebih besar daripada 2.575, maka
hipotesis nul ditolak,
Langkah 5: Maklumat sampel ialah
Kurang dari RM100,000 RM100,000 – RM500,000
n2 = 100 n2 = 95
X2 = 24 X2 = 39
2
ˆ p =
100
24
= 0.24
2
ˆ p =
95
39
=0.41
Dimana
0.677 1
0.323
195
63

95 100
39 24

2 1
2 1
· ·
· ·
+
+
·
+
+
·
P - Q
n n
X X
P
X = bilangan usahawan yang menentukan kejayaan
jualan/keuntungan
Langkah 6: Nilai z yang dikira
2.54 -
0.067
0.17 -

95
1

100
1
) 677 . 0 )( 323 . 0 (
(0) - 0,41) - (0.24
Z · ·

,
_

¸
¸
+
·
Langkah 7: Walaupun nilai Z yang dikira hampir dengan kawasan penolakan, ia
masih lagi berada dikawasan bukan penolakan. Hipotesis nul tidak
boleh ditolak. Iaitu, tiada bukti yang mencukupi disini untuk
menolak hipotesis nul dan menyatakan maklum balas kepada soalan
oleh dua kumpulan adalah berbeza dari segi statistik. Perhatikan,
42
Statistik Pentaabiran Berkaitan Dua Populasi
nilai alpha adalah kecil dan ujian dua hujung dijalankan. Jika ujian
satu hujung dijalankan, Zc akan mempunyai Z0.01 = -2.44, dan
hipotesis nul akan ditolak. Jika alpha adalah 0.05, Zc menjadi Z0.05 =
–1.96, dan hipotesis nul juga akan ditolak. Keputusan ini
memberikan impak yang penting didalam pemilihan alpha dan
menentukan sama ada menggunakan ujian hipotesis satu hujung
atau dua hujung.
Rajah berikut menunjukkan nilai kritikal, kawasan penolakan dan
nilai yang dikira kepada masalah ini.
Langkah 8: Kita tidak boleh membuat kesimpulan secara statistik menyatakan
bahagian perkadaran usahawan wanita didalam kategori jualan
tertinggi dikelaskan sebagai berjaya sebagai usahawan.
10.4.2 Selang Keyakinan
Terdapat keadaan didalam penyelidikan perniagaan apabila penyelidik
mahu menganggarkan perbezaan didalam dua perkadaran populasi. Sebagai
43
43
Z=-2.575 Z=0.0 Z=2.575
Z=-2.54

2 1
ˆ ˆ p p −
P1-P2=0.0
Kawasan penolakan
α/2=0.005
Kawasan penolakan
α/2=0.005
Z
Pengenalan kepada Statistik Ekonomi dan Perniagaan
contoh, adakah terdapat perbezaan, jika ada, didalam perkadaran populasi pekerja
di utara dandi selatan yang berminat kepada kesatuan? Didalam mengkaji dua
pembekal satu barangan, satu syarikat perkilangan yang besar mungkin mahu
menganggar perbezaan di antara pembekal didalam perkadaran mereka dapat
memenuhi pesanan. Contoh ini dan lain-lain keadaan memerlukan penganggaran
perbezaan didalam dua perkadaran populasi boleh diselesaikan menggunakan
selang keyakinan.
Formula didalam membina selang keyakinan untuk menganggarkan
perbezaan didalam dua perkadaran populasi adalah versi ubahsuai Formula
10.12. Formula 10.12 untuk dua perkadaran memerlukan pengetahuan setiap
perkadaran populasi. Sebagaimana yang telah kita cuba untuk menganggarkan
perbezaan didalam dua kandungan ini, kita tidak mengetahui nilainya. Untuk
mengatasi masalah didalam membina formula selang keyakinan, kita gantikan
perkadaran populasi dengan perkadaran sampel dan gunakan perkadaran sampel
ini didalam penganggaran, sebagaimana berikut:
2
2 2
1
1 1
2 1 2 1
n
qˆ pˆ

ˆ ˆ
) P - (P - ) pˆ - pˆ (
Z
+
·
n
q p
Menyelesaikan persamaan untuk P1-P2 menghasilkan formula untuk
memperolehi selanh keyakinan untuk P1-P2
Selang Keyakinan untuk Menganggar P1 – P2
(10.14)
2
2 2
1
1 1
2 1 2 1
2
2 2
1
1 1
2 1
n
qˆ pˆ

ˆ ˆ
Z ) pˆ - pˆ ( ) P - (P
n
qˆ pˆ

ˆ ˆ
Z - ) pˆ - pˆ ( + + ≤ ≤ +
n
q p
n
q p
Untuk melihat bagaimana formula ini digunakan, katakan didalam
percubaan untuk menarik pelanggan, pengurus pasar raya mahu menentukan
perbezaan di antara perkadaran pelanggan disebelah pagi adalah lelaki dan
perkadaran pelanggan selepas jam 5 petang adalah lelaki. Didalam tempoh masa
dua minggu, pengurus mengambil sampel rawak sistematik seramai 400
pelanggan sebelah pagi mendapati 352 wanita dan 48 lelaki, sampel rawak
sistematik 480 pelanggan selepas jam 5 petang mendapati 293 wanita dan 187
44
Statistik Pentaabiran Berkaitan Dua Populasi
adalah lelaki. Jalankan 98% selang keyakinan untuk menganggar perbezaan
didalam perkadaran populasi bagi lelaki.
Maklumat sampel adalah ditunjukkan disini.
45
45
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Pembeli Pagi Pembeli Selepas 5 petang
n1 = 400 n2 = 480
X1 = 48 lelaki X2 = 197 lelaki
1
ˆ p = 0.12
2
ˆ p = 0.39
1
ˆ q = 0.88
2
q = 0.61
Untuk 98% selang keyakinan, Z = 2.33. Menggunakan Formula 10.14
menghasilkan
480
61) (0.39)(00.

400
8) (0.12)(0.8
2.33 0.39) - (0.12
P - P
480
61) (0.39)(00.

400
8) (0.12)(0.8
2.33 - 0.39) - (0.12
2 1
+ + ≤
≤ +
-0.27 – 0.064 ≤ P1 – P2 ≤ -0.27 + 0.064
-0.334 ≤ P1 – P2 ≤ -0.206
Prob[-0.334 ≤ P1 – P2 ≤ -0.206] = 0.98
Terdapat 98% selang keyakinan perbezaan didalam perkadaran populasi
ialah di antara –0.334 dan –0.206. Disebabkan pelanggan selepas jam 5 petang
adalah ditolakkan dari pelanggan pagi, tanda negatif didalam selang
menunjukkan perkadaran tertinggi lelaki adalah pelanggan selepas jam 5 petang
berbanding pelanggan sebelah pagi. Oleh itu selang keyakinan 98% perbezaan
didalam perkadaran ialah sekurang-kurangnya 0.206 dan sebanyak-banyaknya
0.334.
10.5 Ujian Hipotesis berkaitan Dua Varian Populasi
Kadang-kadang kita bermiant terhadap variabiliti populasi data berbanding
ukuran kecenderungan memusat seperti min atau perkadaran. Ingat kembali
didalam Bab 3 bahawa varian adalah ukuran serakan atau variabiliti. Bahagian
9.5 telah membincangkan bagaimana untuk menguji hipotesis berkaitan varian
populasi tunggal, tetapi terdapat keadaan dimana penyelidik adalah berminat
didalam menguji hipotesis berkaitan varian dua populasi. Bahagian ini
membincangkan bagaimana untuk melakukan ujian tertsebut. Bilakah
penyelidik berminat didalam varian dari dua populasi?
46
Statistik Pentaabiran Berkaitan Dua Populasi
Didalam kawalan kualiti, ahli statistik biasanya menguji kedua-dua
ukuran kecenderungan memusat (min atau perkadaran) dan ukuran variabiliti.
Katakan pengilang telah membuat dua kumpulan barangan, yang dikeluarkan
dari dua mesin yang berlainan, atau menghasilkan barangan melalui dua giliran
yang berlainan. Ini mungkin menarik minat penyelidik untuk membandingkan
varian dari dua kumpulan barangan didalam usaha untuk menentukan sama ada
terdapat lebih variabiliti dadalam satu kumpulan barangan berbanding kumpulan
yang satu lagi. Sebagai contoh, jika satu mesin atau giliran mempunyai lebih
variabiliti berbanding yang lain, pengurus mungkin mahu untuk menyiasat
mengapakah mesin atau giliran tersebut tidak konsisten sebagaimana yang lain.
Varian kadangkala digunakan sebagai ukuran risiko keatas saham
didalam pasaran saham. Semankin besar varian, semangkin besar risiko.
Dengan menggunakan teknik yang dibincangkan disini, penyelidik kewangan
boleh menentukan sama ada varian (atau risiko) bagi dua saham adakah sama.
Didalam menguji hipotesis berkaitan dua varia populasi, varian sampel
adalah digunakan. Ini lebih bermakna jika dua sampel datangnya dari populasi
yang sama (atau populasi yang mempunyai varian yang sama), kadar varian
sampel,
2
1
S /
2
2
S , sepatutnya 1. Walau bagaimanapun, disebabkan ralat
persampelan, varian sampel walaupun datangnya dari populasi yang sama (atau
dari dua populasi yang mempunyai varian yang sama) adalah berbagai. Kadar
dua varian sampel ini merumuskan apa yang kita panggil sebagai nilai F.
2
2
2
1
S
S
F ·
Kadar ini, jika dikira berulang untuk pasangan varian yang diambil dari
populasi, adalah bertaburan sebagai tabutan F. Taburan F adalah berbagai
mengikut saiz sampel yang diubah kepada darjah kebebasan.
Melalui taburan F, terdapat darjah kebebasan yang berkaitan dengan
numerator (bagi kadar tersebut) dan juga denominator. Andaian disebalik
taburan F ialah populasi dimana sampel tersebut diambil adalah bertaburan
normal untuk X. Taburan F bagi dua varian populasi adalah amat peka terhadap
pelanggaran andaian populasi bertaburan normal. Ahli statistik mestilah berhati-
hati menyiasat bentuk taburan populasi dimana sampel tersebut diambil untuk
memastikan populasi adalah bertaburan normal. Formula yang digunakan untuk
menguji hipotesis membandingkan dua varian populasi adalah sebagaimana
berikut:
47
47
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Ujian F untuk Dua Varian Populasi
(10.15)
2
2
2
1
S
S
F ·
dfnumerator = v1 = n1-1
dfdenominator = v2 = n2-1
Jadual A.7 mengandungi nilai jadual taburan F untuk α = 0.10, 0.05,
0.025, 0.01 dan 0.005. Rajah 10.13 menunjukkan taburan F untuk v1 = 6 dan v2 =
30. Perhatikan bahawa taburan tersebut tidak simetri. Ini boleh mendatangkan
masalah apabila menjalankan ujian hipotesis dua hujung dan mahu menentukan
nilai kritikal untuk hujung sebelah kiri. Jadual A.7 mengandungi hanya nilai F
dihujung sebelah kanan sahaja. Walau bagaimanapun, taburan F tidak simetri
dan tidak mempunyai min sifar sebagaimana taburan Z dan t, kita tidak boleh
meletakkan nilai negatif bagi nilai sebelah hujung kanan bagi mendapatkan nilai
hujung kiri taburan. Masalah ini boleh diselesaikan dengan menggunakan
Formula 10.16, yang menyatakan nilai kritikal F bagi hujung kiri taburan (1 - α)
boleh diselesaikan melalui songsangan nilai F untuk hujung kanan taburan (α).
Darjah kebebasan numerator bagi hujung kanan nilai kritikal menjadi darjah
kebebasan denominator hujung kiri nilai kritikal, dan darjah kebebasan
denominator bagi hujung kanan nilai kritikal menjadi darjah kebebasan
numerator hujung kiri nilai kritikal.
Fromula untuk Menentukan Nilai Kritikal untuk Hujing
Kiri Taburan F
(10.1)
2 1
1 2
, ,
, , 1
1
v v
v v
F
F
α
α
·

48
Statistik Pentaabiran Berkaitan Dua Populasi
Rajah 10.13
Taburan F untuk v1 = 6, v2 = 30
Ujian hipotesis boleh dilakukan menggunakan dua varian sampel dan
Formula 10.15. Contoh berikut menggambarkan proses ini.
Katakan sebuah mesin menghasilkan kepingan logam yang mempunyai
ketebalan 22 mm. Disebabkan oleh mesin, operator, bahan mentah, persekitaran
kilang dan lain-lain faktor terdapat variabiliti didalam ketebalan kepingan
tersebut. Dua buah mesin mengeluarkan kepingan ini. Operator pengeluaran
amat menitikberatkan ketepatan bagi dua mesin ini. Untuk menguji ketepatan,
sampel rawak 10 keping logam yang dikeluarkan oleh mesin 1 diambil dan 12
keping logam dari mesin 2 juga diambil. Ukuran ketebalan bagi kepingan dari
kedua-dua mesin tersebut diambil dan ditunjukkan didalam jadual didalam
langkah 5. Andaikan ketebalan kepingan logam adalah bertaburan normal
didalam populasi. Bagaimanakah kita boleh menguji sama ada varian dari setiap
sampel datangnya dari varian populasi yang sama (varian populasi adalah sama)
atau dari populasi varian yang berbeza (varian populasi tidak sama).
Langkah 1: Tentukan hipotesis nul dan hipotesis alternatif. Didalam kes ini,
kita menjalankan ujian dua hujung Ivarian sama atau tidak), dan
hipotesis berikut digunakan.
2
2
2
1 a
2
2
2
1 0
: H
: H
σ σ
σ σ

·
Langkah 2: Ujian statistik yang sesuai ialah
49
49
Pengenalan kepada Statistik Ekonomi dan Perniagaan
2
2
2
1
S
S
F ·
Langkah 3: Katakan α = 0.05
Langkah 4: Oleh kerana kita melakukan ujian dua hujung,
2
α
= 0.025.
Disebabkan n1 = 10 dan n2 = 12, nilai darjah kebebasan numerator
bagi hujung kanan ialah v1 = n1 – 1 = 10 – 1 = 9 dan nilai darjah
kebebasan hujung kiri ialah v2 = n2 – 1 = 12 – 1 = 11. Nilai kritikal
hujung kanan diperolehi dari Jadual A.7 adalah
F0.025,9,11 = 3.59
Jadual 10.9 ialah sebahagian dari taburan F untuk satu hujung α =
0.025 (yang menghasilkan nilai yang sama dengan ujian dua hujung
α = 0.05 dimana hujung kanan mengandungi 0.025 kawasan).
Didalam jadual nilai bacaan ialah F0.025,9,11 = 3.59. Nilai kritikal
hujung kiri boleh dikira dari nilai hujung kanan dengan
menggunakan Formula 10.16
0.28
3.59
1

F
1
F
0.025,9,11
0.975,11,9
· · ·
Peraturan keputusan ialah menolak hipotesis nul jika nilai F yang
dikira adalah lebih besar daripada 3.59 atau lebih kecil daripada
0.28.
Langkah 5: Kirakan varian sampel. Data adalah ditunjukkan di bawah.
MESIN 1 MESIN 2
22.3 21.9 22.0 21.7
21.8 22.4 22.1 21.9
22.3 22.5 21.8 22.0
21.6 22.2 21.9 22.1
21.8 21.6 22.2 21.9
22.0 22.1
2
1
S = 0.1138
n1 = 10
2
2
S = 0.0202
n2 = 12
50
Statistik Pentaabiran Berkaitan Dua Populasi
Langkah 6: Nilai F dikira
5.63
0.0202
0.1138

2
2
2
1
· · ·
S
S
F
Kadar varian sampel ialah 5.63.
Langkah 7: Nilai F yang dikira ialah 5.63, adalah lebih besar daripada hujung
kanan nilai kritikal 3.59. Sebagaimana yang ditunjukkan didalam
Rajah 10.14, niulai F ini terletak dikawasan penolakan. Oleh itu,
keputusannya ialah menolak hipotesis nul. Varian populasi adalah
tidak sama.
Langkah 8: Ujian terhadap varian sampel menunjukkan varian pengukuran dari
mesin 1 adalah lebih besar daripada pengukuran varian dari mesin 2.
Operator dan pengurus operasi mungkin mahu menguji mesin 1
selanjutnya; dan pelarasan mungkin diperlukan atau mungkin
terdapat sebab lain menyebabkan terdapat variasi mesin tersebut.
Rajah 10.14
Nilai F dan Kawasan Penolakan untuk Contoh Kepingan Logam
51
51
F0.975,11,9=0.28 F0.025,9,11=3.59
F = 5.63
F
α/2=0.025 α/2=0.025
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Contoh 10.7
Menurut bancian oleh Jabatan Statistik, keluarga di Kuala Lumpur yang
mempunyai ahli seramai 4 orang dan berpendapatan kasar RM36,000 setahun
membelanjakan sebanyak RM22,00 setahun keatas barangan asas dan
pekhidmatan. Sebaliknya di Melaka, keluarga empat orang dengan pendapatan
tahunan RM36,000 membelanjakan hanya RM15,460 untuk barangan asas dan
perkhidmatan. Katakan kita mahu menguji sama ada varian perbelanjaan
barangan asas dan perkhidmatan setahun keluarga di Malaysia adalah lebih besar
berbanding varian perbelanjaan keluarga di Kuala Lumpur – iaitu, sama ada
jumlah perbelanjaan oleh keluarga empat ahli di Kuala Lumpur adalah lebih
homogen berbanding jumlah perbelanjaan keluarga untuk negara. Katakan
sampel rawak lapan keluarga di Kuala Lumpur diambil dan direkodkan
sebagaimana di bawah bersama-sama sampel rawak tujuh keluarga dari seluruh
negara. Lengkapkan tatacara ujian hipotesis untuk menentukan sama ada nilai
varian yang diambil diseluruh Malaysia lebih tinggi berbanding keluarga di
Kuala Lumpur. Gunakan α = 0.01. Andaikan jumlah perbelanjaan berdasarkan
kepada taburan normal didalam populasi.
Seluruh Malaysia Kuala Lumpur
18,500 23,000
19,250 21,900
16,400 22,500
20,750 21,200
17,600 21,000
21,800 22,800
14,750 23,100
21,300
Penyelesaian
Langkah 1: Ini merupakan ujian satu hujung dengan hipotesis berikut
52
Statistik Pentaabiran Berkaitan Dua Populasi
2
2
2
1 a
2
2
2
1 0
: H
: H
σ σ
σ σ
>
·
Perhatikan, kita cuba untuk membuktikan varian untuk populasi
Malaysia adalah lebih besar daripada varian keluarga di Kuala
Lumpur – merupakah hipotesis alternatif.
Langkah 2: Ujian statistik yang sesuai ialah
2
2
2
1
S
S
F ·
Langkah 3: Kadar ralat Jenis I ialah 0.01
Langkah 4: Ini merupakan ujian satu hujung, oleh itu kita menggunakan jadual
taburan F didalam Jadual A.7 dengan α = 0.01. Darjah kebebasan
untuk n1 = 7 dan n2 = 8 adalah v1 = 6 dan v2 = 7. Nilai kritikal F
bagi hujung kanan taburan ialah
F0.01,6,7 = 7.19
Peraturan keputusan ialah tolak hipotesis nul jika nilai F yang dikira
lebih besar daripada 7.19.
Langkah 5: Berikut ialah varian sampel yang dikira dari data
2
1
S = 5,961,428.6
n1 = 7
2
2
S = 737,142.9
n2 = 8
Langkah 6: Nilai F yang dikira boleh ditentukan sebagai
2
2
2
1
S
S
F ·
=
9 . 142 , 737
6 5,961,428.
= 8.09
Langkah 7: Disebabkan nilai F yang dikira, F = 8.09 adalah lebih besar dari
nilai F kritikal, 7.19, keputusan adalah menolak hipotesis nul.
53
53
Pengenalan kepada Statistik Ekonomi dan Perniagaan
Langkah 8: Varian untuk keluarga di Malaysia adalah lebih besar daripada
varian keluarga di Kuala Lumpur. Keluarga di Kuala Lumpur
adalah lebih homogen didalam jumlah perbelanjaan ke atas
barangan asas dan perkhidmatan berbanding keluarga di Malaysia.
Pengurus pemasaran perlu memahami perkara ini untuk cuba
mencari keunikan didalam populasi di Kuala Lumpur. Berikut
adalah geraf yang menunjukkan kawasan penolakan dan nilai F
kritikal dan dikira.
54
F0.01,6,7=7.11
F = 8.09
F
α=0.01

Sign up to vote on this title
UsefulNot useful

Master Your Semester with Scribd & The New York Times

Special offer for students: Only $4.99/month.

Master Your Semester with a Special Offer from Scribd & The New York Times

Cancel anytime.