You are on page 1of 29

7

Persampelan dan
Taburan Persampelan
Bab ini akan membincangkan proses persampelan dan taburan persampelan bagi
beberapa statistik. Bagaimana kita memperolehi data untuk digunakan di dalam
analisis statistik? Mengapa penyelidik selalunya mengambil sampel berbanding
menjalankan bancian? Apakah perbezaan di antara persampelan rawak dan bukan
rawak? Bab ini akan menjawab semua persoalan ini dan lain-lain soalan
berkaitan dengan persampelan.
Juga akan dibincangkan taburan dua statistik: min sampel dan populasi
sampel. Telah dikenalpasti bahawa statistik seperti ini adalah penghampiran
kepada taburan normal di bawah beberapa keadaan. Pengetahuan terhadap
perkara ini adalah penting di dalam kajian statistik dan ia merupakan asas kepada
analisis statistik yang lebih lanjut.

7.1 Persampelan
Persampelan meluas digunakan di dalam perniagaan untuk memperolehi
maklumat yang berguna berkaitan populasi. Data adalah diambil daripada
sampel dan kesimpulan adalah dibuat terhadap populasi sebagai bahagian
daripada proses pentaabiran statistik. Sebagai contoh, katakan penyelidik mahu
menjalankan kajian terhadap kepuasan pekerja-pekerja kilang disekitar Lembah
Kelang. Untuk melakukan kajian ini, sampel rawak pekerja-pekerja kilang dari
beberapa kilang disekitar Lembah Kelang akan dipilih. Soal selidik yang dibuat
dengan teliti akan digunakan untuk memperolehi data yang dikehendaki.
Penyelidik kemudiannya akan menganalisis data yang diperolehi dari jawapan
pekerja-pekerja yang telah dipilih. Ringkasan dan keputusan kajian akan
disediakan berdasarkan keputusan analisis yang diperolehi. Pihak pengurusan
kilang dan pembuat keputusan akan menggunakan lapuran keputusan kajian
tersebut uantu membantu mereka di dalam memperbaiki keadaan tempat kerja
dan motivasi pekerja-pekerja. Biasanya sampel yang sempurna akan dapat
memberikan maklumat yang amat berguna di dalam proses membuat keputusan.

7.1.1 Sebab sampel diambil


Pengenalan kepada Statistik Ekonomi dan Perniagaan

Beberapa sebab yang baik untuk mengambil sampel berbanding menjalankan


bancian:

 Sampel boleh menjimatkan perbelanjaan.


 Sampel boleh menjimatkan masa.
 Untuk sumber-sumber yang terhad, sampel boleh meluaskan skop
kajian.
 Disebabkan proses penyelidikan kadangkala merosakkan, sampel
boleh menyelamatkan barangan.
 Jika untuk memperolehi populasi adalah mustahil, maka sampel
merupakan pilihan.

Sampel adalah murah untuk diperolehi berbanding dengan bancian


berdasarkan magnitud soal selidik. Sebagai contoh, jika soal selidik melalui
talipon mengambil masa 8-minit, menjalankan soal selidik dengan sampel 100
orang berbanding dengan populasi 100,000 orang adalah lebih murah. Selain
daripada menjimatkan perbelanjaan, bilangan sampel yang kecil biasanya dapat
menjimatkan masa. Oleh itu, jika terdapat keadaan yang mendesak untuk
memperolehi keputusan yang cepat, persampelan dapat memberikan keputusan
yang cepat. Dengan keadaan pasaran dan keadaan ekonomi yang cepat berubah,
persampelan mempunyai lebih kebaikan berbanding bancian.
Jika sumber-sumber yang diperuntukkan adalah terhad, maklumat yang
lebih terperinci boleh diperolehi dengan mengambil sampel berbanding
menjalankan bancian. Dengan sumber yang tertumpu kepada beberapa individu
atau item, kajian boleh diperluaskan skopnya untuk membolehkan kita menyoal
dengan lebih khusus lagi. Sesetengah proses kajian adalah merosakkan barangan
yang hendak dikaji. Sebagai contoh, mentol lampu hendak diuji untuk
menentukan jangka hayat mentol tersebut, dan ia akan merosakkan mentol
tersebut. Jika bancian dilakukan bagi kajian seperti ini, maka tiada barangan
yang boleh dijual. Oleh itu, mengambil sampel adalah pilihan yang realistik
untuk menguji keluaran tersebut.
Kadangkala populusi mustahil untuk diperolehi untuk penyelidikan.
Sebagai contoh, sesetengah orang enggan untuk menjawab, dan sesetengah
nombor talipon tidak disenaraikan. Sesetengah barangan yang diminati terletak
bertaburan dan sukar untuk dikumpulkan. Apabila populasi sukar untuk dicapai
untuk sebab-sebab tersebut atau sebab lain, maka sampel adalah alternatif yang
terbaik.

7.1.2 Sebab Bancian Dilakukan

2
Persampelan dan Taburan Persampelan

Kadangkala bancian adalah lebih bermakna berbanding dengan sampel. Satu


sebab mengapa bancian dilakukan menggantikan sampel rawak adalah untuk
menghapuskan kemungkinan peluang sampel dipilih secara rawak mungkin tidak
mewakili populasi. Walaupun semua teknik-teknik persampelan dilakukan
dengan sempurna, sampel tersebut tidak dapat mewakili populasi yang boleh
dipilih melalui peluang.
Sebab kedua untuk menjalankan bancian ialah penyelidik tidak
mempercayai sampel rawak dan merasakan lebih selesa untuk melakukan
bancian. Kedua-dua sebab untuk melakukan bancian ini adalah berdasarkan
kepada andaian ia mempunyai masa dan kewangan yng cukup untuk
menjalankan bancian.

7.1.3 Kerangka
Setiap penyelidik mempunyai populasi sasaran yang mengandungi
semua individu, institusi, atau entiti dimana objek tersebut dikaji. Sampel adalah
diambil dari senarai populasi, peta, direktori, atau lain-lain sumber yang boleh
digunakan untuk mewakili populasi. Senarai, peta, atau direktori ini dipanggil
sebagai kerangka, yang mana ia boleh jadi senarai sekolah, senarai persatuan
perniagaan, atau senarai jualan oleh jurujual. Secara realitinya, kerangka dan
populasi sasaran biasanya berbeza. Sebagai contoh, katakan populasi sasaran
ialah semua keluarga yang tinggal di Kuala Lumpur. Kerangka yang mungkin
adalah buku panduan talipon yang dikeluarkan oleh Telekom Malaysia.
Bagaimanakah kerangka berbeza daripada populasi sasaran? Sesetengah keluarga
tidak mempunyai talipon. Sesetengah keluarga tidak mahu nama mereka
disenaraikan di buku panduan talipon. Mungkin sesetengah keluarga mempunyai
nama yang lebih daripada satu di dalam senarai tersebut.
Kerangka yang mempunyai daftar lebih mengandungi semua unit
populasi sasaran ditambah dengan unit tambahan. Kerangka yang mempunyai
daftar kurang pula, mengandungi unit yang kurang daripada populasi sasaran.
Persampelan adalah dilakukan daripada kerangka, bukannya daripada populasi
sasaran. Secara teorinya, populasi sasaran dan kerangka adalah sama. Di dalam
realitinya, matlamat penyelidik adalah untuk meminimumkan perbezaan di antara
kerangka dan populasi sasaran.

7.1.4 Persampelan Rawak dan Tidak Rawak


Dua jenis persampelan yang utama ialah rawak dan tidak rawak. Di dalam
persampelan rawak setiap unit di dalam populasi mempunyai kebarangkalian
yang sama untuk dipilih sebagai sampel. Persampelan rawak menunjukkan
peluang yang sama untuk memasuki proses pemilihan. Sebagai contoh,

3
Pengenalan kepada Statistik Ekonomi dan Perniagaan

kebanyakan rakyat Malaysia yang membeli Sijil Simpanan Primium percaya


pemenang cabutan Sijil Simpanan Primium adalah dipilih dari cabutan nombor
rawak. Di dalam situasi ini, ahli-ahli populasi percaya bahawa pemilihan adalah
dibuat melalui peluang.
Di dalam sampel tidak rawak pula bukan semua unit populasi
mempunyai kebarangkalian untuk dipilih kedalam sampel. Ahli-ahli
persampelan tidak rawak tidak dipilih melalui peluang. Sebagai contoh, mereka
dipilih disebabkan mereka berada ditempat yang betul dan pada waktu yang betul
atau mereka mengetahui bahawa penyelidik sedang menjalankan penyelidikan.
Kadangkala persampelan rawak dipanggil sebagai persampelan
kebarangkalian dan persampelan tidak rawak dipanggil sebagai persampelan
bukan kebarangkalian. Disebabkan oleh setiap unit populasi tidak mempunyai
peluang yang sama dipilih maka untuk meletakkan sesuatu kebarangkalian
adalah mustahil. Kaedah statistik yang akan dibincangkan di dalam buku ini
adalah berdasarkan kepada andaian bertaburan normal. Persampelan tidak rawak
adalah teknik yang tidak sesuai bagi memungut data untuk dianalisis oleh
kebanyakan kaedah statistik yang dibincangkan di dalam teks ini. Walau
bagaimanapun, beberapa teknik persampelan bukan rawak akan diterangkan di
dalam bahagian ini, terutamanya untuk memberikan kefahaman terhadap ciri-ciri
dan batasannya.

7.1.5 Teknik Persampelan Rawak


Empat jenis teknik persampelan rawak iaitu persampelan rawak mudah,
persampelan rawak berstarata, persampelan rawak sistematik, dan persampelan
rawak kluster. Setiap teknik mempunyai kebaikan dan kelemahannya tersendiri.
Sesetengah teknik amat mudah digunakan. Sesetengahnya tidak mahal, dan yang
lainnya mungkin berpotensi untuk mengurangkan ralat persampelan.

Persampelan Rawak Mudah

Teknik persampelan yang paling asas sekali ialah persampelan rawak mudah.
Persampelan rawak mudah merupakan asas kepada lain-lain teknik persampelan
rawak. Melalui persampelan rawak mudah, setiap unit di dalam kerangka
diletakkan nombor dari 1 hingga N (dimana N adalah saiz populasi). Kemudian,
jadual nombor rawak adalah digunakan untuk memilih n item kedalam sampel.
Penjana nombor rawak adalah program komputer yang membolehkan komputer
untuk mengira output untuk menghasilkan nombor rawak. Jadual 7.1
mengandungi ringkasan jadual nombor rawak. Jadual A.1 yang mengandungi
jadual penuh nombor rawak. Nombor ini adalah rawak di dalam semua arah.
Ruang di dalam jadual untuk memudahkan kirta membaca nilai tersebut. Bagi

4
Persampelan dan Taburan Persampelan

setiap nombor setiap dari 10 digit adalah sama berlakunya, oleh itu untuk
memperolehi digit yang sama dua kali atau lebih di dalam baris adalah mungkin.

Jadual 7.1 Ringkasan Jadual Nombor Rawak

91567 42595 27958 30134 04024 86385 29880 99730


46503 18584 18845 49618 02304 51038 20644 58727
34914 63976 88720 82765 34476 17032 87589 40836
57491 16703 23167 49323 45021 33132 12544 41035
30405 83946 23792 14422 15059 45799 22716 19792
09983 74353 68668 30429 70735 25499 16631 35006
85900 07119 97336 71048 08178 77233 13916 47564

Sebagai contoh, daripada kerangka populasi syarikat yang disenaraikan


di dalam Jadual 7.2, kita menggunakan persampelan rawak mudah untuk memilih
enam syarikat. Pertamanya, kita meletakan nombor bagi setiap ahli di dalam
populasi. Kita memilih seberapa banyak digit bagi setiap unit yang hendak
disampel sebagaimana besarnya nombor di dalam populasi. Sebagai contoh, jika
populasi mempunyai 2000 ahli, kita memilih empat digit nombor. Disebabkan
populasi di dalam Jadual 7.2 mengandungi 30 ahli, hanya dua digit diperlukan
untuk dipilih bagi setiap nombor. Populasi adalah dinomborkan dari 01 hingga
30, sebagaimana ditunjukkan di dalam Jadual 7.3.

Jadual 7.2
Kerangka Populasi 30 Syarikat

Affin HH Bank MBF Holding


Amanah HL Bank PBB
AMCORP Idris Phileo
Apax Insas PM Cap
BIMB Jerneh RHB
BJCAP KAF S Bank
CMS bhd Kenanga Suria Cap
Commer Z MAA Takaful
G. Cap Maybank UCB
HDBS MIDF UMG

5
Pengenalan kepada Statistik Ekonomi dan Perniagaan

Jadual 7.3
Nombor Populasi 30 Syarikat

01 Affin 11 HH Bank 21 MBF Holding


02 Amanah 12 HL Bank 22 PBB
03 AMCORP 13 Idris 23 Phileo
04 Apax 14 Insas 24 PM Cap
05 BIMB 15 Jerneh 25 RHB
06 BJCAP 16 KAF 26 S Bank
07 CMS bhd 17 Kenanga 27 Suria Cap
08 Commer Z 18 MAA 28 Takaful
09 G. Cap 19 Maybank 29 UCB
10 HDBS 20 MIDF 30 UMG

Objeknya ialah untuk mengambil sampel enam syarikat, oleh itu enam
nombor dua-digit mesti dipilih daripada jadual nombor rawak. Disebabkan
populasi ini hanya mengandungi 30 syarikat, semua nombor yang lebih besar
daripada 30 (31-99) hendaklah diabaikan. Sebagai contoh, jika 67 dipilih, proses
hendaklah diteruskan sehingga nilai di antara 1 hingga 30 diperolehi. Jika
nombor yang sama diperolehi lebih dari sekali, teruskan kepada nombor yang
lain. Untuk lebih memahami, kita mulakan dengan pasangan digit yang pertama
di dalam Jadual 7.1 dan memilih disepanjang baris sehingga n = 6 nilai yang
berbeza di antara 1 hingga 30. Jika tambahan nombor diperlukan, kita teruskan
ke kedua, dan seterusnya. Biasanya penyelidik akan memulakan pada lokasi
yang dipilih secara rawak di dalam jadual dan meneruskannya kearah yang telah
ditentukan untuk memilih nombor.
Di dalam baris pertama, nombor pertama ialah 91. Nombor ini diluar
jeda oleh itu ia diabaikan. Nombor dua digit berikutnya ialah 56. Kemudian 74,
diikuti 25, yang merupakan nombor yang boleh diambil. Dari Jadual 7.3, kita
lihat 25 ialah nombor yang berpadanan dengan Syarikat RHB merupakan
syarikat pertama yang dipilih kedalam sampel. Nombor berikutnya ialah 95, juga
diabaikan, diikuti 27, merupakan nombor yang boleh dipilih. Nombor 27
merupakan nombor untuk syarikat Suria Cap. Meneruskan proses ini kita
mendapati nombor 95 dan 83. Nombor berikutnya ialah 01, merupakan nilai
untuk Syarikat Affin. Nombor 34 adalah nombor berikutnya, diikuti oleh nombor
04 dan 02, kedua-duanjya boleh digunakan. Nombor ini adalah berpadanan
dengan Syarikat Apax dan Amanah. Meneruskan proses ini disepanjang baris,
nombor berikutnya ialah 29, yang berpadanan dengan Syarikat UCB. Oleh itu
pemilihan enam sampel syarikat telah diselesaikan. Berikut adalah syarikat yang
dipilih sebagai sampel akhir:

6
Persampelan dan Taburan Persampelan

RHB
Suria Cap
Affin
Apax
Amanah
UCB

Persampelan rawak mudah adalah senang dilakukan keatas populasi yang


kecil berbanding populasi besar. Proses meletakkan nombor kepada populasi dan
memilihnya adalah mengelirukan untuk sampel yang besar.

Persampelan Rawak Berstarata

Persampelan rawak jenis kedua ialah persampelan rawak berstarata dimana


populasi adalah dibahagikan kepada sub-populasi yang tidak bertindih dipanggil
sebagai starata. Penyelidik kemudiannya akan memilih sampel rawak mudah
dari setiap sub-populasi. Sebab utama mengapa menggunakan persampelan
rawak berstarata ialah kerana kaedah ini berpotensi untuk mengurangkan ralat
persampelan. Ralat persampelan terjadi apabila, melalui peluang, sampel tidak
mewakili populasi. Melalui persampelan rawak berstarata, potensi untuk match
sampel hampir kepada populasi adalah lebih berbanding persampelan rawak
mudah kerana bahagian daripada jumlah sampel adalah diambil daripada
kumpulan populasi yang berlainan. Walau bagaimanapun, persampelan rawak
berstarata adalah mahal berbanding persampelan rawak mudah kerana setiap unit
populasi mesti diletakkan di dalam starata sebelum proses pemilihan rawak
dilakukan.
Pemilihan strata biasanya berdasarkan kepada maklumat yang ada.
Maklumat-maklumat tersebut mungkin diperolehi daripada survei atau bancian
yang terdahulu. Kelebihan strata meningkat apabila strata lebih berbeza. Secara
dalaman, strata hendaklah homogen secara relatif; secara luaran pula, strata
hendaklah kontras antara satu sama lain. Strata selalunya dilakukan dengan
menggunakan angkubah demografi, seperti jantina, kelas sosioekonomi, kawasan
geografi, ugama, ethnik dan sebagainya. Sebagai contoh, di dalam memasarkan
siaran radio, umur pendengar adalah penentu penting terhadap jenis program
yang disediakan oleh stesyen radio. Rajah 7.1 mengandungi strata mengikut
umur yang dibahagi kepada tiga strata, berdasarkan kepada andaian umur adalah
faktor yang menentukan citarasa terhadap program radio. Strata ini
menunjukkan pendengar berumur 20 hingga 30 tahun adalah mengemari jenis
program yang sama, tetapi berbeza daripada apa yang digemari oleh pendengar
yang berumur 30 – 40 tahun dan 40 – 50 tahun. Dikalangan setiap kumpulan
umur, homogeniti adalah ujud; di antara kumpulan adalah berbeza, atau
heterogeniti adalah ujud.

7
Pengenalan kepada Statistik Ekonomi dan Perniagaan

Rajah 7.1
Persampelan Rawak Berstrata Pendengar Radio

20-30 tahun
(homogen)
Hetrogen di
antaranya
20-30 tahun
(homogen)
Hetrogen di
antaranya
20-30 tahun
(homogen)

Persampelan rawak berstrata boleh jadi berkadaran atau tidak


berkadaran. Persampelan rawak berstrata berkadaran terjadi apabila peratus
sampel yang diambil daripada setiap strata adalah berkadaran dengan peratus
bagi setiap strata dikalngan populasi keseluruhan. Sebagai contoh, di Kuala
Lumpur, untuk mengambil sampel dari kaum Melayu, Cina, India dan lain-lain.
Jika populasi penduduk Kuala Lumpur 60% adalah kaum Melayu dan jika
sampel yang hendak diambil ialah 1,000 orang, maka sampel Kaum Melayu yang
dipilih ialah 600 orang. Sampel kaum lain adalah mengikut kadar dari populasi
mereka. Jika kadar strata di dalam sampel adalah berbeza berbanding dengan
kadar strata di dalam populasi maka ia merupakan persampelan rawak berstrata
tidak berkadaran.

Persampelan Sistematik

Tidak seperti persampelan rawak mudah dan persampelan rawak berstrata,


persampelan sistematik tidak cuba untuk mengurangkan ralat persampelan.
Persampelan sistematik digunakan kerana ia selesa dan relatif mudah untuk
ditadbirkan. Melalui persampelan sistematik, setiap item k adalah dipilih untuk
mengurangkan saiz sampel n dari populasi bersaiz N. Nilai k boleh ditentukan
dengan menggunakan formula. Jika k bukan nilai integer, nombor bulat akan
digunakan.

8
Persampelan dan Taburan Persampelan

Menentukan Nilai k

N
k
n
dimana
n = saiz sampel
N = saiz populasi
K = saiz selang untuk dipilih

Sebagai contoh persampelan sistematik, katakan penyelidik sistem


pengurusan maklumat mahu mengambil sampel kilang di Lembah Kelang. Ia
mempunyai bantuan kewangan yang mencukupi untuk mengambil 1000 kilang
(n). Direktori Perkilangan Kuala Lumpur menyenaraikan hampir 17,000 jumlah
kilang di Lembah Kelang (N) mengikut susunan abjad. Nilai k ialah 17,000/1000
= 17 dan penyelidik akan memilih setiap 17 kilang dari senarai direktori sebagai
sampel.
Apakah penyelidik memilih kilang yang pertama disenaraikan atau
kilang ke 17 atau mana-mana kilang di antaranya? Di dalam memilih setiap nilai
k, jadual nombor rawak mesti digunakan untuk memilih nilai di antara 1 dan k
sebagai titik awal. Unsur kedua bagi sampel adalah adalah titik awal tambah k.
Sebagai contoh, k = 17, oleh itu penyelidik pelu mengikut jadual rawak untuk
menentukan titi awal di antara 1 dengan 17. Katakan ia memilih nombor 5. Ia
kemudiannya bermula dengan kilang 5, kemudian memilih 22 (5 + 17), dan
kemudian kilang ke 39 dan seterusnya.
Disamping keselesaan, persampelan sistematik mempunyai kebaikan
lain. Disebabkan persampelan sistematik bertaburan seragam disepanjang
kerangka, mereka yang berpengetahuan dengan mudah dapat menentukan
samada perancangan persampelan telah diikuti di dalam kajian. Walau
bagaimanapun, masalah persampelan sistematik boleh terjadi jika ujudnya data
yang berkala, dan selang persampelan adalah di dalam ‘syncopation’ dengannya.
Sebagai contoh, jika senarai 150 pelajar sebenarnya adalah cantuman dari lima
kelas dengan 30 pelajar setiap kelas dan jika setiap senarai bagi setiap kelas telah
disusun dengan nama pelajar terbaik, sederhana dan rendah, maka persampelan
sistematik berkemungkinan memilih semua pelajar terbaik sahaja, semua pelajar
sederhana dan semua pelajar kurang baik. Metodologi persampelan sistematik
adalah berdasarkan kepada andaian bahawa sumber populasi adalah rawak.

9
Pengenalan kepada Statistik Ekonomi dan Perniagaan

Rajah 7.2
Beberapa Bandar Ujian Pemasaran

Persampelan Kluster (atau Kawasan)

Persampelan kluster atau kawasan melibatkan pembahagian populasi kepada


kawasan atau kluster yang tidak bertindih. Walau bagaimanapun, ia berbeza
dengan persampelan rawak berstrata dimana strata adalah homogen, sementara
persampelan kluster adalah heterogen dalamannya. Secara teorinya, setiap
kluster mengandungi berbagai-bagai varieti unsur yang luas, dan kluster adalah
bahangian kecil bagi populasi. Contoh kluster ialah bandar, syarikat, rumah,
universiti, kawasan perbandaran, dan kawasan geografi. Selalunya kluster adalah
kumpulan populasi yang terjadi semulajadi dan sedia dikenalpasti, seperti negeri
atau Kawasan Majlis Bandaraya. Walaupun persampelan kawasan biasanya
dirujukkan sebagai kluater yang merupakan kawasan populasi, seperti kawasan
geografi atau bandar, istilah persampelan kluster dan persampelan kawasan
adalah digunakan silih berganti di dalam tek ini.
Selepas memilih kluster, penyelidik memilih secara rawak unsur individu
untuk sampel daripada kluster. Satu cuntoh penyelidikan perniagaan ialah
menggunakan kluster untuk menguji pasaran barangan baru. Biasanya di dalam
ujian pemasaran, Malaysia akan dibahagikan kepada kluster mengikut negeri,
dan pelanggan individu dikalangan pasaran bandar ujian adan disurvei. Rajah
7.2 menunjukkan pasaran bandar ujian bagi Malaysia yang menggunakan kluster
untuk menguji keluaran.
Kadangkala kluster adalah terlalu besar, dan set kluster yang kedua akan
dibuat daripada setiap kluster asal. Teknik ini dipanggil sebagai persampelan
dua-peringkat. Sebagi contoh, penyelidik akan membahagikan Malaysia
mengikut kluster bandar. Ia kemudiannya membahagikan bandar tersebut kepada

10
Persampelan dan Taburan Persampelan

kluster blok dan memilih secara rawak rumah individu daripada kluster blok.
Peringkat pertama ialah memilih bandar ujian dan peringkat kedua memilih blok.
Persampelan kluster atau kawasan mempunyai beberapa kebaikan. Dua
daripada kebaikan yang utama ialah selesa dan kos. Kluster biasanya mudah
diperolehi, dan kos persampelan daripada keseluruhan populasi adalah
dikurangkan kerana skop kajian telah dikurangkan kepada kluster. Kos per unsur
biasanya rendah di dalam persampelan kluster atau kawasan di dalam kluster
berbanding persampelan rawak berstrata disebabkan penyenaraian unsur dan kos
lokasi yang rendah. Masa dan kos menghubungi unsur populasi juga
dikurangkan, terutamanya jika melibatkan perjalanan disebabkan kluster
mengurangkan jarak di antara unsur sampel. Disamping itu pentabiran sampel
survei boleh diringkaskan. Kadangkala persampelan kluster atau kawasan
merupakan pendekan yang hanya boleh dilakukan disebabkan kerangka
persampelan bagi unsur populasi individu tidak diperolehi dan oleh itu lain-lain
teknik persampelan tidak boleh digunakan.
Persampelan kluster atau kawasan juga mempunyai beberapa kelemahan.
Jika unsur kluster adalah sama, persampelan kluster mungkin secara statistik
tidak cekap berbanding persampelan rawak mudah. Di dalam kes yang lebih
ekstrim, - apabila unsur kluster adalah sama – persampelan daripada kluster
mungkin tidak baik berbanding persampelann unit tunggal daripada kluster.
Selanjutnya, kos dan masalah analisis statistik adalah lebih besar dngan
persampelan kluster berbanding persampelan rawak mudah.

7.1.6 Persampelan Tidak Rawak


Teknik persampelan digunakan untuk memilih unsur daripada populasi melalui
sebarang mekanisma yang tidak melibatkan proses pemilihan rawak dipanggil
sebagai teknik persampelan tidak rawak. Disebabkan peluang tidak digunakan
untuk memilih item dari sampel, teknik ini adalah teknik bukan kebarangkalian
dan tiada keperluan untuk digunakan di dalam memungut data untuk dianalisis
menggunakan kaedah statistik pentaabiran yang akan dibincangkan di dalam
buku ini. Ralat persampelan tidak boleh ditentukan secara objektif bagi teknik
persampelan ini. Empat teknik persampelan tidak rawak dibincangkan disini:
persampelan selesa, persampelan pertimbangan nilai, persampelan kuota dan
persampelan ‘snowball’.

Persampelan Selesa

Di dalam persampelan selesa, unsur-unsur bagi sampel adalah dipilih


berdasarkan kepada keselesaan penyelidik. Penyelidik biasanya memilih item
yang sedia didapati, hampir, dan/atau yang sedia untuk berkerjasama. Sampel
kelihatan kurang angkubah berbanding populasi disebabkan di dalam banyak

11
Pengenalan kepada Statistik Ekonomi dan Perniagaan

persekitaran unsur ekstrim populasi tidak diperolehi. Penyelidik akan memilih


banyak unsur dipertengahan populasi. Sebagai contoh, sampel selesa isi rumah,
temuduga dari pintu-ke-pintu mungkin melibatkan rumah dimana penghuninya
berada dirumah, rumah yang tiada anjing, rumah yang hampir dengan jalan raya,
apartment tingkat pertama, dan rumah yang mempunyai penghuni yang ramah.
Sebaliknya, sampel rawak memerlukan penyelidik memperolehi data hanya dari
rumah dan apartment yang telah dipilih secara rawak, tidak kira apa keadaan
sekalipun. Jika firma penyelidik terletak di pasar raya, sampel selesa mungkin
dipilih dengan menemuduga hanya pelanggan yang melalui kedai dan kelihatan
ramah.

Persampelan Pertimbangan Nilai

Persampelan pertimbangan nilai terjadi apabila unsur dipilih untuk sampel adalah
dipilih berdasarkan kepada pertimbangan penyelidik sahaja. Penyelidik
selalunya mempercayai mereka boleh memperolehi perwakilan sampel melalui
pertimbangan mereka, dimana menghasilkan penjimatan masa dan perbelanjaan.
Kadangkala beretika, penyelidik profesional mempercayai mereka boleh
memilih perwakilan sampel yang lebih sempurna berbanding dengan proses
rawak. Mereka mungkin betul! Walau bagaimanapun, beberapa kajian telah
menunjukkan kaedah persampelan rawak tidak menunjukkan keupayaan yang
baik bagi persampelan pertimbangan nilai di dalam menganggarkan min populasi
walaupun penyelidik telah mentadbirkan persampelan pertimbangan nilai dengan
mengambil perwakilan sampel yang seimbang. Apabila sampel dilakukan
melalui pertimbangan nilai, pengiraan kebarangkalian dimana unsur tersebut
akan dipilih kedalam sampel adalah mustahil. Ralat persampelan tidak boleh
ditentukan secara objektif kerana kebarangkalian adalah berdasarkan kepada
pemilihan tidak rawak.
Lain-lain masalah berkaitan dengan persampelan pertimbangan nilai
adalah penyelidik cuba untuk membuat ralat pertimbangan nilai di dalam satu
arah. Ralat sistematik ini akan menyebabkan apa yang dikatakan sebagai bias.
Penyelidik juga cuba untuk menyisihkan untuk melibatkan unsur yang ekstrem.
Melalui persampelan pertimbangan nilai, tidak ada kaedah objektif untuk
menentukan sama ada pertimbangan nilai saorang manusia itu lebih baik
daripada yang lain.

Persampelan Kuota

Persampelan kuota kelihatannya sama seperti persampelan rawak berstrata. Sub-


kelas populasi tertentu, seperti kumpulan umur, jantina, atau kawasan geografi,
adalah digunakan untuk strata. Walau bagaimanapun, berbanding dengan
persampelan rawak dari satu strata, penyelidik menggunakan kaedah

12
Persampelan dan Taburan Persampelan

persampelan tidak rawak untuk memperolehi data dari strata sehingga kuota yang
diperlukan bagi sampel dipenuhi. Kuota ditentukan dengan kawalan kuota,
dimana set saiz sampel untuk sampel untuk diperolehi dari sub-kumpulan.
Secara amnya, kuota adalah berdasarkan kepada bahagian sub-kumpulan di
dalam populasi. Di dalam kes ini, konsep kuota adalah sama sebagaimana
persampelan strata berkadaran.
Kuota biasanya dipenuhi melalui unsur yang ada, terkini atau boleh
digunakan. Sebagai contoh, berbanding temuduga orang secara rawak untuk
memperolehi kuota Cina, penyelidik akan pergi kekawasan yang ramai penghuni
Cina dan menemuduganya sehingga jawapan diperolehi untuk memenuhi kuota.
Di dalam persampelan kuota, temuduga akan dimulakan dengan menyoal
beberapa soalan tapisan; jika responden mewakili sub-kelas dimana kuota telah
dipenuhi, temuduga akan menghentikan temuduga tersebut.
Persampelan kuota amat berguna apabila tiada kerangka diperolehi untuk
populasi. Sebagai contoh, katakan penyelidik hendak menstratakan populasi
mengikut pemilik jenis kereta tetapi gagal untuk memperolehi senarai pemilik
BMW. Melalui persampelan kuota, penyelidik akan meneruskan temuduga
semua pemilik kereta dan menyingkirkan bukan pemilik BMW sehingga kuota
pemilik BMW dipenuhi.
Persampelan kuota kurang mahal berbanding teknik persampelan rawak
disebabkan ia merupakan teknik yang selesa. Walau bagaimanapun, kos tidak
memberikan makna disebabkan kualiti teknik persampelan rawak dan tidak
rawak tidak boleh dibandingkan. Kebaikan lain persampelan kuota ialah
cepatnya memperolehi data. Penyelidik tidak perlu mengunjungi semula atau
menghantar soal selidik kedua jika tiada tindakbalas dari responden; ia hanya
pergi ke unsur berikutnya. Juga, persediaan untuk persampelan kuota adalah
minimum.
Masalah utama persampelan kuota ialah apabial semuanya telah
dijalankan, ia hanyalah persampelan tidak rawak. Sesetengah penyelidik
menyatakan jika kuota telah dipenuhi melalui pemilihan unsur tidak rawak dan
menyingkiri yang bukan dari strata, persampelan kuota merupakan versi dari
persampelan rawak strata. Walau bagaimanapun, kebanyakan persampelan kuota
dilakukan oleh penyelidik dengan cepat untuk memenuhi kuota. Walau
bagaimanapun, kaedah ini masih merupakan kaedah persampelan tidak rawak.

Persampelan Bola Salji

Kaedah bola salji merupakan subjek survei adalah dipilih berdasarkan kepada
rujukan dari responden survei yang lain. Penyelidik mengenalpasti responden
yang memenuhi keperluan profail subjek yang hendak dikaji. Penyelidik
kemudiannya menemuduga responden ini nama dan lokasi orang lain yang
memenuhi profail subjek yang hendk dikaji. Melalui rujukan ini, subjek survai

13
Pengenalan kepada Statistik Ekonomi dan Perniagaan

boleh dikenalpasti dengan murah dan cekap, khususnya berguna apabila subjek
survei sukar untuk dikenalpasti.

7.1.7 Ralat Persampelan


Ralat persampelan terjadi apabila sampel tidak mewakili populasi. Apabila
teknik persampelan rawak digunakan untuk memilih unsur-unsur bagi sampel,
ralat persampelan terjadi melalui peluang. Kerapkali statistik dikira keatas
sampel bukan anggaran yang tepat bagi parameter populasi kerana sampel tidak
mewakili populasi. Keputusan ini disebabkan oleh rawat persampelan. Melalui
sampel rawak, ralat persampelan boleh dikira dan dianalisis.

7.1.8 Ralat Bukan Persampelan


Semua ralat lain daripada ralat persampelan adalah ralat bukan persampelan.
Banyak kemungkinan yang menyebabkan ralat bukan persampelan, termasuklah
ketiadaan data, ralat pengkodan, ralat memproses input, dan ralat analisis. Lain-
lain ralat bukan persampelan ialah berkaitan dengan instrumen pengukuran,
seperti ralat deginasi yang tidak nyata, soal selidik yang mengelirukan, dan
konsep yang kabur. Definasi kerangka yang tidak betul juga merupakan ralat
bukan persampelan. Di dalam kebanyakan kes, menentukan kerangka populasi
yang tepat adalah mustahil. Oleh itu, ia tidak sesuai, maka berlakulah ralat bukan
persampelan.
Ralat di dalam jawapan juga merupakan ralat bukan persampelan. Ia
ujud apabila responden tidak tahu, tidak menjawab dan sebagainya. Tidak ada
cara statistik yang boleh mengukur dan mengawal ralat bukan persampelan.
Teknik statistik yang akan dibincangkan di dalam buku ini adalah berdasarkan
kepada andaian tidak ada ralat bukan persampelan yang berlaku. Penyelidik
mesti menyingkiri ralat ini melalui parancangan yang teliti dan menjalankan
kajian penyelidikan mereka.

7.2 Taburan Persampelan X

Di dalam proses statistik pentaabiran, sampel rawak adalah dipilih dari populasi,
statistik dikira berdasarkan sampel, dan kesimpulan adalah dibuat berkaitan
parameter populasi dari statistik. Di dalam percubaan untuk menganalisis
statistik sampel, biasanya kita perlu mengetahui taburan statistik. Setakat ini kita
telah mempelajari beberapa taburan termasuklah taburan binomial, taburan

14
Persampelan dan Taburan Persampelan

Poisson, taburan hypergeometri, taburan seragam, taburan normal dan taburan


eksponen.
Di dalam bahagian ini, kita akan mengkaji min sampel, X ,
sebagai statistik. Min sampel ialah statistik yang biasa digunakan di
dalam statistik pentaabiran. Untuk mengira dan menetapkan
kebarangkalian terjadi sesuatu nilai bagi min sampel, penyelidik mesti
mengetahui taburan bagi min sampel. Satu cara untuk menguji taburan
kebarangkalian adalah mengambil populasi dengan taburan tertentu,
memilih sampel rawak bagi saiz tertentu, kira min sampel, dan cuba
untuk menentukan bagaimana mereka bertaburan. Katakan populasi finit
yang kecil mengandungi hanya N = 8 angka:

54, 55, 59, 63, 64, 68, 69, 70

Menggunakan histogram, kita lihat bentuk taburan bagi populasi data.

Katakan kita mengambil semua kemungkinan sampel bersaiz n = 2


daripada populasi ini dengan penggantian. Keputusannya adalah sebagaimana
pasangan data berikut:

(54,54) (55,54) (59,54) (63,54) (64,54) (68,54) (69,54) (70,54)


(54,55) (55,55) (59,55) (63,55) (64,55) (68,55) (69,55) (70,55)
(54,59) (55,59) (59,59) (63,59) (64,59) (68,59) (69,59) (70,59)
(54,63) (55,63) (59,63) (63,63) (64,63) (68,63) (69,63) (70,63)
(54,64) (55,64) (59,64) (63,64) (64,64) (68,64) (69,64) (70,64)
(54,68) (55,68) (59,68) (63,68) (64,68) (68,68) (69,68) (70,68)
(54,69) (55,69) (59,69) (63,69) (64,69) (68,69) (69,69) (70,69)

15
Pengenalan kepada Statistik Ekonomi dan Perniagaan

(54,70) (55,70) (59,70) (63,70) (64,70) (68,70) (69,70) (70,70)

Min bagi setiap sampel ini ialah

54.0 54.5 56.5 58.5 59.0 61.0 61.5 62.0


54.5 55.0 57.0 59.0 59.5 61.5 62.0 62.5
56.5 57.0 59.0 61.0 61.5 63.5 64.0 64.5
58.5 59.0 61.0 63.0 63.5 65.5 66.0 66.5
59.0 59.5 61.5 63.5 64.0 66.0 66.5 67.0
61.0 61.5 63.5 65.5 66.0 68.0 68.5 69.0
61.5 62.0 64.0 66.0 66.5 68.5 69.0 69.5
62.0 62.5 64.5 66.5 67.0 69.0 69.5 70.0

Sekali lagi, menggunakan histogram, kita boleh melihat bentuk taburan


bagi min sampel ini.

Perhatikan bentuk histogram bagi min sampel adalah lebih kurang sama
bentuknya histogram populasi. Min sampel kelihatannya memenuhi kearah
pertengahan taburan dan mengecil kearah hujung taburan.
Setakat ini, kita telah menguji populasi dengan taburannya. Walau
bagaimanapun, min sampel yang diambil dari populasi ini menghampiri taburan
normal, terutamanya apabila saiz sampel bertambah besar. Apakah akan terjadi
kepada taburan min sampel jika kita mengkaji populasi yang mempunyai bentuk

16
Persampelan dan Taburan Persampelan

taburan yang berbeza? Jawapab kepada persoalan ini diberi di dalam teorem had
memusat.
Teorem had memusat membentuk potensi penggunaan taburan normal
kepada banyak masalah apabila saiz sampel adalah cukup besar. Min sampel
yang hendak dikira dari sampel rawak yang dipilih daripada populasi yang
bertaburan normal adalah bertaburan normal. Walau bagaimanapun, kebaikan
sebenar teorem had memusat ialah bahawa sampel data adalah diambil daripada
populasi yang tidak bertaburan normal atau populasi yang tidak diketahui
bentuknya juga boleh dianalisis menggunakan taburan normal kerana min sampel
adalah bertaburan normal untuk sampel yang cukup besar saiznya. Lajur 1 Rajah
7.6 menunjukkan empat taburan populasi yang berbeza. Setiap lajur yang
bersebelahan menunjukkan bentuk taburan min sampel bagi saiz sampel yang
tertentu. Perhatikan dibaris bawah sekali bagi populasi yang bertaburan normal
menunjukkan min sampel adalah juga bertaburan normal apabila n = 2.
Perhatikan juga bagi lain-lain taburan populasi, taburan min sampel menghampiri
keluk normal apabila n menjadi semangkin besar. Bagi semua empat taburan,
taburan min sampel menghampiri normal apabila n = 30.

Teorem Had Memusat

Jika sampel bersaiz n diambil secara rawak daripada populasi


dan mempunyai min  dan sisihan piawai , min sampel X ,
adalah bertaburan normal bagi sampel saiz yang cukup besar (n
30) menurut bentuk taburan populasi. Jika populasi bertaburan
normal, min sampel adalah bertaburan normal bagi sebarang saiz
sampel.
Dari jangkaan matematik, ia boleh ditunjukkan bahawa min bagi
min sampel ialah min populasi.

X  
dan sisihan piawai bagi min sampel ialah sisihan piawai populasi
dibahagikan dengan punca kuasadua saiz sampel.


X 
n

17
Pengenalan kepada Statistik Ekonomi dan Perniagaan

Rajah 7.6
Bentuk Taburan Min Sampel bagi Tiga Saiz Sampel
yang diambil dari Empat Taburan Populasi yang Berbeza

Berapa besar sampel mesti diambil untuk teorem had memusat boleh
digunakan? Saiz sampel yang perlu berbeza menurut bentuk populasi. Walau
bagaimanapun, didalah buku ini, sampel bersaiz 30 atau lebih adalah mencukupi.
Ingat kembali, jika populasi adalah bertaburan normal, min sampel adalah
bertaburan normal bagi sampel saiz sekecil n = 1. Sebagaimana yang
ditunjukkan di dalam Rajah 7.6, taburan adalah semangkin tirus. Ini disebabkan

18
Persampelan dan Taburan Persampelan

sisihan piawai bagi min ialah  n . Nilai ini akan menjadi semangkin kecil
apabila saiz n ditingkatkan.
Di dalam Jadual 7.4, min dan sisihan piawai bagi min adalah ditunjukkan
bagi sampel rawak berbagai saiz (n = 2 hingga n = 30) diambil dari taburan
seragam dengan a = 10 dan b = 30. Min populasi ialah 20, dan sisihan piawai
populasi ialah 5.774. Perhatikan min bagi min sampel bagi setiap saiz sampel
adalah hampir 20 dan sisihan piawai bagi min sampel bagi setiap set 90 sampel
adalah hampir sama dengan  n . Perbezaan yang kecil di antara sisihan piawai
min sampel dan  n disebabkan tidak semua sampel yang mungkin bagi
sampel saiz yang diberi diambil dari populasi (hanya 90). Secara teorinya, jika
semua kemungkinan sampel bagi sampel saiz yang diberi adalah diambil, min
bagi min sampel adalah sama dengan min populasi dan sisihan piawai bagi min
sampel adalah sama sebagaimana sisihan piawai dibahagi dengan punca kuasa
dua n.

Jadual 7.4
 X dan  X 90 Sampel rawak untuk Lima Saiz Sampel yang Berbeza

Saiz sampel Min bagi Min Sisihan  


Sampel Piawai bagi n
Min Sampel
n=2 19.92 3.87 20 4.08
n=5 20.17 2.65 20 2.58
n = 10 20.04 1.96 20 1.83
n = 20 20.20 1.37 20 1.29
n = 30 20.25 0.99 20 1.05

Teorem had memusat menyatakan min sampel adalah bertaburan normal


bergantung kepada bentuk populasi untuk sampel yang besar dan bagi sebarang
saiz sampel dengan populasi yang bertaburan normal. Min sampel ini boleh
dianalisis dengan menggunakan skor Z. Ingat kembali dari Bab 6 bahawa

X-
Z

Jika min sampel adalah bertaburan normal, formula skor Z yang


digunakan untuk min sampel adalah

19
Pengenalan kepada Statistik Ekonomi dan Perniagaan

X - X
Z
X

Keputusan ini mengikut corak am skor Z: perbezaan di antara statistik


dan min dibahagi dengan stastistik sisihan piawai. Di dalam formula ini, min
statistik yang diminati ialah  X dan sisishan piawai yang dikehendaki ialah  X
, kadang kala dirujukkan sebagai ralat piawai bagi min. Untuk menentukan  X ,
penyelidik mesti mempunyai pilihan rawak daripada semua kemungkinan sampel
untuk saiz daripada populasi, kirakan min sampel, dan mempuratakannya. Tugas
ini adalah mustahil untuk disiapkan di dalam masa yang realistik. Oleh yang
demikian,  X adalah sama sebagaimana , yang mana mudah untuk diperolehi.
Disamping itu, untuk menentukan niali  X , penyelidik perlu mengambil semua
kemungkinan sampel bagi saiz yang diperlukan dari populasi, kirakan min
sampel, dan tentukan sisihan piawai bagi sampel. Kerja ini juga adalah mustahil.
Oleh itu,  X boleh dikira dengan menggunakan sisihan piawai populasi
dibahagikan dengan punca kuasa dua saiz sampel.
Apabila sampel saiz meningkat, sisihan piawai bagi min sampel menjadi
kecil dan kecil disebabkan sisihan piawai populasi dibahagikan dengan nilai yang
semangkin besar punca kuasa dua n. Kebaikan utama teorem had memusat ialah
praktikal, versi yang amat berguna bagi formula Z untuk min sampel.

Formula Z bagi Min Sampel

X -μ
Z 
 σ 
 
 n

Apabila populasi adalah bertaburan normal dan saiz sampel adalah 1,


formula ini bagi min sampel akan menjadi formula Z yang asal bagi nilai
individu. Ini disebabkan min bagi nilai satu ialah nilai tersebut, dan apabila n =

1 nilai  .
n
Katakan, sebagai contoh, min perbelanjaan per pelanggan dipasar raya
ialah RM85.00, dengan sisihan piawai RM9.00. Jika sampel rawak 40 pelanggan

20
Persampelan dan Taburan Persampelan

diambil, apakah kebarangkalian purata sampel perbelanjaan per pelanggan bagi


sampel ini adalah RM87.00 atau lebih? Disebabkan saiz sampel adalah lebih
besar daripada 30, teorem had memusat boleh digunakan, dan min sampel adalah
bertaburan normal. Dengan  = RM85.00,  = RM9.00 dan formula Z bagi min
sampel, Z dikira sebagai

X- RM87.00 - RM85.00 RM2.00


Z     1.41
    RM9.00  RM1.42

 
 
 

 n  40 

Untuk Z = 1.41 di dalam taburan Z (Jadual A.3), kebarangkaliannya ialah


0.4207. Ia adalah kebarangkalian memperolehi min di antara RM87.00 dan min
populasi, RM85.00. Menyelesaikan untuk hujung taburan menghasilkan

0.5000 – 0.4207 = 0.0793

dimana kebarangkalian X  RM87.00. Iaitu, 7.93% dari sampel rawak 40


pelanggan dari populasi ini akan menghasilkan min perbelanjaan RM87.00 atau
lebih. Rajah 7.7 menunjukkan masalah ini dan penyelesaiannya.

Rajah 7.7
Penyelesaian Grafik Masalah Pelanggan Pasar raya

0.4207 0.0793
Z=1.41
 = RM85.00 X = RM87.00

 9.00
X    RM1.42
n 40

Z=0 Z=1.41

Contoh 7.1

21
Pengenalan kepada Statistik Ekonomi dan Perniagaan

Katakan dalam sata satu jam di dalam pasaraya yang besar, purata bilangan
pelanggan ialah 448, dengan sisihan piawai 21 pelanggan. Apakah
kebarangkalian sampel rawak 49 jam membeli belah yang berbeza akah
menghasilkan min sampel antara 441 dan 446 pelanggan?

Penyelesaian:

Bagi masalah ini,  = 448,  = 21, dan n = 49. Masalahnya ialah untuk mencari
P(441  X  446). Gambarajah di bawah meenerangkan masalah tersebut.

X  441 X  446
=448

3
n

Z=-2.33 Z=-0.67 Z=0

Menyelesaikan masalah ini dengan mengira skor Z dan menggunakan Jadual A.3
untuk menentukan kebarangkalian

441 - 448 -7
Z   - 2.33
 21  3
 
 49 

dan
446 - 448 -2
Z   - 0.67
 21  3
 
 49 

Kebarangkalian nilai Z = -2.33 ialah 0.4901 dan kebarangkalian nilai Z = -0.67


ialah 0.2486. Oleh itu kebarangkalian nilai Z di antara Z = -2.33 dan Z = 0.67

22
Persampelan dan Taburan Persampelan

ialah 0.4901 – 0.2486 = 0.2415. Oleh yang demikian, terdapat 24.15% peluang
memilih secara rawak tempoh masa 49 jam untuk memperolehi min sampel di
antara 441 dan 446 pelanggan.

7.3.1 Persampelan daripada Populasi Finit

Contoh yang akan ditunjukkan di dalam bahagian ini dan Contoh 7.1 adalah
berdasarkan kepada andaian populasi adalah infiniti atau terlalu besar. Di dalam
kes populasi finit, pelarasan statistik boleh dilakukan terhadap formula Z bagi
min sampel. Pelarasan adalah dipanggil sebagai faktor pembetulan finit:
N-n
. Ia beroperasi di atas sisihan piawai min sampel,  X . Berikut ialah
N-1
formula Z bagi min sampel apabila sampel adalah dipilih dari populasi finit.

Formula Z bagi Min Sampel apabila


Terdapat Populasi Finit

X -
Z
   N  n 
  
 n  N - 1 

Jika sampel rawak bersaiz 35 adalah diambil daripada populasi finit


hanya 500, min sampel kelihatan terpesong sedikit daripada min populasi
berbanding dengan kes jika sampel saiz 35 diambil dari populasi infiniti. Bagi
sampel bersaiz 35 yang diambil dari populasi finit bersaiz 500, faktor pembetulan
finit ialah

23
Pengenalan kepada Statistik Ekonomi dan Perniagaan

500 - 35 465
  0.965
500 - 1 499

Oleh itu sisihan piawai bagi min – kadang kala dirujukkan sebagai
sisihan piawai bagi min – adalah diselaraskan rendah sedikit menggunakan
0.965. Apabila saiz populasi finit semangkin besar di dalam hubungannya denga
saiz sampel, faktor pembetulan finit akan menghampiri 1. Secara teorinya,
apabila penyelidik berkerja dengan populasi finit, mereka boleh menggunakan
faktor pembetulan finit. Sebagai peraturan semulajadi kepada kebanyakan
penyelidik, jika saiz sampel kurang daripada 5% saiz populasi finit, faktor
pembetulan finit tidak signifikan mengubahsuai penyelesaian. Jadual 7.5
mengandungi beberapa ilustrasi faktor pembetulan finit.

Jadual 7.5
Faktor Pembetulan Finit bagi Beberapa saiz Sampel

Saiz Populasi Saiz sampel Nilai Faktor


Pembetulan
2000 30 (<4% N) 0.993
2000 500 0.866
500 30 0.971
500 200 0.775
200 30 0.924
200 75 0.793

Contoh 7.2

Syarikat pengeluaran mempunyai 350 jam pekerja dengan purata umur 37.6
tahun dengan sisihan piawai 8.3 tahun. Jika sampel rawak 45 jam pekerja
diambil, apakah kebarangkalian sempel tersebut mempunyai purata umur kurang
daripada 40 tahun?

Penyelesaian:

Min populasi ialah 37.6, dengan sisihan piawai 8.3; iaitu,  = 37.6 dan  = 8.3.
Saiz sampel ialah 45, tetapi diambil dari populasi finit 350; iaitu n = 45 dan N =
350. Min sampel di bawah pertimbangan ialah 40, atau X = 40. Rajah berikut
menunjukkan masalah tersebut di dalam keluk normal.

24
Persampelan dan Taburan Persampelan

=37.6 X  40
Z=0 Z=2.07

Menggunakan formula Z dengan faktor pembetulan finit memberikan

40.0 - 37.6 2.4


Z   2.07
 
8.3   350 - 45   1.157
 
 45   350 - 1 

Niali Z ini menghasilkan kebarangkalian 0.4808 (Jadual A.3). Oleh itu,


kebarangkalian memperolehi purata umur sampel kurang daripada 40 tahun ialah
0.4808 + 0.5000 = 0.9808. Jika faktor pembetulan finit tidak digunakan, nilai Z
adalah 1.94 dan jawapan akhir ialah 0.9738.

7.3 Taburan Persampelan p

Kadangkala di dalam menganalisis sampel, penyelidik akan memilih untuk


menggunakan perkadaran sampel p , berbanding min sampel. Jika penyelidikan
menghasilkan data yang boleh diukur seperti berat, jarak, masa, dan pendapatan,
min sampel selalunya satatistik yang dipilih. Walau bagaimanapun, jika
penyelidikan menghasilkan item yang boleh dibilang seperti berapa banyak orang
di dalam sampel memilih Coca-Cola sebagai minuman ringan dan berapa banyak
orang di dalam sampel yang memilih untuk bersara awal, perkadaran sampel

25
Pengenalan kepada Statistik Ekonomi dan Perniagaan

biasanya statistik yang dipilih. Dimana min adalah dikira dengan mempuratakan
set nilai, perkadaran sampel adalah dikira dengan membahagikan kekerapan
dimana ciri-ciri yang dikehendaki terjadi di dalam sampel dengan bilangan item
di dalam sampel.

Perkadaran Sampel

X
p
n
dimana
X= bilangan item di dalam sampel yang mempunyai
ciri-ciri yang dikehendaki
N= bilangan item di dalam sampel

Sebagai contoh, di dalam sampel 100 pekerja kilang, 30 pekerja adalah


ahli kepada kesatuan sekerja. Nilai p bagi ciri ini, ahli kesatuan sekerja, ialah
30
100 = 0.20. Atau, di dalam sampel 500 kedai dipasaraya, 10 adalah kedai kasut.
10
Perkadaran sampel kedai kasut ialah 500 = 0.02. Perkadaran sampel
menggunakan statistik dengan meluas dan biasanya dikira bagi soalan yang
melibatkan jawapan YA atau TIDAK. Sebagai contoh, adakah anda mempunyai
pendidikan sekurang-kurangnya sekolah menengah? Adakah anda lelaki?
Bagaimanakah penyelidik menggunakan perkadaran sampel di dalam
analisis? Teorem had memusat digunakan kepada pekadaran sampel di dalam
taburan normal sebahagi penghampiran bentuk taburan perkadaran sampel jika
n.P > 5 dan n.Q > 5 (P ialah perkadaran populasi dan Q = 1 – P). Min perkadaran
sampel bagi semua sampel bersaiz n dipilih secara rawak daripada populasi ialah
P.Q
P (perkadaran populasi) dan sisihan piawai perkadaran sampel ialah n
,
kadangkala dirujukkan sebagai perkadaran ralat piawai. Perkadaran sampel juga
mempunyai formula Z:

Formula Z bagi Perkadaran Sampel


bagi n.P > 5 dan n.Q > 5

p-P
Z
P.Q
n
dimana 26
p= perkadaran sampel
n = saiz sampel
P = perkadaran populasi
Q=1-P
Persampelan dan Taburan Persampelan

Katakan 60% kontraktor elektrik di Serdang menggunakan jenama dawai


elektrik tertentu. Apakah kebarangkalian mengambil sampel rawak bersaiz 120
daripada kontraktor elektrik tersebut dan mendapati 0.50 atau kurang
menggunakan jenama dawai elektrik tersebut? Bagi masalah ini

P = 0.60 p = 0.50 dan n = 120

Formula Z menghasilkan

0.50 - 0.60 - 0.10


Z   2.24
(0.60)(0.40) 0.0447
120

Dari Jadual A.3, kebarangkalian berpadanan dengan Z = -2.24 adalah


0.4875. Bagi Z < -2.24 (hujung kiri taburan), jawapannya ialah 0.5000 – 0.4875
= 0.0125. Rajah 7.8 menunjukkan masalah tersebut dan penyelesaian secara
geraf.

Rajah 7.8
Penyelesaian Geraf Contoh Kontraktor Elektrik

27
Pengenalan kepada Statistik Ekonomi dan Perniagaan

Z=-2.24
0.125
0.4875

^
p  0.50 p=0.60
Z=-2.24 Z=0

Jawapan ini menunjukkan penyelidik mempunyai kesukaran


(kebarangkalian 0.0125) mencari 50% atau kurang sampel 120 kontraktor yang
menggunakan dawai elektrik berjenama yang diberi jika perkadaran populasi
bahagian pasaran bagi dawai elektrik tersebut ialah 0.60. Jika keputusan sampel
ini sebenarrnya berlaku, sama ada terdapat peluang yang jarang atau perkadaran
populasi 0.60 tidak akan berlaku di dalam populasi ini.

Contoh 7.3

Jika 10% populasi barangan adalah rosak, apakah kebarangkalian memilih secara
rawak 80 barangan dan mendapati 12 atau lebih barangan yang rosak.

Penyelesaian

Disini, P = 0.10, p = 12/80 = 0.15 dan n = 80. Menggunakan formula Z


memberikan

0.15 - 0.10 0.05


Z   1.49
(0.10)(0.90) 0.0335
80
Jadual A.3 memberikan kebarangkalian 0.4319 bagi nilai Z 1.49, dimana
kawasan di antara perkadaran sampel, 0.15 dan perkadaran populasi, 0.10.
Jawapan bagi soalan ini ialah

28
Persampelan dan Taburan Persampelan

P( p  0.15) = 0.5000 – 0.4319 = 0.0681

Oleh itu, lebih kurang 6.81% daripada masa, 12 atau lebih barangan yang rosak
diperolehi di dalam sampel rawak 80 barangan apabila perkadaran populasi ialah
0.10. Rajah di bawah menunjukkan masalah ini secara grafik.

Z=1.49 0.0681

0.4319

^
p=0.10 p  0.15
Z=0 Z=1.49

29

You might also like