Professional Documents
Culture Documents
Asas Statistik PDF
Asas Statistik PDF
Pengenalan
Bab ini akan memperkenalkan bidang Statistik yang asas. Di sini, beberapa analisis
data yang mudah akan dijalankan Data- data ini akan dikumpul dan diringkaskan
dalam jadual dan diwakilkan dengan perwakilan- perwakilan seperti carta dan graf.
Seterusnya perwakilan ini akan diterjemahkan melalui penerangan yang berkaitan
seperti mengenalpasti ukuran kecenderungan memusat, serakan atau jenis taburan
dan ini akan memberi makna dan gamabaran yang jelas. Kemahiran ini amat perlu
diterapkan dalam pendidikan guru khususnya dan sangat berguna dalam kehidupan
seharian.
5.2
Pembahagian Data
Data kuantitatif boleh dibahagi kepada 4 jenis menggunakan empat jenis skala
pengukuran. Skala boleh ditakrifkan sebagai angka yang digunakan untuk mengkelas
atau menunjukkan tahap/nilai sesuatu ukuran. Suatu data dikelaskan dalam skala
a. nominal,
b. ordinal,
c. sela, dan
d. nisbah
5.2.1 Data Nominal
Nominal ialah skala yang dianggap paling mudah dan mempunyai ketepatan yang
paling rendah. Skala ini mengkategorikan pemboleh ubah berdasarkan persamaan dan
seterusnya memberikan nama kepada pemboleh ubah berkenaan. Jantina, ras dan
warna adalah contoh data nominal. Jantina diwakilkan dengan 1 bagi lelaki dan 2 bagi
perempuan. Nilai nombor 1 bukan bermaksud lebih kecil dari 2 atau lebih baik dari 2.
Nilai nombor 1 dan 2 hanyalah melambangkan atau mewakili kategori bagi lelaki dan
perempuan. Begitu juga bagi ras dimana 1 mewakili kaum Melayu, 2 mewakili kaum
Cina, 3 mewakili kaum India dan 4 mewakili kaum-kaum lain. Nombor hanya perwakilan
sesuatu kumpulan data. Serupa juga bagi warna dimana kita boleh menyatakan 1
sebagai Merah, 2 sebagai kuning, 3 sebagai hijau dan sebagainya.
Ciri-ciri utama skala nominal adalah:
i. Setiap ahli hanya dimiliki oleh satu kategori sahaja, misalnya, individu yang
dikelaskan ke dalam kategori lelaki tidak boleh menjadi ahli kategori jantina lain.
ii. Nombor yang mewakili setiap kategori tidak mempunyai nilai pemeringkatan, tetapi
dianggap sebagai nama kategori sahaja.
iii. Pengkelasan data asal bagi data nominal bersifat satu kepada satu.
Latihan 1 :
Apakah jenis data bagi makanan kegemaran?
Apakah jenis data bagi saiz kasut?
Apakah jenis data bagi kedudukan dalam kelas?
Latihan 2 :
Apakah yang dimaksudkan dengan skala Likert?
Berikan contoh yang sesuai bagi data yang menggunakan skala Likert.
5.3
Bagi kuantiti data yang banyak atau besar julatnya, maka adalah lebih baik
dikumpulkan dahulu data tersebut dalam sela mengikut saiz kelasnya. Perwakilan data
boleh digambarkan melalui histogram atau apa saja perwakilan yang sesuai.
Misalnya data mengenai umur orang yang datang ke dewan orang ramai. Data ini elok
dikumpulkan dahulu. Jika umur 1-5 tahun dikumpulkan, maka saiz kelasnya adalah 5.
secara umum data dikumpul dalam kelas umur mengikut jadual berikut:
Umur (Tahun)
1-5
6 - 10
11 -15
16 - 20
Gundalan
Kekerapan
3
8
12
1
2
Secara lebih statistikal, bilangan kelas dan saiz kelas dapat ditentukan dengan lebih
baik melalui formula berikut;
Bilangan kelas :
K 1 + 3.3 log(n)
K = bilangan kelas yang sesuai
n = jumlah data
Saiz kelas :
saiz kelas =
Latihan 3 :
35
65
65
70
74
75
70
62
50
62
65
66
78
70
45
62
60
80
72
52
68
72
47
55
55
55
95
70
55
68
66
85
68
60
82
60
66
90
56
80
62
70
40
48
75
80
68
72
75
75
Kirakan berapa bilangan kelas (K) dan saiz kelas yang sesuai bagi data di atas?
Piktograf
Carta Palang
Histogram
Graf Garis
Ogif
Boxplot
Poligon Kekerapan
Scattergram
Latihan 4 :
Anda dikehendaki mengumpul beberapa keratan perwakilan data dari mana-mana
bahan bercetak seperti akhbar, majalah, bulletin dan sebagainya dan buat ulasan
mengenai perwakilan tersebut.
Latihan 5 :
Anda dikehendaki mendapatkan maklumat tentang bagaimana cara mewakilkan data
menggunakan stem and leaf, box-plot dan scattergram.
Contoh data tidak terkumpul
Berikut adalah data pemilikan kereta bagi 26 keluarga.
Bilangan kereta
0
1
2
3
4
Gundal
Kekerapan
3
8
12
1
2
Pembacaan data : Data dibaca secara terus mengikut bilangan kereta dan kekerapan
yang diberi. Tiga keluarga tidak memiliki kereta. Lapan keluarga memiliki sebuah kereta
dan dua belas keluarga memiliki dua buah kereta. Manakala hanya satu keluarga
memiliki sebuah kereta dan dua keluarga memiliki empat buah kereta.
Terjemahan data : Data diterjemah mengikut tujuan. Kebanyakan keluarga memiliki
satu dan dua buah kereta. Sejumlah 12 keluarga memiliki dua buah kereta dan 8
keluarga memiliki sebuah kereta. Terdapat 3 keluarga yang kurang mampu untuk
memiliki kereta manakala ada 3 keluarga lain mampu memiliki tiga dan empat buah
kereta.
Kekerapan (keluarga)
Latihan 6 :
Penggunaan gundal sangat membantu dalam mempastikan setiap data telah
diambilkira. Jelaskan bagaimana teknik analisis data yang cepat dan tepat bagi data
latihan 4 di bawah dilaksanakan?
Latihan 7 :
Bayangkan anda telah mengutip data mengenai jumlah binatang peliharaan pelajar
dalam kelas anda. Data mentah dari 60 pelajar adalah seperti berikut:
0 2 1 2 0 4 1 0 2 2
1 6 1 1 2 8 0 1 2 4
2 1 2 0 3 2 0 1 3 0
1 4 0 3 0 2 3 6 4 3
3 3 0 1 2 0 1 1 3 0
2 0 3 2 0 4 2 2 3 1
Pilih satu perwakilan data yang sesuai untuk menggambarkan data tersebut.
Apabila anda menterjemah data di atas, selain dari jumlah binatang peliharaan, apakah
maklumat lain yang anda fikir penting?.
Umur
0-9
10-19
20-29
30-39
40-49
50-59
60-69
70-79
80-89
90-99
Gundal
Kekerapan
8
12
24
43
41
27
23
18
3
1
Kekerapan (orang)
Umur (tahun)
Latihan 8 :
Apakah beza antara carta palang dan histogram?
Bincangkan sifat-sifat carta palang dan histogram.
Berikan 2 contoh data yang sesuai dipaparkan menggunakan carta palang dan
histogram.
Latihan 9 :
Satu pemerhatian di pintu pagar sekolah telah dilakukan untuk mencatat bilangan
penumpang setiap kereta yang masuk ke kawasan sekolah.
Berikut adalah carta palang yang dibina hasil dari pemerhatian tersebut.
10
Latihan 10 :
Jadual berikut menunjukkan data rancangan TV yang diminati oleh pelajar SMK Jalan
Merab. Jumlah pelajar sekolah ini adalah 840 orang.
Rancangan
A
B
C
D
E
F
G
Bilangan Pelajar
46
32
28
25
23
21
25
11
Latihan 11` :
Bincangkan apakah kesilapan atau kekeliruan yang terdapat dalam perwakilan data
berikut?
12
5.4
Selain menterjemah perwakilan data, kita juga boleh mengira nilai ukuran-ukuran
kecenderungan memusat iaitu nilai min, mod dan media. Sebaran data pula boleh
dilihat melalui nilai julat, sisihan piawai dan varians.
Secara umumnya, min adalah purata, median adalah nilai di tengah- tengah kumpulan
data yang tersusun manakala mod adalah data yang mempunyai kekerapan tertinggi
atau paling kerap berlaku.
5.4.1 Mencari nilai min, mod dan median data tidak terkumpul:
Data : 13, 18, 13, 14, 13, 16, 14, 21, 13
Min adalah purata :
= (13 + 18 + 13 + 14 + 13 + 16 + 14 + 21 + 13) 9 = 15
Median adalah nilai ditengah- tengah. Data perlu disusun dalam susunan menaik
atau menurun.
13, 13, 13, 13, 14, 14, 16, 18, 21
Jumlah data ialah sembilan, Maka, nilai di tengah - tengah adalah nilai ke (9+1)
2 = 10 2 = 5 (nilai kelima) :
13, 13, 13, 13, 14, 14, 16, 18, 21, maka median adalah 14. C
Mod adalah kekerapan tertinggi dan dalam senarai ini mod adalah 13.
Nilai terbesar adalah 21 dan nilai terkecil adalah 13. Maka julat adalah beza nilai
terbesar dengan nilai terkecil.
Maka julat adalah 21 13 = 8.
Min
Median
Mod
Julat
: 15
: 14
: 13
:8
13
Ukuran
Min
Untuk mengira min,
kita perlu jumlahkan
semua data dan
bahagi dengan
bilangan data.
Set A : 2, 2, 3, 5, 5, 7, 8
Set B : 2, 3, 3, 4, 6, 7
Jumlahkan:
2 + 2 + 3 + 5 + 5 + 7 + 8 = 32
Jumlahkan:
2 + 3 + 3 + 4 + 6 + 7 = 25
Median
Untuk mengira
median, kita perlu
susunkan data secara
menaik atau
menurun. Nilai
ditengah- tengah
adalah median. Jika
terdapat dua nilai
ditengah, maka
puratanya adalah
median.
Mod
Mod adalah data
yang mempunyai
kekerapan tertinggi.
Mod boleh jadi lebih
dari satu nilai samada
dwimod atau
multimod mengikut
nilai pada data.
Data :
2,2,3,5,5,7,8
Data :
2,3,3,4,6,7
Julat
Untuk mendapatkan
julat, cari beza antara
nilai tertinggi dengan
nilai terendah
Data :
2,2,3,5,5,7,8
Data :
2,3,3,4,6,7
Julat adalah 6
Julat adalah 5
14
Latihan 12 :
Apakah yang anda faham bagi situasi berikut :
a) Min bagi matapelajaran matematik kelas 5 Cempaka adalah 85 dan kelas 5 Mawar
adalah 70 pada Ujian semester satu?
b) Markah matematik kelas Cempaka berjulat 40 manakala kelas Mawar berjulat 60.
Min
Min adalah purata dan ia dikira menggunakan nilai titik tengah. Pengiraannya adalah
menggunakan formula
f M
f
i
Median
Nilai median bagi data tidak terkumpul adalah nilai yang terletak ditengah-tengah
apabila data tersebut disusun secara menaik. Bagi data yang terkumpul, pengiraan
median agak rumit dan menggunakan formula berikut:
Median L
N
2
- cf p
f med
di mana
L
cfp
fmed
W
N
15
Mod
Kelas mod adalah selang kelas yang mempunyai kekerapan yang tertinggi. Nilai mod
bagi data terkumpul dikira mengikut formula berikut :
dimana
LB sempadan bawah kelas mod
B beza kekerapan kelas mod dengan kelas sebelumnya
A beza kekerapan kelas mod dengan kelas selepasnya
C
5.5
Ukuran Serakan
Ukuran serakan menerangkan serakan atau taburan sesuatu set data. Menggunakan
ukuran serakan bersama-sama ukuran kecenderungan memusat membuatkan
pemerihalan atau perwakilan data lebih lengkap lagi.
Tiga Taburan dengan Min Sampel yang sama dan Serakan Berbeza
=50
Julat
Julat adalah perbezaan di antara nilai terbesar dan nilai terkecil. Walaupun ia hanya
merupakan nilai numerik tunggal yang merupakan ukuran serakan kasar dan dapat
menerangkan jarak ke sempadan luar set data atau taburan sesuatu data.
Julat = Nilai terbesar nilai terkecil
16
Varian
Varian ialah purata jumlah kuasadua sisihan antara min dan set nombor. Populasi
varian ditandakan dengan huruf Greek, 2 dan formulanya ialah:
(X - ) 2
X-
( X - )2
-8
64
-4
16
16
+3
17
+4
16
18
+5
25
X = 65
(X - ) = 0
(X - )2 = 130
Varian =
(X - )
130
26.0
5
Varian adalah kuasadua sisihan piawai, maka nilai varian digunakan untuk
memperolehi nilai sisihan piawai.
Sisihan Piawai
Sisihan piawai ialah punca kuasadua varian.
sebagai , dan dikira sebagaimana berikut:
(X - )
2 26 5.1
17
Data Terkumpul
Sisihan Piawai Populasi dan Sampel
Bagi data terkumpul, ukuran serakan seperti varian dan sisihan piawai dikira
menggunakan formula seperti berikut:
Varian bagi sampel ditandakan sebagai s2 dan sisihan piawai ialah s. Pengiraan varian
dan sisihan piawai bagi sampel berbeza sedikit daripada pengiraan varian dan sisihan
piawai untuk populasi. Tujuan utama pengiraan varian dan sisihan piawai untuk
sampel adalah untuk menganggar varian dan sisihan piawai untuk populasi.
Menggunakan n 1 sebagai pembahagi (denominator) bagi sampel berbanding N
untuk populasi, menghasilkan penganggaran yang lebih baik untuk nilai populasi.
(X - X) 2
n -1
s s2
Dan,
Varian untuk populasi:
2
f(M - ) 2
N
2
di mana,
f = kekerapan
M = titik tengah kelas
N = f atau jumlah kekerapan populasi
= min kumpulan bagi populasi.
18
Latihan 13 :
Berdasarkan nilai min, mod dan median dalam taburan data berikut, bincangkan:
i)
sifat-sifat data
ii)
a) Taburan Normal
19
Latihan 14 :
Bincangkan tentang serakan data berikut :
a) Lengkung berikut mempunyai serakan yang berbeza dan min yang sama.
lengkung 1
lengkung 2
20
b) Lengkung berikut mempunyai serakan yang sama tetapi nilai minnya berbeza.
lengkung 3
lengkung 4
Latihan 15 :
a) Apakah sifat-sifat yang ada pada taburan normal?
b) Gambarkan situasi pada data yang ada pada lengkung leptokurtic, mesokurtic dan
platykurtic
21
Skor Z
Skor Z mewakili nilai sisihan piawai di atas atau di bawah min bagi set nombor yang
mempunyai taburan normal. Menggunakan skor Z membolehkan kita menterjemahkan
nilai kasar jarak daripada min kepada unit sisihan piawai.
Z
X-
X-X
s
Skor T
T=10z + 50
Perkaitan antara sisihan piawai, skor Z dan skor T dapat dilihat pada rajah berikut :
22
23
5.6
KEBARANGKALIAN
Aida melakukan ujikaji melambung sebiji dadu adil di atas meja dan dicatatkan
kesudahannya. Adakah nombor 0 ialah kesudahannya? Mungkin jawapannya ialah
barangkali atau kurang pasti atau mustahil. Daripada kenyataan di atas unsur-unsur
ketidakpastian berlaku dan muncul dalam kehidupan harian. Oleh itu adalah penting
untuk kita memperoleh pengetahuan dan kemahiran dalam menentukan sejauh mana
sesuatu kejadian itu mungkin berlaku.
Dalam matematik unsur ketidakpastian dikaji dalam bidang kebarangkalian.
Kebarangkalian berlaku daripada permainan yang melibatkan peluang seperti
perjudiaan, kajian fizik, genetik, insuran dan sebagaimya.
Beberapa terminologi yang berkaitan dengan kebarangkalian seperti ujikaji, kesudahan
yang mungkin, ruang sampel dan peristiwa akan diberi tumpuan dalam modul ini.
Ruang sampel ialah set semua kesudahan yang mungkin bagi suatu ujikaji.
Ruang sampel diwakili oleh S atau dan boleh ditulis dengan menggunakan tata
tanda set. Misalnya ruang sampel bagi ujikaji melambung sekeping duit syiling
mempunyai 2 titik sampel. Semua kesudahan yang mungkin ialah gambar dan
angka, S = { g, a }. Begitu juga dengan ujikaji melambung sebiji dadu iaitu
semua kesudahan yang mungkin 1, 2, 3. 4, 5, 6 iaitu S = {1, 2, 3, 4, 5, 6}.
Dalam suatu ujikaji kita boleh menyenaraikan semua kesudahan yang mungkin
untuk mendapatkan ruang sampel secara aktiviti dan penaakulan
24
Contohnya
Sebuah beg mengandungi guli yang berwarna putih, biru, dan hijau. Sebiji guli
dikeluarkan secara rawak daripada beg itu. .
Kita boleh menentukan semua kesudahan yang mungkin bagi ujikaji mengambil
sebiji guli daripada aktiviti. Sebaliknya kita boleh juga menentukan kesudahan
yang mungkin secara penaakulan iaitu kita menganalisis ujikaji atau situasi
berkenaan dan mempertimbangkan secara teliti semua kesudahan yang
mungkin berlaku. Setiap kali guli diambil, guli berwarna putih atau biru atau hijau
mungkin dipilih. Maka semua kesudahan yang mungkin ialah { putih, biru, hijau}
Begitu juga kita boleh meramalkan keputusan perlawanan hoki secara
penaakulan, Terdapat 3 keputusan yang mungkin dicapai oleh perlawanan
tersebut iaitu menang atau seri atau kalah. Maka kesudahan yang mungkin ialah
{ menang, seri, kalah }.
1
2
3
4
5
6
(1, 1)
(1, 2)
(1, 3)
(1, 4)
(1, 5)
(1, 6)
(2, 1)
(2, 2)
(2, 3)
(2, 4)
(2, 5)
(2, 6)
(3, 1)
(3, 2)
(3, 3)
(3, 4)
(3, 5)
(3, 6)
(4, 1)
(4, 2)
(4, 3)
(4, 4)
(4, 5)
(4, 6)
(5, 1)
(5, 2)
(5, 3)
(5, 4)
(5, 5)
(5, 6)
(6, 1)
(6, 2)
(6, 3)
(6, 4)
(6, 5)
(6, 6)
25
S = { (1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1),
(3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3),
(5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6) }
Pilihan 1
Pilihan 2
Kesudahan
(a,a)
(a,b)
(b,a)
(b,b)
26
5.6.3 Peristiwa
A = { 2, 4, 6}
B = { 2, 3, 5 }
C = {1, 3, 5 }
Cuba selesaikan.
Lima keping kad seperti yang ditunjukkan di atas telah dimasukkan ke dalam
sebuah kotak. Sekeping kad itu adalah dipilih secara rawak daripada kotak itu.
Nyatakan unsur-unsur ruang sampel yang memenuhi setiap syarat berikut.:
(a) Sekeping kad berhutruf vokal dipilih
(b) Sekeping kad berhuruf konsonan dipilih
27
Contoh
Satu nombor dua digit adalah dibentukkan daripada digit-digit 1, 2, 3. Tentukan
sama ada setiap peristiwa yang berikut adalah mungkin bagi suatu ruang sampel
atau tidak.
a)
b)
c)
28
5.6.4 Kebarangkalian
( )
( )
Contoh
Sebiji dadu adil dilambung. A ialah peristiwa mendapat nombor perdana. Cari
kebarangkalian A.
S = { 1, 2, 3, 4, 5, 6 }
n( S ) = 6
A = { 2, 3, 5 }
n( A ) = 3
P( A ) =
( )
( )
=
=
29
Dua keping duit syiling dilambung sebanyak 200 kali. Tentukan bilangan kali
untuk mendapat dua gambar.
Bilangan kali untuk mendapat dua gambar =
x 200
= 50
Contoh
Satu huruf dipilih secara rawak daripada perkataan NKRA. Jika V mewakili
peristiwa mendapatkan vokal, nyatakan pelengkap V
S = { N, K, R, A }
V={A}
V = { N, K, R }
30
B.
Peristiwa mendapat angka pada lambungan pertama atau kedua ialah peristiwa
A atau B.
Peristiwa A atau B = A
31
a) Peristiwa mendapat angka pada lambungan pertama dan kedua ialah peristiwa A
dan B.
Peristiwa A dan B = A B = {(a, a)}
Jika kita dapat menyenaraikan set kesudahan bagi peristiwa bergabung A atau B
dan A dan B, maka kita boleh mengira kebarangkalian dengan rumus
P(A atau B) = P(A
B) =
B) =
)
( )
)
( )
32
Rujukan :
Chua Yan Piaw (2006). Kaedah Dan Statistik Penyelidikan. The McGraw-Hill
companies, Malalaysia.
Hopkins, K.D. (1998). Educational and Psycological Measurement and Evaluation. (8 th.
Ed). Boston: Allyn and Bacon.
Jerry Howett (2000). Number power ( a real world approach toMaths). Contemporary
Books. USA
Mohd Majid Konting (2000). Kaedah Penyelidikan Pendidikan. Kuala Lumpur,
Noll, V.H. & Scannel, D.P. (1992). Introductions to Educational Measurement. Boston:
Houghton Mifflin Company.
Popham, W.J. (2000). Modern Educational Measurement, Practical Guidelines for
Educational Leaders. (3rd. Ed). Boston: Allyn and Bacon.
Siti Rahayah Ariffin (2003). Teori, Konsep dan Amalan Dalam Pengukuran dan
Penilaian. Penerbitan Pusat Pembangunan Akademik, Bangi, Universiti
Kebangsaan Malaysia.
Yap Yee Khiong, Wan Chwee Seng, Ismail Abu Bakar (1985). Pengukuran Dan
Penilaian dalam Pendidikan. Kuala Lumpur, Heinemann Asia. Percetakan
Dewan Bahasa Dan Pusaka.
33