You are on page 1of 43

Unit 3 Pengumpulan dan Pengurusan Data | 15

UNIT PELAJARAN 3

PENGUMPULAN DAN PENGURUSAN DATA

HASIL PEMBELAJARAN

Di akhir unit ini, anda diharap dapat:

1. 2.

Mengumpul dan mengklasifikasi data mengikut jenis-jenisnya. Mengurus data ke dalam jadual-jadual tertentu.

PENGENALAN

tatistik deskriptif mengandungi pelbagai kaedah, bukan sahaja untuk menguruskan data malahan meringkaskan maklumat atau data yang diperoleh agar mudah dibaca dengan jelas dan berkesan. Dalam Unit 3 ini, kita akan membincangkan mengenai bagaimana data

Unit 3 Pengumpulan dan Pengurusan Data | 16

dikumpulkan dan diuruskan dengan kaedah yang bersesuaian. Sebelum itu, kita akan mengenali dengan lebih dekat lagi apa itu pembolehubah kuantitatif dan pembolehubah kualitatif. Begitu juga dengan data kuantitatif dan data kualitatif. Kita juga akan diperkenalkan dengan dua jenis data kuantitatif iaitu data diskret dan data selanjar.

Setelah kita mengenali apa itu pembolehubah dan jenis-jenis data, kita akan mempelajari pula bagaimana hendak mengumpulkan data mengikut taburan-taburan tertentu. Penerangan berserta contoh-contoh berkaitan dengan taburan kekerapan dan taburan kekerapan relatif disertakan untuk kita lebih memahami dan mendalami data dan taburannya.

Selain daripada itu, kita juga akan diuji dengan latihan-latihan formatif berkaitan subtajuksubtajuk yang dipelajari. Akhir sekali, kita akan diuji dengan latihan sumatif yang merangkumi apa yang telah kita bincangkan dalam unit ini.

PEMBOLEHUBAH DAN DATA

Ciri yang berbeza antara seseorang atau sesuatu benda kepada yang lain dikenali sebagai pembolehubah. Contoh-contoh pembolehubah yang melibatkan manusia termasuklah tinggi, berat, bilangan adik-beradik, jantina, taraf perkahwinan dan warna mata. Tiga contoh pertama yang diberikan melibatkan maklumat yang boleh dihitung ialah pembolehubah kuantitatif. Tiga

Unit 3 Pengumpulan dan Pengurusan Data | 17

contoh yang terakhir melibatkan maklumat yang tidak boleh dihitung ialah pembolehubah kualitatif.

Terdapat dua jenis pembolehubah kuantitatif, iaitu pembolehubah diskret dan pembolehubah selanjar. Satu pembolehubah diskret ialah nilai mungkin yang membentuk satu set nombor terhingga (atau terbilangkan tak terhingga), kebiasaannya melibatkan nombor bulat. Bilangan adik-beradik yang dipunyai oleh seseorang merupakan satu contoh pembolehubah diskret. Pembolehubah selanjar ialah nilai mungkin yang membentuk julat nombor. Ketinggian seseorang ialah satu contoh pembolehubah selanjar. Secara ringkasnya, perbincangan tentang pembolehubah boleh disimpulkan seperti berikut dalam jadual dan rajah di bawah:

Pembolehubah Pembole ubah kuantitatif Pembolehubah kualitatif Pembolehubah diskret

: : : :

Satu ciri yang berbeza antara seseorang atau sesuatu benda kepada yang lain. Satu pembolehubah nilai berangka. Satu pembolehubah nilai tak berangka. Satu pembolehubah kuantitatif dengan nilai mungkin membentuk satu set nombor terhingga (atau terbilangkan tak terhingga). Satu pembolehubah kuantitatif dengan nilai mungkin yang membentuk julat nombor.

Pembolehubah selanjar

Unit 3 Pengumpulan dan Pengurusan Data | 18

Pemerhatian yang dijalankan terhadap nilai-nilai satu pembolehubah berkaitan seseorang atau sesuatu benda dikenali sebagai data. Maka, maklumat yang dikumpulkan, diuruskan dan dianalisis oleh pakar-pakar statistik ialah data. Terma-terma yang digunakan untuk menggambarkan satu pembolehubah juga digunakan dalam menggambarkan data.

Data kualitatif

Data kualitatif ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai pembolehubah kualitatif yang mana ia terdiri daripada angka-angka atau skor-skor yang tidak mempunyai nilai kuantiti. Angka-angka atau skor-skor ini cuma menunjukkan kategori, nama, jenis, kelas atau

Unit 3 Pengumpulan dan Pengurusan Data | 19

pangkat bandingan. Contohnya, jantina (1 = lelaki, 2 = perempuan), jenis rumah (1 = banglo, 2 = teres, 3 = pangsapuri), gred peperiksaan (1 = A, 2 = B, 3 = C) dan lain-lain lagi. Data kualitatif menyukat kualiti dan bukan kuantiti.

Data kuantitatif

Data kuantitatif pula ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai pembolehubah kuantitatif yang mana ia tediri daripada angka-angka atau skor-skor yang mempunyaii nilai berangka. Angka-angka atau skor-skor ini menunjukkan banyak, kekuatan atau saiz sesuatu ciri seperti berat, umur, tinggi, markah ujian dan lain-lain. Data kuantitatif terdiri daripada data diskret dan data selanjar.

Data diskret

Data diskret ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah diskret dengan cara membilang. Data diskret cuma boleh mengambil nilai tetap atau nilai tepat sahaja. Contohnya, bilangan buah buku atas rak, bilangan kenderaan yang melalui plaza tol, bilangan ahli dalam sebuah keluarga, bilangan murid dalam sebuah kelas, dan lain-lain lagi.

Unit 3 Pengumpulan dan Pengurusan Data | 20

Data selanjar

Data selanjar ialah data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah selanjar yang hanya boleh diberi nilai dalam suatu julat dan tidak boleh mengambil satu nilai tunggal atau satu nilai tepat. Contohnya, tinggi orang, berat orang atau benda, halaju sebuah kapal terbang dan lain-lain lagi.

Data

Maklumat yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah.

Data kualitatif : Data kuantitatif : Data diskret :

Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah kualitatif. Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah kuantitatif. Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah diskret dengan cara membilang. Data yang diperolehi melalui pemerhatian ke atas nilai-nilai satu pembolehubah selanjar.

Data selanjar :

Contoh 3.1 Manusia diklasifikasikan hanya mempunyai satu daripada empat jenis darah: A, B, AB, atau O. Apakah jenis data yang anda terima apabila anda diberitahu jenis darah anda?

Unit 3 Pengumpulan dan Pengurusan Data | 21

Penyelesaian: Jenis darah tergolong dalam data kualitatif data diperolehi dengan memerhatikan nilai pembolehubah jenis darah.

Contoh 3.2 Banci perumahan dijalankan sekali dalam tempoh 10 tahun untuk mengetahui bilangan ahli dalam sebuah keluarga. Apakah jenis data yang diperolehi melalui bilangan ahli dalam sebuah keluarga? Penyelesaian: Bilangan ahli dalam sebuah keluarga tergolong dalam data kuantitatif iaitu data diskret data diperolehi dengan memerhatikan nilai pembolehubah bilangan ahli dalam sebuah keluarga.

Contoh 3.3 Di awal persekolahan, Cikgu Ali telah mengukur tinggi dan berat murid-murid kelasnya. Apakah jenis data yang diperolehi melalui tinggi dan berat? Penyelesaian: Tinggi dan berat tergolong dalam data kuantitatif iaitu data selanjar data diperolehi dengan memerhatikan nilai pembolehubah tinggi dan berat.

Unit 3 Pengumpulan dan Pengurusan Data | 22

Cuba anda fikirkan tiga contoh yang berkaitan dengan data diskret, data selanjar dan data kualitatif selain daripada contoh-contoh di atas.

Latihan Formatif 3.1

Untuk soalan-soalan 1 2, klasifikasikan sama ada data yang diberikan ialah data kualitatif atau data kuantitatif. Jika kuantitatif, nyatakan sama ada data tersebut ialah data diskret atau data selanjar. Juga kenal pasti pembolehubahnya. 1. Mengikut kajian yang dijalankan oleh Sidney S. Culbert (Universiti Washington), bahasabahasa utama yang digunakan dalam tahun 1993 adalah seperti berikut. Kedudukan 1 2 3 4 5 6 7 Bahasa Mandarin Inggeris Hindi Sepanyol Russia Arab Bengali Pengguna (juta) 930 463 400 371 291 214 192

a. Apakah jenis data yang diberikan dalam lajur pertama jadual ini?

Unit 3 Pengumpulan dan Pengurusan Data | 23

b. Apakah jenis data yang didapati melalui maklumat bahawa Sally Ride bercakap dalam Bahasa Inggeris? c. Apakah jenis data yang didapati melalui maklumat dalam lajur tiga jadual ini?

2.

Jadual berikut menunjukkan anggaran statistik keluasan tanah dan populasi setiap benua dalam tahun 1992. Benua Keluasan tanah (1000 batu persegi) Asia Afrika Amerika Utara Amerika Selatan Eropah Oceania 10644 11707 9360 6883 1905 3284 Populasi (Juta) 3207 654 436 300 511 28

a. Apakah jenis data yang diberikan oleh keluasan tanah? b. Apakah jenis data yang didapati melalui kenyataaan, Afrika mempunyai keluasan tanah yang terbesar dan kedua dalam jumlah populasi penduduk? c. Apakah jenis data yang didapati melalui maklumat dalam lajur tiga jadual ini? d. Apakah jenis data yang didapati melalui maklumat bahawa Ronaldo dilahirkan di Eropah?

Unit 3 Pengumpulan dan Pengurusan Data | 24

PENGUMPULAN DATA

Apabila kita berbincang berkenaan dengan jenis-jenis data sebelum ini, contoh-contoh yang diberikan tidak mengandungi kuantiti data yang besar. Namun demikian, dalam dunia yang nyata kadang-kadang data yang dikumpulkan boleh berkemungkinan terlalu banyak. Sebagai contohnya, profil pelajar-pelajar universiti di Malaysia, bilangan guru-guru di Malaysia dan lain-lain lagi. Untuk itu, kita perlu menguruskan data yang banyak ini dalam bentuk yang senang difahami. Dalam subtajuk ini, kita akan membincangkan tentang pengumpulan data, iaitu meletakkan data di dalam kumpulan-kumpulan. Pengumpulan data merupakan salah satu cara yang biasa digunakan untuk menguruskan data.

Cuba anda nyatakan kebaikan dan kelemahan dalam pengumpulan data.

Contoh 3.4 Jadual 3.1 menunjukkan kematangan 40 pelaburan jangka pendek dalam hari.

Adalah sukar untuk memahami data jika data dipaparkan seperti dalam Jadual 3.1. Oleh itu, kita perlu mengumpulkan data tersebut mengikut kategori-kategori tertentu atau pun kelas-kelas tertentu untuk memudahkan kita memahami data tersebut.

Unit 3 Pengumpulan dan Pengurusan Data | 25

Langkah pertama ialah menentukan kelasnya. Paling mudah, data dikelaskan mengikut selang atau saiz 10. Oleh kerana nilai data yang terkecil ialah 36 dan yang terbesar ialah 99, pengumpulan data mengikut saiz 10 akan menghasilkan kelas-kelas: 30 39 , 40 49, dan seterusnya hingga 90 99. Kelas-kelas ini dinyatakan dalam lajur pertama Jadual 3.2 di bawah.

Jadual 3.1 Kematangan 40 pelaburan jangka pendek dalam hari

70 62 75 57 51

64 38 56 53 36

99 67 71 47 63

55 70 51 50 66

64 60 99 55 85

89 69 68 81 79

87 78 95 80 83

65 39 86 98 70

Jadual 3.2 Kelas dan bilangan pelaburan Hari matang 30 39 40 49 50 59 60 69 70 79 80 89 90 99 Gundal /// / //// /// //// //// //// // //// // //// Bilangan pelaburan 3 1 8 10 7 7 4 40

Unit 3 Pengumpulan dan Pengurusan Data | 26

Langkah kedua dalam pengumpulan data ialah untuk menentukan berapakah bilangan pelaburan dalam setiap kelas. Untuk itu, kita perlu rujuk kepada Jadual 3.1 dan mengira bilangan pelaburan (data) dengan membuat tanda gundal (lajur 2) dan menulis bilangan pelaburan (lajur 3). Sebagai contoh, pelaburan pertama yang ditunjukkan dalam Jadual 3.1 ialah pelaburan yang matang dalam tempoh 70 hari. Oleh itu, tandakan satu garis pada lajur gundal untuk kelas 70 79. Keputusan untuk tanda gundal adalah seperti yang ditunjukkan dalam Jadual 3.2. Selepas selesai mengisi lajur gundal, kita teruskan dengan menjumlahkan bilangan gundal untuk setiap kelas dan isikan lajur bilangan pelaburan, seperti yang telah dilakukan dalam Jadual 3.2.

Dengan merujuk Jadual 3.2, kita boleh memperolehi maklumat-maklumat yang dikehendaki. Sebagai contoh, kita boleh mengetahui bilangan pelaburang jangka pendek yang tertinggi melibatkan tempoh kematangan 60 69 hari. Jika dibuat perbandingan antara Jadual 3.1 dan 3.2, pengumpulan data memudahkan kita membaca dan memahami data yang disampaikan.

Untuk contoh 3.4, kita menggunakan pendekatan mengumpulkan data dalam kelas. Terdapat tiga tatacara yang penting dalam melaksanakan pengumpulan data dalam kelas iaitu: 1. Bilangan kelas seharusnya antara 5 hingga 20 yang dapat memberikan maklumat ringkas berkaitan tentang data iaitu ciri-ciri yang relevan antara data.

Unit 3 Pengumpulan dan Pengurusan Data | 27

2. Setiap data mesti berada dalam satu kelas sahaja. Sebagai contoh, jika dalam contoh 4, kita menggunakan kelas 30 40, 40 50, 50 60, dan seterusnya, untuk pelaburan yang tempoh matangnya 50 hari, kelas yang manakah akan kita masukkan data ini? Oleh itu, kita harus berhati-hati dalam membentuk sesuatu kelas supaya data dapat dimasukkan dalam satu kelas sahaja. 3. Saiz untuk semua kelas mestilah sama melainkan jika ada keperluan lain. Semua kelas dalam Jadual 3.2 mempunyai saiz yang sama iaitu 10. Kita pilih saiz kelas yang sama sebab ini akan memudahkan kita untuk memaparkan data dalm bentuk graf.

Banyak lagi tatacara yang boleh dimasukkan, namun tiga tatacara ini sudah mencukupi sebagai asas yang kukuh dalam perbincangan kita tentang pengumpulan data.

Cuba anda senaraikan tatacara yang boleh digunapakai dalam pengumpulan data.

KEKERAPAN DAN TABURAN RELATIF KEKERAPAN


Bilangan data yang terkumpul dalam sesuatu kelas dipanggil kekerapan kelas tersebut. Sebagai contoh, dalam Jadual 3.2, kekerapan kelas 50 59 ialah lapan kerana terdapat lapan pelaburan jangka pendek yang matang dalam tempoh 50 59 hari. Satu jadual yang menyenaraikan kelaskelas dan kekerapan-kekerapannya disebut sebagai taburan kekerapan. Lajur pertama dan ketiga

Unit 3 Pengumpulan dan Pengurusan Data | 28

dalam Jadual 3.2 membentuk satu taburan kekerapan untuk tempoh matang pelaburan jangka pendek dalam hari.

Sebagai tambahan kepada kekerapan sesuatu kelas, kita biasanya berminat dengan peratus sesuatu kelas. Kita boleh mendapatkan peratus yang dikehendaki dengan membahagikan kekerapan sesuatu kelas dengan jumlah bilangan data dan mendarabkannya dengan 100. Merujuk kembali kepada Jadual 3.2, kita dapat lihat bahawa peratus pelaburan untuk kelas 50 -59 ialah:

8 = 0.20 atau 20% 40 Maka, 20% daripada pelaburan mempunyai tempoh kematangan antara 50 hingga 59 hari.

Peratus sesuatu kelas, yang dinyatakan dalam bentuk perpuluhan, dikenali sebagai kekerapan relatif sesuatu kelas. Untuk kelas 50 59, kekerapan relatifnya ialah 0.20. Jadual yang menyenaraikan kesemua kelas dan kekerapan relatifnya dikenali sebagai taburan kekerapan relatif. Jadual 3.3 menunjukkan satu taburan kekerapan relatif untuk tempoh kematangan pelaburan jangka pendek dalam hari. Perhatikan bahawa jumlah kekerapan relatif keseluruhannya ialah 1 (100%).

Cuba anda fikirkan kegunaan-kegunaan taburan kekerapan relatif.

Unit 3 Pengumpulan dan Pengurusan Data | 29

Jadual 3.3 taburan kekerapan relatif untuk tempoh kematangan pelaburan jangka pendek Hari matang 30 39 40 49 50 59 60 69 70 79 80 89 90 99 Kekerapan relatif 0.075 (3/40) 0.025 (1/40) 0.200 (8/40) 0.250 (10/40) 0.175 (7/40) 0.175 (7/40) 0.100 (4/40) 1.000

Apabila kita membandingkan dua set data, taburan kekerapan relatif adalah lebih baik daripada taburan kekerapan. Ini ialah kerana kekerapan relatif sentiasa dalam julat antara 0 dan 1 yang memberikan perbandingan yang standard. Dua set data akan mempunyai taburan kekerapan yang serupa jika taburan kekerapan relatif adalah serupa. Namun demikian, dua set data yang mempunyai taburan kekerapan relatif yang serupa akan hanya mempunyai taburan kekerapan yang serupa jika kedua-dua set data mengandungi jumlah bilangan data yang sama.

TERMINOLOGI DATA TERKUMPUL

Untuk memudahkan pengumpulan data dilakukan, kita mesti membiasakan diri dan memahami terma-terma yang digunakan. Kita sudah pun membincangkan beberapa terma yang digunakan.

Unit 3 Pengumpulan dan Pengurusan Data | 30

Untuk memperkenalkan terma-terma yang lain, kita rujuk kembali kepada contoh 3.4 (data tentang tempoh matang pelaburan jangka pendek). Pertimbangkan, kelas 50 59. Tempoh kematangan pelaburan paling pendek yang boleh dimasukkan dalam kelas ini ialah 50. Nilai ini (50) dikenali sebagai had bawah kelas kelas ini. Manakala, tempoh kematangan yang paling tinggi yang boleh dimasukkan dalam kelas ini ialah 59. Nilai ini (59) disebut sebagai had atas kelas kelas ini.

Titik tengah kelas 50 59 ialah (50 + 59)/2 = 54.5. Ini dikenali sebagai tanda kelas untuk kelas 50 59. Tanda kelas ialah satu nilai yang mewakili suatu kelas dan akan digunakan dalam graf serta penghitungan berbentuk deskriptif.

Saiz kelas 50 59 boleh didapati melalui beza antara had bawah kelas yang sedia ada (50) dan had bawah kelas kemudiannya (60) iaitu 10.

Untuk maklumat lebih lanjut tentang data terkumpul, boleh layari laman sesawang berikut: http://www.wyzant.com/Help/Math/Statistics_and_Probability/Introduction/Data.a spx

Unit 3 Pengumpulan dan Pengurusan Data | 31

Berikut merupakan terminologi data terkumpul.

Kelas Kekerapan Taburan kekerapan Kekerapan relatif Taburan kekerapan relatif Had bawah kelas Had atas kelas Tanda kelas Saiz kelas

: : : : : : : : :

Kategori untuk data terkumpul. Bilangan data dalam satu kelas. Satu jadual yang mengandungi kelas-kelas dan kekerapan-kekerapannya. Nisbah kekerapan sesuatu kelas dengan jumlah bilangan data. Satu jadual yang mengandungi kelas-kelas dan kekerapan relatifnya. Data yang paling kecil yang boleh dimasukkan dalam kelas tersebut. Data yang paling besar yang boleh dimasukkan dalam kelas tersebut. Titik tengah suatu kelas. Beza antara had bawah kelas yang sedia ada dan had bawah kelas kemudiannya.

Satu jadual yang mengandungi kelas, kekerapan, kekerapan relatif dan tanda kelas untuk satu set data dipanggil jadual data terkumpul. Jadual 3.4 menunjukkan satu jadual data terkumpul untuk tempoh matang pelaburan jangka pendek.

Unit 3 Pengumpulan dan Pengurusan Data | 32

Jadual 3.4 Jadual data terkumpul untuk tempoh matang pelaburan jangka pendek Tempoh matang 30 39 40 49 50 59 60 69 70 79 80 89 90 99 Kekerapan (Bilangan pelaburan) 3 1 8 10 7 7 4 Kekerapan relatif 0.075 0.025 0.200 0.250 0.175 0.175 0.100 Tanda kelas 34.5 44.5 54.5 64.5 74.5 84.5 94.5

40

1.000

Contoh 3.5 Seorang doktor yang menguji tahap kolesterol para remaja telah mendapati ada di antara mereka yang mempunyai tahap kolesterol melebihi 200 mg per 100mL. Bacaan 20 orang remaja yang mempunyai tahap kolesterol yang tinggi ditunjukkan dalam jadual di bawah. Bina satu jadual data terkumpul. Guna saiz kelas, 5 dan mula pada 195.

Unit 3 Pengumpulan dan Pengurusan Data | 33

210 217 208 215 202

209 207 210 221 218

212 210 210 213 200

208 203 199 218 214

Penyelesaian: Oleh kerana kita akan menggunakan saiz kelas, 5 dan bermula pada 195, maka kelas yang pertama ialah 195 199. Jadual 3.4 menunjukkan kelas dan kekerapan data untuk tahap kolesterol. Jadual 3.5 Kelas dan kekerapan tahap kolesterol pelajar Tahap kolesterol 195 199 200 204 205 209 210 214 215 219 220 224 Gundal / /// //// //// // //// / Kekerapan 1 3 4 7 4 1

Daripada Jadual 3.5, kita boleh membina jadual data terkumpul seperti dalam Jadual 3.6.

Unit 3 Pengumpulan dan Pengurusan Data | 34

Jadual 3.6 Jadual data terkumpul untuk data tahap kolesterol Tahap Kolesterol 195 199 200 204 205 209 210 214 215 219 220 224 Kekerapan 1 3 4 7 4 1 20 Kekerapan relatif 0.05 0.15 0.20 0.35 0.20 0.05 1.00 Tanda kelas 197 202 207 212 217 222

Untuk mengilustrasi nilai yang didapati dalam lajur 3 dan lajur 4 dalam Jadual 3.6, kita pertimbangkan kelas 210 214. Kita ada Kekerapan relatif = 7 = 0.35 20 dan tanda kelas = 210 + 214 = 212 2

Unit 3 Pengumpulan dan Pengurusan Data | 35

Latihan Formatif 3.2

1. Satu syarikat pengusaha minuman ringan yang menjual 1 liter botol air soda mendapati bahawa isi kandungan air soda dalam botol-botol yang dikeluarkan adalah tidak sama. Tiga puluh botol air soda telah dipilih secara rawak. Isi kandungan, dalam mililiter, botol-botl tersebut adalah seperti yang ditunjukkan. 1025 990 986 989 1060 996 977 959 914 1001 1030 1014 1018 957 1010 984 991 946 975 977

1031 964 988 974 999 995 1028 1017 997 987

Bina satu jadual data terkumpul untuk data minuman ringan ini. Gunakan saiz kelas yang sama dan mulakan dengan kelas 910 929.

2. Satu kajian telah dijalankan untuk mengumpul maklumat berkaitan dengan umur seseorang dengan penyakit diabetes. Data berikut merupakan umur 35 orang yang menghidap penyakit kencing manis.

Unit 3 Pengumpulan dan Pengurusan Data | 36

48 61 54 64 10

41 38 23 45 60

57 48 47 53 83

83 79 56 82 76

41 75 79 68 21

55 77 68 38 65

59 7 61 70 47

Bina satu jadual data terkumpul untuk data umur tersebut. Gunakan saiz kelas yang sama dan mulakan dengan kelas 0 9.

DATA TERKUMPUL UNTUK NILAI TUNGGAL

Setakat ini, perbincangan kita tertumpu kepada pengumpulan data yang menggunakan selang kelas untuk mewakili nilai-nilai tertentu. Sebagai contoh, Jadual 3.6, setiap kelas tahap kolesterol mewakili lima tahap kolesterol yang mungkin. Kelas yang pertama, 195 199 mewakili tahap-tahap 195, 196, 197, 198 dan 199; kelas yang kedua, 200 204 mewakili tahap-tahap 200, 201, 202, 203 dan 204; dan seterusnya.

Namun yang demikian, terdapat juga kes-kes yang mana kelas-kelas hanya diwakili oleh satu nilai tunggal sahaja. Ini selalu terjadi kepada data diskret. Pertimbangkan Contoh 3.6.

Unit 3 Pengumpulan dan Pengurusan Data | 37

Contoh 3.6

Satu kajian telah dijalankan untuk mengumpul maklumat tentang bilangan anak dalam sesebuah keluarga yang masih bersekolah di Bukit Bangsar. Jadual 3.7 menunjukkan bilangan anak yang bersekolah dalam setiap keluarga daripada 30 buah keluarga yang dipilih. Jadual 3.7 Bilangan anak yang bersekolah 0 2 0 4 0 3 2 0 2 2 0 0 1 1 0 0 1 2 0 1 3 2 4 1 3 0 1 0 0 2

a. Kumpulkan data tersebut menggunakan kelas-kelas yang mewakili nilai tunggal. b. Kenal pasti had-had kelas dan tanda kelas. c. Bina satu jadual data terkumpul.

Penyelesaian: a. Dengan menggundalkan data yang terdapat dalam Jadual 3.7, kita akan dapat kekerapan seperti dalam lajur dua Jadual 3.8. Dengan membahagikan kekerapan dengan jumlah bilangan data, 30, kita akan dapat kekerapan relatif seperti dalam lajur tiga.

Unit 3 Pengumpulan dan Pengurusan Data | 38

b. Jadual 3.8 Taburan kekerapan dan kekerapan relatif bilangan anak yang bersekolah Bilangan anak yang bersekolah 0 1 2 3 4 Kekerapan 12 6 7 3 2 30 Kekerapan relatif 0.400 0.200 0.233 0.100 0.067 1.000

b. Untuk kenal pasti had-had kelas, kita pertimbangkan kelas 3 (tiga orang anak yang bersekolah). Kita dapati bahawa: Had bawah kelas = 3 (nilai yang terkecil yang boleh dimasukkan ke dalam kelas) Had atas kelas = 3 (nilai yang terbesar yang boleh dimasukkan ke dalam kelas) dan Tanda kelas = 3 + 3 = 3 (titik tengah kelas) 2

Kesimpulannya, untuk kelas 3, had bawah kelas, had atas kelas dan tanda kelas, semuanya bersamaan dengan 3. Ini adalah benar untuk semua kelas.

Unit 3 Pengumpulan dan Pengurusan Data | 39

c. Untuk membina satu jadual data terkumpul, kita cuma perlu menambah satu lajur lagi iaitu lajur untuk tanda kelas dalam Jadual 3.8. Namun demikian, dalam bahagian (b), kita dapati bahawa tanda kelas untuk setiap kelas adalah bersamaan dengan kelas masing-masing. Oleh itu, kita TIDAK perlu untuk menambahkan lajur tanda kelas kerana ia akan bersamaan dengan lajur pertama. Dengan kata lain, Jadual 3.8 ialah jadual data terkumpul untuk bilangan anak yang bersekolah.

Cuba fikirkan mengapa kita tidak menggunakan selang kelas untuk nilai tunggal.

Latihan Formatif 3.3

1. Bancian telah dijalankan di seluruh negara untuk mengenal pasti bilangan ahli dalam sebuah keluarga. Berikut adalah data bilangan ahli dalam sebuah keluarga untuk 40 keluarga. 2 1 7 6 2 5 4 1 5 1 2 4 2 2 3 1 2 2 5 3 1 1 3 1 2 2 4 4 3 2 3 3 2 2 3 4 3 2 5 3

Unit 3 Pengumpulan dan Pengurusan Data | 40

Bina satu jadual data terkumpul untuk bilangan ahli dalam sebuah keluarga menggunakan kelas-kelas nilai tunggal. 2. Seorang penjual kereta telah mencatatkan bilangan buah kereta yang dijual setiap minggu. Bilangan buah kereta yang dijual setiap minggu pada tahun lepas adalah seperti berikut.

1 3 5 2

0 6 1 3

3 4 0 0

3 3 2 4

1 0 5 4

0 2 3 1

2 2 1 0

1 1 3 1

4 1 1 1

0 2 1 3

4 2 1 2

1 2 1 5

2 3 2 2

Bina satu jadual data terkumpul untuk bilangan buah kereta yang dijual setiap minggu menggunakan kelas-kelas nilai tunggal.

DATA TERKUMPUL UNTUK DATA KUALITATIF

Walaupun konsep had bawah dan had atas kelas serta tanda kelas boleh diaplikasikan ke atas data kuantitatif, namun demikian konsep ini tidak bersesuaian untuk data kualitatif. Sebagai contoh, data yang mengkategorikan orang sebagai lelaki atau perempuan, kelas-kelas yang terlibat ialah lelaki atau perempuan. Untuk kelas kualitatif begini, had kelas dan tanda kelas tidak membawa sebarang makna. Apa yang boleh kita lakukan ialah mendapatkan kekerapan dan kekerapan relatif untuk data kualitatif. Pertimbangkan contoh 3.7.

Unit 3 Pengumpulan dan Pengurusan Data | 41

Contoh 3.7 Seorang guru meminta murid-muridnya memilih sama ada rumah Biru (B), Merah (M), atau Kuning (K) yang akan muncul johan keseluruhan untuk sukan tahunan tahun ini? Respon murid-muridnya adalah seperti yang dipaparkan dalam jadual di bawah. Tentukan taburan kekerapan dan kekerapan relatif untuk data tersebut. B B B B K M K M K M K M K B B M B B B M M K M B M M K M M M M M K K M M B M B B

Penyelesaian: Kelas-kelas untuk data terkumpul yang akan kita gunakan ialah Biru, Merah dan Kuning. Taburan kekerapan dan kekerapan relatif yang akan kita peroleh ialah seperti jadual di bawah. Rumah sukan Biru Merah Kuning Kekerapan 13 18 9 40 Kekerapan relatif 0.325 0.450 0.225 1.000

Unit 3 Pengumpulan dan Pengurusan Data | 42

Dengan membahagikan setiap kekerapan dalam lajur dua dengan jumlah bilangan pelajar, kita akan peroleh kekerapan relatif.

Cuba fikirkan apakah perbezaan taburan kekerapan nilai tunggal dan taburan kekerapan data kualitatif.

Latihan Formatif 3.4

1. Negara-negara yang menjuarai kejohanan bola sepak negara-negara Eropah sejak ia dimulakan adalah seperti senarai berikut. Tahun 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 2000 2004 2008 2012 Juara USSR Sepanyol Itali Jerman Czechoslovakia Jerman Perancis Belanda Denmark Jerman Perancis Greece Sepanyol Sepanyol

Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.

Unit 3 Pengumpulan dan Pengurusan Data | 43

2. Ujian darah untuk mengenalpasti jenis darah setiap murid telah dijalankan dalam sebuah sekolah menengah. Diidapati bahawa murid-murid sekolah tersebut mempunyai darah jenis kumpulan A, B, AB, dan O. Jadual di bawah menunjukkan kumpulan darah 30 orang murid yang dipilh secara rawak. A B O A B A B O B A O B AB O O O AB AB O B AB A AB AB AB B A AB O AB

Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.

RUMUSAN
Secara keseluruhannya, kita telah didedahkan dengan apa itu pembolehubah kuantitatif dan kualitatif. Apa yang lebih penting, kita sudah pun mengenali dengan lebih mendalam tentang data kuantitatif dan data kualitatif. Diharapkan penerangan dan contoh-contoh dalam unit ini telah dapat membantu kita untuk memahami apa itu data diskret dan data selanjar. Secara ringkasnya, data diskret ialah data yang cuma boleh mengambil nilai tetap atau nilai tepat sahaja (dalam bahasa mudah: yang boleh dibilang dan yang ambil nilai nombor bulat). Data selanjar pula ialah data yang hanya boleh diberi nilai dalam suatu julat dan tidak boleh mengambil satu nilai tunggal atau satu

Unit 3 Pengumpulan dan Pengurusan Data | 44

nilai tepat (dalam bahasa mudah: boleh ambil nilai perpuluhan). Disamping itu, kita juga ada data kualitatif yang mana data jenis ini merupakan angka-angka atau skor-skor yang tidak mempunyai nilai kuantiti (contohnya: jantina, warna mata, dan lain-lain).

Perbincangan kita juga menjurus kepada tatacara pengumpulan data yang melibatkan data terkumpul untuk skor yang biasa (yang melibatkan selang kelas), nilai tunggal dan kualitatif. Kita telah didedahkan dengan dua jenis taburan: taburan kekerapan dan taburan kekerapan relatif. Diharapkan agar kita telah berjaya menguasai unit ini dengan jayanya. Unit yang seterusnya akan membincangkan tentang miskonsepsi dalam pengumpulan dan pengurusan data.

KATA KUNCI

Pembolehubah kuantitatif, pembolehubah kualitatif, pembolehubah diskret, pembolehubah selanjar, data kuantitatif, data kualitatif, data diskret, data selanjar, taburan kekerapan, taburan kekerapan relatif.

Unit 3 Pengumpulan dan Pengurusan Data | 45

Latihan Sumatif
1. Berikan satu sebab mengapa mengklasifikasi data adalah penting? (Ia boleh membantu dalam memilih kaedah statistik yang betul).

2. Berikut merupakan lima sungai yang terpanjang dalam dunia. Kedudukan 1 2 3 4 5 Sungai Nil Amazon Yangtze Mississipi Yenisei-Angara-Selanga Panjang (km) 6650 6400 6300 6275 5539

a. Apakah jenis data yang diberikan dalam lajur pertama jadual di atas? (data kuantitatif: data diskret, pembolehubah kedudukan) b. Apakah jenis data yang diperoleh daripada maklumat Sungai Nil ialah sungai yang terpanjang dalam dunia.? (Data kuantitatif: data diskret, pembolehubah kedudukan) c. Apakah jenis data yang diberikan dalam lajur ketiga dalam jadual di atas? (Data kuantitatif: data selanjar, pembolehubah panjang)

Unit 3 Pengumpulan dan Pengurusan Data | 46

3. Satu kajian telah dijalankan ke atas pelancong-pelancong dari luar negara tentang tempoh tinggal semasa melancong ke Malaysia. Jadual berikut menunjukkan data tempoh tinggal 36 orang pelancong yang dipilih secara rawak, dalam hari. 41 5 3 21 3 1 16 31 32 44 13 11 6 20 2 1 15 14 21 27 48 56 10 12 1 21

17 10 8 5 18 12 12 3

64 10

Bina satu jadual data terkumpul untuk data tempoh tinggal tersebut. Gunakan saiz kelas yang sama dan mulakan dengan kelas 1 7.

4. Satu ujian kecerdasan telah dijalankan ke atas 50 orang kanak-kanak Tahun Satu di sebuah sekolah. Berikut merupakan data skor yang diperoleh kanak-kanak tersebut. 100 104 89 95 92 92 83 123 105 99 96 91 81 73 110 108 70 93 119 94 116 86 88 98

115 97

78 108 127 63 112 102 76 105 90

91 114

84 101 121 94 124 96 107

117 106 126 81 109 116

Unit 3 Pengumpulan dan Pengurusan Data | 47

Bina satu jadual data terkumpul untuk data skor tersebut. Gunakan saiz kelas yang bersesuaian.

5. 25 orang murid Tahun Lima telah diminta untuk menjawab satu kuiz yang mengandungi lapan soalan tentang tajuk Pecahan. Bilangan soalan yang gagal dijawab dengan betul oleh setiap murid adalah seperti yang ditunjukkan. 3 1 0 0 2 4 1 5 3 0 2 6 1 4 3 3 1 2 0 1 1 2 1 3 1

Bina satu jadual data terkumpul untuk bilangan soalan yang gagal dijawab oleh murid-murid Tahun Lima menggunakan kelas-kelas nilai tunggal.

Unit 3 Pengumpulan dan Pengurusan Data | 48

6. Sebuah bank mempunyai 80 orang pekerja. Ketidakhadiran setiap pekerja, dalam hari yang dicatatkan tahun lalu adalah seperti berikut.

2 2 5 2 0

3 2 2 4 7

6 4 5 4 5

2 5 0 3 5

6 4 5 3 7

5 0 6 4 6

5 2 5 0 1

2 1 2 5 5

4 6 4 6 3

7 3 2 3 3

5 5 6 5 4

3 3 2 5 7

6 6 4 2 7

4 6 3 4 2

4 4 5 4 5

4 7 4 2 5

Bina satu jadual data terkumpul untuk data ketidakhadiran pekerja, dalam hari menggunakan kelas-kelas nilai tunggal.

7. Tiga unit beruniform telah ditubuhkan dalam sebuah sekolah rendah: Pengakap Kanakkanak (PK), Persatuan Bulan Sabit Merah (PBSM), Kadet Remaja Sekolah (KRS). Setiap murid adalah diwajibkan untuk mengganggotai salah satu daripada unit beruniform tersebut. Jadual di bawah menunjukkan keanggotaan unit beruniform 40 orang murid yang dipilih secara rawak.

Unit 3 Pengumpulan dan Pengurusan Data | 49

PK PK PK PK KRS

PBSM KRS PBSM KRS PBSM

KRS PBSM KRS PK PK

PBSM PK PK PK PBSM

PBSM KRS PBSM PK PBSM

PBSM KRS PBSM PBSM PBSM

PBSM PBSM KRS KRS PBSM

PBSM PK PBSM PK PK

Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.

8. Pada pengajian semester yang lepas, pelajar-pelajar Program Pendidikan Matematik telah memilih untuk mengikuti salah satu daripada kursus-kursus berikut: Kalkulus Permulaan (K), Pengenalan Statistik (S) dan Linear Algebra (A). Berikut merupakan pilihan kursus 40 orang pelajar yang dipilih secara rawak.

A S S A K

K S A A A

K A S A S

A K A K S

S A K S K

A A S A K

S K S A S

K K K K S

Bina jadual taburan kekerapan dan kekerapan relatif bagi data dalam jadual di atas.

Unit 3 Pengumpulan dan Pengurusan Data | 50

Rujukan

Dunn, S.D. (2001). Statistic and data analysis for the behavioral sciences. New York: McGraw-Hill. Haylock, D. (2010). Mathematics Explained For Primary Teachers (4th Ed.). London: Sage Publications Howitt, D., & Cramer, D. (2000). An introduction to statistics in psychology: A complete guide for students. (2nd Ed.). Harlow, England: Prentice Hall. Iran Herman.(2004). Statistik dan analisis data sains sosial. Alor Star: Percetakan Ustaras Sdn.Bhd. Kennedy, L. M, & Tipps, S. (2011).Guiding Childrens Learning of Mathematics.(12th Ed.). Bermont: Wadsworth.

Weiss, N. A. (2005). Introductory Statistics (7th Ed.). Boston: Pearson & Addison Wesley. Utts, J. M., & Heckard, R. F.(2004). Mind on Statistics (2nd Ed.). Belmont, CA: Thomson Learning.
http://www.epcae.org/uploads/documents/Central_Tendency_pck_SEP20.pdf

Unit 3 Pengumpulan dan Pengurusan Data | 51

Jawapan
Latihan Formatif 3.1 1. (a) data kuantitatif: data diskret; pembolehubah kedudukan (b) data kualitatif; pembolehubah bahasa (c) data kuantitatif: data diskret; pembolehubah pengguna 2. (a) data kuantitatif: data selanjar; pembolehubah keluasan tanah (b) data kuantitatif: data diskret; pembolehubah pangkat/kedudukan keluasan tanah dan populasi (c) data kuatitaif: data diskret; pembolehubah populasi (d) data kualitatif; pembolehubah benua dia dilahirkan

Latihan Formatif 3.2 1. Kandungan 910 929 930 949 950 969 970 989 990 1009 1010 1029 1030 1049 1050 - 1069 Kekerapan 1 1 3 9 7 6 2 1 30 Kekerapan relatif 0.033 0.033 0.100 0.300 0.233 0.200 0.067 0.033 0.999 Tanda kelas 919.5 939.5 959.5 979.5 999.5 1019.5 1039.5 1059.5

Unit 3 Pengumpulan dan Pengurusan Data | 52

2. Umur 09 10 19 20 29 30 39 40 49 50 59 60 69 70 79 80 89 Kekerapan 1 1 2 2 7 6 7 6 3 35 Kekerapan relatif 0.029 0.029 0.057 0.057 0.200 0.171 0.200 0.171 0.086 1.000 Tanda kelas 4.5 14.5 24.5 34.5 44.5 54.5 64.5 74.5 84.5

Latihan Formatif 3.3 1. Bilangan ahli 1 2 3 4 5 6 7 Kekerapan 7 13 9 5 4 1 1 40 Kekerapan relatif 0.175 0.325 0.225 0.125 0.100 0.025 0.025 1.000

Unit 3 Pengumpulan dan Pengurusan Data | 53

2. Bilangan buah kereta 0 1 2 3 4 5 6 Kekerapan 7 15 12 9 5 3 1 52 Kekerapan relatif 0.135 0.288 0.231 0.173 0.096 0.058 0.019 1.000

Latihan Formatif 3.4 1. Juara Sepanyol Jerman Itali Perancis Denmark Belanda Greece USSR Czechoslovakia Kekerapan 3 3 1 2 1 1 1 1 1 14 Kekerapan relatif 0.214 0.214 0.071 0.143 0.071 0.071 0.071 0.071 0.071 0.997

Unit 3 Pengumpulan dan Pengurusan Data | 54

2. Kumpulan darah A B O AB Kekerapan 6 7 8 9 30 Kekerapan relatif 0.200 0.233 0.267 0.300 1.000

Unit 3 Pengumpulan dan Pengurusan Data | 55

Latihan Sumatif 1. Mengklasifikasi data adalah penting kerana ia boleh membantu dalam memilih kaedah statistik yang betul.

2. (a) data kuantitatif: data diskret; pembolehubah kedudukan (b) data kuantitatif: data diskret; pembolehubah kedudukan (c) data kuantitatif: data selanjar; pembolehubah panjang

3. Tempoh tinggal (Hari) 17 8 14 15 21 22 28 29 35 36 42 43 49 50 56 57 64 10 10 8 1 2 1 2 1 1 36 0.278 0.278 0.222 0.028 0.056 0.028 0.056 0.028 0.028 1.000 4 11 18 25 32 39 46 53 60 Kekerapan Kekerapan relatif Tanda kelas

Unit 3 Pengumpulan dan Pengurusan Data | 56

4. Skor 60 69 70 79 80 89 90 99 100 109 110 119 120 - 129 Kekerapan 1 4 7 14 11 8 5 50 Kekerapan relatif 0.020 0.080 0.140 0.280 0.220 0.160 0.100 1.000 Tanda kelas 64.5 74.5 84.5 94.5 104.5 114.5 124.5

5. Bilangan soalan yang gagal dijawab 0 1 2 3 4 5 6 Kekerapan 4 8 4 5 2 1 1 25 Kekerapan relatif 0.160 0.320 0.160 0.200 0.080 0.040 0.040 1.000

Unit 3 Pengumpulan dan Pengurusan Data | 57

6. Ketidakhadiran bekerja (Hari) 0 1 2 3 4 5 6 7 Kekerapan 4 2 14 10 16 18 10 6 80 Kekerapan relatif 0.050 0.025 0.175 0.125 0.200 0.225 0.125 0.075 1.000

7. Unit Beruniform Pengakap Kanak-kanak Persatuan Bulan Sabit Merah Kadet Remaja Sekolah Kekerapan 13 18 9 40 Kekerapan relatif 0.325 0.450 0.225 1.000

8. Kursus Kalkulus Permulaan Pengenalan Statistik Linear Algebra Kekerapan 13 13 14 40 Kekerapan relatif 0.325 0.325 0.350 1.000