Professional Documents
Culture Documents
Generate a frequency count and histogram with normal distribution curve for
Pretest mathematics scores (Variable name: Pretest). Describe the frequency count
and normal distribution curve. [3 marks]
Jadual 1.0: Min dan Sisihan piawaian skor ujian pre matematik
54.84 adalah titik tengah bagi keseluruhan markah pra ujian yang telah dijalankan.
Dengan kata lain, secara purata, purata markah yang diperolehi dalam pra ujian adalah 54.84.
Pengiraan kekerapan menunjukkan bahawa min bagi pra ujian (pre test) adalah 54.84. Sisihan
piawaian (Standard Deviation) bagi pra ujian 12.96. Semua data diperolehi daripada Jadual
1.0 Min dan Sisihan Piawaian Skor Ujian Pre Matematik.
1
b. Generate a frequency count and bar chart to show the distribution of Family
Income classification. Describe the frequency distribution output. [3 marks]
Daripada Jadual 2.0 Min dan Sisihan Piawaian Pendapatan Keluarga, Min bagi
klasifikasi pembahagian pendapatan keluarga (distribution of Family Income classification)
ialah 1.82. Manakala sisihan piawai adalah .804.
2
Rajah 2.0: Carta Klasifikasi Pendapatan Keluarga.
Carta bar di atas menunjukkan dengan jelas perrbandingan klasifikasi responden
berdasarkan pendapatan keluarga. Responden terbanyak datang dari keluarga yang
mempunyai pendapatan yang rendah. Kumpulan responden yang datang dari keluarga
berpendapatan rendah menduduki tempat kedua tertingi dan kumpulan responden yang
berpendapatan tinggi adalah kumpulan responden yang tersedikit. Semua data diperolehi dari
Rajah 2.0: Carta Klasifikasi Pendapatan Keluarga.
3
c. What is random sampling? Using the HMEF5113 Dataset for Assignments 1 &
2.sav, create a random sample comprising 100 cases from the 250 students who
participated in this experimental research. Using this random sample of 100 cases,
run the frequency procedure to show the distribution by Gender. [4 marks]
Daripada 250 responden yang asal, 100 responden telah dipilih secara persampelan
rawak (random sample) untuk melihat data tentang jantina. Setelah responden dipilih secara
rawak, min bagi data yang diperolehi adalah .45 manakala sisihan piawaiannya pula adalah
.500. Data diperolehi dari Jadual 3.0: Min dan Sisihan Piawaian Gender.
Jadual
Melalui data yang diperolehi, daripada 100 responden tersebut 55 orang adalah lelaki
dan terdiri daripada 55% daripada jumlah keseluruhan. 45 orang pula adalah terdiri daripada
perempuan dan merupakan 45% daripada jumlah keseluruhan.
4
d. Using the Posttest variable, create an ordinal-type variable with the following
categories: i. 20 marks and below, ii. 21 to 40 marks, iii. 41 to 60 marks, 4. 61 to 80
marks, and 5. 81 marks and above. Show a frequency distribution table of the newly
created ordinal-type Posttest category variable. Describe the frequency distribution
table. [6 marks]
Jadual 4.0: Min dan Sisihan Piawaian Skor Ujian Pos Matematik
Markah ujian pos terbahagi kepada 5 kategori. Kategori pertama adalah kumpulan
markah di bawah 20 markah. Di dalam ujian pos yang dijalankan, tidak ada responden
yang memperolehi markah dibawah 20 markah.
Kategori ketiga ialah markah diantara 41 hingga 60 markah. Jumlah responden yang
mendapat markah dalam kategori ini adalah 80 orang. dari segi peratusannya adalah 32%.
Kategori keempat adalah markah diantara 61 hingga 80. Kategori ini menunjukkan
kumpulan responden yang teramai iaitu seramai 126 responden. Ianya berjumlah 50.4%
daripada jumlah sebenar.
5
Kategori kelima adalah markah 81 ke atas. Seramai 38 orang responden yang mampu
mendapatkan markah 81 ke atas. Dan kumpulan ini menymbang 15.2% daripada jumlah
keseluruhan.
6
e. Using the Pretest variable of students who participated in the experimental study,
compute the following measures of central tendency: i. Mean, ii. Median, and iii.
Mode and the measures of dispersion comprising i. Range, ii. Variance, and iii.
Standard deviation. Describe the output for measures of central tendency and
measures of dispersion. [5 marks]
Jadual 5.0: Min, Median, Mod dan Sisihan Piawaian Ujian Pre.
Pengiraan penyebaran atau kiraan taburan (measure of dispersion) pula adalah terdiri
daripada sisihan piawaian (standard deviation), varian (variance) dan julat (range). Sisihan
piawaian bagi pra ujian ini adalah 12.960. Varian pula adalah 167.950. Julatnya adalah 65.
7
f. Run a crosstabulation between the Gender variable and the Posttest Category
variable (new variable created under section d. above). Describe the crosstabulation
findings. [4 marks]
Data di atas adalah taburan perbandingan markah yang diperolehi oleh responden
mengikut jantina. Kategori markah 21 hingga 40 markah, daripada 2 orang responden yang
tergolong dalam kumpulan ini adalah lelaki dan selebihnya iaitu berjumlah 4 responden
adalah perempuan. Keseluruhan responden yang mendapat markah sekitar 21-40 markah
adalah 6 orang.
Kategori markah 61 hingga 80 terdiri daripada 70 orang lelaki dan 56 pula adalah
perempuan. Jumlah keseluruhan bagi kategori ini adalah 126 responden.
8
g. Run an exploratory data analysis of the Pretest and Posttest variables. Describe the
exploratory data analysis output. [18 marks]
Jadual 7.0: Analisis Data Skor Ujian Pre dan Skor Ujian Pos Kategori markah 21 -40
9
Jadual 7.1: Analisis Data Skor Ujian Pre dan Skor Ujian Pos Kategori markah 41 -60
Kecondongan graf bagi kategori markah 41 hingga 60 adalah .269. Nilai ini juga
adalah nilai yang hampir dengan nilai 0 dan membawa maksud bahawa kecondongan taburan
adalah normal.
Kurtosis bagi kategori ini adalah .532. ini menandakan bahawa taburan jenis
mesokurtic. Taburan jenis ini mempunyai bentuk graf yang seimbang dan menandakan
bahawa taburan adalah normal.
Jadual 7.2: Analisis Data Skor Ujian Pre dan Skor Ujian Pos Kategori markah 61-80
Bagi kategori markah 61 hingga 80 pula, kecondongan graf adalah -.176. Ini
menunjukkan bahawa taburan data adalah tidak normal ataupun non-simetrikal (non
Symmetrical).
Nilai kurtosis bagi kategori markah ini adalah 0.39. Ini merupakan indikasi yang
menandakan taburarn data yang diperolehi adalah normal.
10
Jadual 7.3: Analisis Data Skor Ujian Pre dan Skor Ujian Pos Kategori markah >81
Kecondongan graf bagi kumpulan markah lebih 80 markah adalah .727. Ini berrmaksud
kecondongan graf adalah normal.
Nilai kurtosis bagi kumpulan markah ini adalah .590. Ianya adalah mesokurtic yang
membawa maksud bahawa taburan data adalah normal.
11
h. Describe how you would go about addressing missing values in a dataset when
respondents failed to fill-up their responses. [3 marks]
Terdapat beberapa cara bagaimana untuk menangani masalah data yang hilang.
Pertama adalah melihat borang soal selidik secara satu persatu dan menilai setiap jawapan
responden. Borang soal selidik yang 25% soalannya tidak dijawap, perlu digugurkan agar
tidak mengganggu data yang ingin diperolehi.
Kedua ialah dengan menggunakan komputer yang menggunakan perisian seperti SPSS
dan perisian lain-lain. Kita perlu mencari nilai data yang hilang tersebut dalam paparan data
(Data View). Kemudian kita perlu mengenalpasti data yang 25% tidak lengkap atau tidak
dijawap. Setelah proses mengenalpasti data yang tidak lengkap itu, data tersebut perlu
dipadam.
Statistik parametrik (Parametric statistic) dijalankan pada data sampel yang terabur secara
normal. Statistik parametrik digunakan untuk data yang boleh diinferensikan kepada populasi kerana
kedua-dua populasi dan sample mempunyai ciri yang sama.
Statistik bukan parametrik (Non parametric statistic) dijalankan pada data sampel yang tidak
terabur secara normal. Skala kategori (skala ordinal dan norminal) tidak boleh menghasilkan graf
normal. Oleh itu, hanya statistik bukan parametrik yang sesuai digunakan.
12