Professional Documents
Culture Documents
JANUARI 2017
HMEF5113
A) Generate the frequency tables and bar charts to show the distribution by
Construct1_Schools and Construct1_Type_of_School. Describe the frequency
distribution output.
Jadual Kekerapan
Carta Bar
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH
Berdasarkan carta bar di atas, Sekolah D mencatatkan kekerapan terendah iaitu 12 manakala
Sekolah B mencatatkan kekerapan tertinggi iaitu 48. Sekolah A dan Sekolah C masing-
masing mencatatkan kekerapan sebanyak 31 dan 29.
B) What is random sampling? Using the HMEF5113 Dataset for Assignments 1 & 2.sav,
create a random sample comprising 30 cases or respondents from the 120 teachers
who participated in the survey. Run the frequency procedure to show the output using
the Construct1_Schools variable.
Teknik pengambilan sampel secara rambang adalah kaedah yang digunakan untuk
mengelakkan bias dalam kajian. Persampelan rawak adalah jenis pensampelan asas, kerana ia
boleh menjadi satu komponen kaedah persampelan yang lebih kompleks lagi. Prinsip
persampelan rawak ialah setiap sampel mempunyai kebarangkalian dipilih yang sama.
Gambar di atas menunjukkan sampel yang telah ditapis secara rawak menggunakan aplikasi
SPSS.
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH
Jadual di atas menunjukkan kekerapan 30 buah sekolah yang menyertai kajian ini. Sekolah A
menunjukkan nilai kekerapan 11 iaitu 36.7 %, Sekolah B mempunyai nilai kekerapan 12
bersamaan dengan 40%. Sekolah C mempunyai 4 kekerapan dengan 13.3 % dan Sekolah D
mempunyai nilai kekerapan sebanyak 3 iaitu 10%.
C) Using the Construct1_Age variable, create an ordinal-type variable with the following
age categories: i. 20 years and below, ii. 21 to 40 years, iii. 41 to 60 years, and 4. 61
years and above. Show a frequency distribution table of the newly created ordinal-
type Age Category variable. Describe the frequency distribution table.
Statistics
Age New
Valid 120
N
Missing 0
Mean 2.54
Std. Deviation .620
Age New
Berdasarkan jadual di atas, nilai min bagi data di atas ialah 2.54. Nilai sisihan piawai bagi
data di atas ialah 0.620. Jadual di atas menunjukkan kekerapan julat umur responden. Julat
tertinggi ialah umur di antara 41 hingga 60 tahun iaitu sebanyak 58 orang membawa
peratusan sebanyak 48.3% . Julat terendah ialah 20 tahun ke bawah iaitu sebanyak 3 orang
dengan 2.5%, Bagi julat umut 21 hingga 40 tahun mencatatkan sebanyak 54 orang iaitu 45%
manakala 61 tahun ke atas mencatat jumlah sebanyak 5 orang iaitu 4.2%. Jumlah responden
kesemuanya adalah sebanyak 120 responden.
Statistics
Age of teachers
Valid 120
N
Missing 0
Mean 41.96
Median 44.00
Mode 47
Std. Deviation 11.903
Variance 141.671
Range 47
Jadual di atas menunjukkan data julat umur responden. Berdasarkan jadual di atas, nilai min
ialah 41.96. Nilai median ialah 44.00 dan mod mencatatkan nilai 47. Sisihan piawai mencatat
nilai 11.903, manakala nilai Varian ialah 141.671. Nilai julat ialah sebanyak 47.
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH
20 Years 21 to 41 to 60 61 years
and Below 40years years and above
Count 0 17 14 0 31
Count 3 19 24 2 48
Count 0 5 7 0 12
Jadual di atas menunjukkan julat umur responden mengikut sekolah. Bagi Sekolah A, tiada
responden yang berumur 20 tahun ke bawah. Sebanyak 17 responden iaitu 54.8% yang
berumur di antara 21 hingga 40 tahun. Terdapat 14 responden iaitu 45.2% yang berumur 41
hingga 60 tahun dan tiada responden yang berumur 60 tahun ke atas. Bagi sekolah B, terdapat
3 responden iaitu 6.3% yang berumur 20 tahun ke bawah. Sebanyak 19 responden iaitu
39.6% berumur 21 hingga 40 tahun. Sebanyak 24 iaitu 50% responden berumur dari 41
hingga 60 tahun dan 2 orang responden iaitu 4.2% berumur 60 tahun ke atas. Bagi Sekolah C,
tiada responden yang berumur 20 tahun ke bawah. 13 responden iaitu 44.8% tercatat berumur
21-40 tahun. Terdapat 13 responden iaitu 44.8% yang berumur 41 hingga 60 tahun dan 3
responden iaitu 10.3 % yang berumur 60 tahun ke atas. Bagi Sekolah D, tiada responden
yang berumur 20 ke bawah. 5 responden tercatat iaitu 41.7% berumur 21-40 tahun. Terdapat
7 responden iaitu 58.3% yang berumur 41 hingga 60 tahun dan tiada responden yang berumur
60 tahun ke atas.
Descriptives
Median 3.9861
Variance .476
Minimum 2.93
Maximum 5.00
Range 2.07
Median 4.1667
Variance .442
Minimum 2.42
Maximum 5.00
Range 2.58
Median 4.0556
Variance .640
Minimum 2.43
Maximum 5.00
Range 2.57
Median 3.8333
Variance .458
Minimum 2.36
Maximum 4.74
Range 2.38
Jadual di atas menunjukkan tahap motivasi guru. Bagi sekolah A, min bagi tahap motivasi
guru ialah 4.0058. Median mencatatkan nilai 3.9861. Varian pula mencatatkan nilai 0.476
manakala sisihan piawai data motivasi guru ialah 0.68985. Nilai julat mencatat nilai 2.07
manakala nilai Skewness mencatat nilai -0.150 dan kurtosis mencatat nilai -1.253.
Bagi sekolah B, min bagi tahap motivasi guru ialah 4.0874. Median mencatatkan nilai
4.1667. Varian pula mencatatkan nilai 0.442 manakala sisihan piawai data motivasi guru
ialah 0. 66514. Nilai julat mencatat nilai 2.58 manakala nilai Skewness mencatat nilai
-0.609 dan kurtosis mencatat nilai -0.113
Bagi Sekolah C, min bagi tahap motivasi guru ialah 3.8855. Median mencatatkan nilai
4.0556. Varian pula mencatatkan nilai 0.640 manakala sisihan piawai data motivasi guru
ialah 0.79990. Nilai julat mencatat nilai 2.57 manakala nilai Skewness mencatat nilai
-0.345 dan kurtosis mencatat nilai -0.930.
Bagi Sekolah C, min bagi tahap motivasi guru ialah 3.7396. Median mencatatkan nilai
3.8333. Varian pula mencatatkan nilai 0. 458 manakala sisihan piawai data motivasi guru
ialah 0. 67672. Nilai julat mencatat nilai 2.38 manakala nilai Skewness mencatat nilai
-0.683 dan kurtosis mencatat nilai 0.548.
Tests of Normality
Berdasarkan ujian normaliti di atas, distribusi data antara jenis sekolah swasta dan tahap
motivasi guru adalah tidak normal. Ini boleh diperhatikan daripada nilai Sig dalam ujian
Kolmogorov di mana nilainya ialah 0.046. Nilai tersebut adalah kurang daripada nilai 0.05
iaitu nilai piawaian bagi nilai distribusi yang tidak normal.
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH
Descriptives
Median 4.0625
Variance .452
Minimum 2.53
Maximum 5.00
Range 2.47
Median 4.0208
Variance .531
Maximum 5.00
Range 2.64
Berdasarkan jadual di atas, nilai skewness dan kurtosis bagi sekolah swasta ialah masing-
masing -0.487 dan -0.754. Nilai ini menggambarkan bentuk taburan lengkung sesebuah
pembolehubah. Nilai skewness dan kurtosis yang semakin jauh dari nilai 0 menunjukkan
taburan data adalah semakin tidak normal.
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH
3.00 2 . 344
7.00 2 . 5788899
6.00 3 . 000002
16.00 3 . 5556677788888999
20.00 4 . 01111222222333333444
10.00 4 . 5667888889
2.00 5 . 00
Berdasarkan lakaran plot di atas, plot lengkungan tersebut juga sama seperti lengkungan
daripada histogram tadi. Lengkungan ini menunjukkan bentuk yang kurang normal.
Outlier
Berdasarkan plot graf Q-Q di atas, taburan data sepatutnya berada tidak jauh daripada garisan
normal. Terdapat beberapa outliers ataupun data yang ekstrem boleh dilihat pada graf
tersebut. Data ekstrem boleh dilihat pada label anak panah.
G. Describe how you would go about addressing missing values in a dataset when
respondents failed to fill-up their responses.
Terdapat beberapa cara untuk menangani masalah missing value ataupun data yang hilang
dalam analisis statistik. Antara cara penyelesaiannya adalah seperti berikut.
Pada prosedur ini, analisis hanya dilakukan terhadap unit (sebanyak n1 case, baris pada
matriks data n x m) di mana untuk seluruh m variable, nilainya tercatat atau memiliki data
yang lengkap. Sedangkan sebanyak n2 cases yang terdapat data hilang pada variabel-
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH
variabelnya diabaikan, atau dikeluarkan dari analisis. Metode ini cukup memuaskan jika
jumlah missing data tidak terlalu besar, tapi prosedur ini menjadi tidak efisyen jika peratus
data hilang meningkat atau jika data hilang tersebut mengelompok. Hal ini akan
menyebabkan keputusan analisis yang sangat bias.
Imputasi merupakan suatu alternatif yang umum dan fleksibel. Dalam prosedur ini, data
yang hilang diisi dengan menganggar atau menggunakan penduga berasaskan kaitan dengan
data lain. Namun bagaimanapun cara ini tetap menghasilkan bias, dimana nilai yang
dimasukkan masih berbeza dengan nilai sebenarnya dari missing data. Terdapat beberapa
pendekatan untuk imputasi ini,
i. Hot deck imputation, di mana dari unit-unit yang tercatat digantikan terhadap missing
data.
ii. Cold deck imputation, di mana missing value diganti oleh nilai yang konstan.
iii. Mean imputation, di mana nilai yang hilang diganti oleh min dari kelompok sampel
unit yang berkaitan.