You are on page 1of 13

LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

FAKULTI PENDIDIKAN DAN BAHASA

JANUARI 2017

HMEF5113

STATISTICS FOR EDUCATIONAL RESEARCH

NO. MATRIKULASI : CGS01497606


NO. KAD PENGNEALAN : 900125-12-5303
NO. TELEFON : 0126340603
E-MEL : frekeysh@gmail.com

PUSAT PEMBELAJARAN : LAHAD DATU LEARNING CENTRE


LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

A) Generate the frequency tables and bar charts to show the distribution by
Construct1_Schools and Construct1_Type_of_School. Describe the frequency
distribution output.

Jadual Kekerapan

Schools which participated in the survey

Frequency Percent Valid Percent Cumulative


Percent

School A 31 25.8 25.8 25.8

School B 48 40.0 40.0 65.8

Valid School C 29 24.2 24.2 90.0

School D 12 10.0 10.0 100.0

Total 120 100.0 100.0

Berdasarkan jadual kekerapan, Sekolah B mencatatkan kekerapan tertinggi iaitu sebanyak 48


dengan peratusan 40% manakala Sekolah D mencatatkan kekerapan terendah iaitu sebanyak
12 dengan peratusan 10%. Sekolah A dan Sekolah C masing-masing mencatatkan kekerapan
sebanyak 31 dan 29.

Carta Bar
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

Berdasarkan carta bar di atas, Sekolah D mencatatkan kekerapan terendah iaitu 12 manakala
Sekolah B mencatatkan kekerapan tertinggi iaitu 48. Sekolah A dan Sekolah C masing-
masing mencatatkan kekerapan sebanyak 31 dan 29.

B) What is random sampling? Using the HMEF5113 Dataset for Assignments 1 & 2.sav,
create a random sample comprising 30 cases or respondents from the 120 teachers
who participated in the survey. Run the frequency procedure to show the output using
the Construct1_Schools variable.

Teknik pengambilan sampel secara rambang adalah kaedah yang digunakan untuk
mengelakkan bias dalam kajian. Persampelan rawak adalah jenis pensampelan asas, kerana ia
boleh menjadi satu komponen kaedah persampelan yang lebih kompleks lagi. Prinsip
persampelan rawak ialah setiap sampel mempunyai kebarangkalian dipilih yang sama.

Gambar di atas menunjukkan sampel yang telah ditapis secara rawak menggunakan aplikasi
SPSS.
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

Schools which participated in the survey

Frequency Percent Valid Percent Cumulative


Percent

School A 11 36.7 36.7 36.7

School B 12 40.0 40.0 76.7

Valid School C 4 13.3 13.3 90.0

School D 3 10.0 10.0 100.0

Total 30 100.0 100.0

Jadual di atas menunjukkan kekerapan 30 buah sekolah yang menyertai kajian ini. Sekolah A
menunjukkan nilai kekerapan 11 iaitu 36.7 %, Sekolah B mempunyai nilai kekerapan 12
bersamaan dengan 40%. Sekolah C mempunyai 4 kekerapan dengan 13.3 % dan Sekolah D
mempunyai nilai kekerapan sebanyak 3 iaitu 10%.

C) Using the Construct1_Age variable, create an ordinal-type variable with the following
age categories: i. 20 years and below, ii. 21 to 40 years, iii. 41 to 60 years, and 4. 61
years and above. Show a frequency distribution table of the newly created ordinal-
type Age Category variable. Describe the frequency distribution table.

Statistics
Age New

Valid 120
N
Missing 0
Mean 2.54
Std. Deviation .620

Age New

Frequency Percent Valid Percent Cumulative


Percent

20 Years and Below 3 2.5 2.5 2.5

21 to 40years 54 45.0 45.0 47.5

Valid 41 to 60 years 58 48.3 48.3 95.8

61 years and above 5 4.2 4.2 100.0

Total 120 100.0 100.0


LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

Berdasarkan jadual di atas, nilai min bagi data di atas ialah 2.54. Nilai sisihan piawai bagi
data di atas ialah 0.620. Jadual di atas menunjukkan kekerapan julat umur responden. Julat
tertinggi ialah umur di antara 41 hingga 60 tahun iaitu sebanyak 58 orang membawa
peratusan sebanyak 48.3% . Julat terendah ialah 20 tahun ke bawah iaitu sebanyak 3 orang
dengan 2.5%, Bagi julat umut 21 hingga 40 tahun mencatatkan sebanyak 54 orang iaitu 45%
manakala 61 tahun ke atas mencatat jumlah sebanyak 5 orang iaitu 4.2%. Jumlah responden
kesemuanya adalah sebanyak 120 responden.

D) Using the Construct1_Age variable of teachers who participated in the survey,


compute the following measures of central tendency: i. Mean, ii. Median, iii. Mode
and the measures of dispersion comprising i. Range, ii. Variance, and iii. Standard
deviation. Describe the output for measures of central tendency and measures of
dispersion.

Statistics
Age of teachers
Valid 120
N
Missing 0
Mean 41.96
Median 44.00
Mode 47
Std. Deviation 11.903
Variance 141.671
Range 47

Jadual di atas menunjukkan data julat umur responden. Berdasarkan jadual di atas, nilai min
ialah 41.96. Nilai median ialah 44.00 dan mod mencatatkan nilai 47. Sisihan piawai mencatat
nilai 11.903, manakala nilai Varian ialah 141.671. Nilai julat ialah sebanyak 47.
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

E) Run a crosstabulation between the Construct1_Schools variable and the Age


Category variable (new variable created under section c. above). Describe the
crosstabulation findings.

Schools which participated in the survey * Age New Crosstabulation

Age New Total

20 Years 21 to 41 to 60 61 years
and Below 40years years and above

Count 0 17 14 0 31

% within Schools which 0.0% 54.8% 45.2% 0.0% 100.0%


School participated in the
A survey

% within Age New 0.0% 31.5% 24.1% 0.0% 25.8%

% of Total 0.0% 14.2% 11.7% 0.0% 25.8%

Count 3 19 24 2 48

% within Schools which 6.3% 39.6% 50.0% 4.2% 100.0%


School participated in the
B survey

% within Age New 100.0% 35.2% 41.4% 40.0% 40.0%


Schools which
% of Total 2.5% 15.8% 20.0% 1.7% 40.0%
participated in the
Count 0 13 13 3 29
survey
% within Schools which 0.0% 44.8% 44.8% 10.3% 100.0%
School participated in the
C survey

% within Age New 0.0% 24.1% 22.4% 60.0% 24.2%

% of Total 0.0% 10.8% 10.8% 2.5% 24.2%

Count 0 5 7 0 12

% within Schools which 0.0% 41.7% 58.3% 0.0% 100.0%


School participated in the
D survey

% within Age New 0.0% 9.3% 12.1% 0.0% 10.0%

% of Total 0.0% 4.2% 5.8% 0.0% 10.0%


Count 3 54 58 5 120

% within Schools which 2.5% 45.0% 48.3% 4.2% 100.0%


participated in the
Total
survey

% within Age New 100.0% 100.0% 100.0% 100.0% 100.0%

% of Total 2.5% 45.0% 48.3% 4.2% 100.0%


LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

Jadual di atas menunjukkan julat umur responden mengikut sekolah. Bagi Sekolah A, tiada
responden yang berumur 20 tahun ke bawah. Sebanyak 17 responden iaitu 54.8% yang
berumur di antara 21 hingga 40 tahun. Terdapat 14 responden iaitu 45.2% yang berumur 41
hingga 60 tahun dan tiada responden yang berumur 60 tahun ke atas. Bagi sekolah B, terdapat
3 responden iaitu 6.3% yang berumur 20 tahun ke bawah. Sebanyak 19 responden iaitu
39.6% berumur 21 hingga 40 tahun. Sebanyak 24 iaitu 50% responden berumur dari 41
hingga 60 tahun dan 2 orang responden iaitu 4.2% berumur 60 tahun ke atas. Bagi Sekolah C,
tiada responden yang berumur 20 tahun ke bawah. 13 responden iaitu 44.8% tercatat berumur
21-40 tahun. Terdapat 13 responden iaitu 44.8% yang berumur 41 hingga 60 tahun dan 3
responden iaitu 10.3 % yang berumur 60 tahun ke atas. Bagi Sekolah D, tiada responden
yang berumur 20 ke bawah. 5 responden tercatat iaitu 41.7% berumur 21-40 tahun. Terdapat
7 responden iaitu 58.3% yang berumur 41 hingga 60 tahun dan tiada responden yang berumur
60 tahun ke atas.

F) Run an exploratory data analysis of Construct5 (Motivation level) variable by


Construct1_Type_of_School (Classification by Public School and Private School).
Describe the exploratory data analysis output.

Descriptives

Schools which participated in the survey Statistic Std. Error

Motivation level Mean 4.0058 .12390


Lower Bound 3.7528
95% Confidence Interval for Mean
Upper Bound 4.2589

5% Trimmed Mean 4.0092

Median 3.9861

Variance .476

School A Std. Deviation .68985

Minimum 2.93

Maximum 5.00

Range 2.07

Interquartile Range 1.33

Skewness -.150 .421

Kurtosis -1.253 .821

School B Mean 4.0874 .09601

95% Confidence Interval for Mean Lower Bound 3.8942

Upper Bound 4.2805


LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

5% Trimmed Mean 4.1236

Median 4.1667

Variance .442

Std. Deviation .66514

Minimum 2.42

Maximum 5.00

Range 2.58

Interquartile Range .94

Skewness -.609 .343

Kurtosis -.113 .674

Mean 3.8855 .14854

Lower Bound 3.5813


95% Confidence Interval for Mean
Upper Bound 4.1898

5% Trimmed Mean 3.9028

Median 4.0556

Variance .640

School C Std. Deviation .79990

Minimum 2.43

Maximum 5.00

Range 2.57

Interquartile Range 1.18

Skewness -.345 .434

Kurtosis -.930 .845

Mean 3.7396 .19535

Lower Bound 3.3096


95% Confidence Interval for Mean
Upper Bound 4.1696

5% Trimmed Mean 3.7608

Median 3.8333

Variance .458

School D Std. Deviation .67672

Minimum 2.36

Maximum 4.74

Range 2.38

Interquartile Range .69

Skewness -.683 .637

Kurtosis .548 1.232


LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

Jadual di atas menunjukkan tahap motivasi guru. Bagi sekolah A, min bagi tahap motivasi
guru ialah 4.0058. Median mencatatkan nilai 3.9861. Varian pula mencatatkan nilai 0.476
manakala sisihan piawai data motivasi guru ialah 0.68985. Nilai julat mencatat nilai 2.07
manakala nilai Skewness mencatat nilai -0.150 dan kurtosis mencatat nilai -1.253.

Bagi sekolah B, min bagi tahap motivasi guru ialah 4.0874. Median mencatatkan nilai
4.1667. Varian pula mencatatkan nilai 0.442 manakala sisihan piawai data motivasi guru
ialah 0. 66514. Nilai julat mencatat nilai 2.58 manakala nilai Skewness mencatat nilai
-0.609 dan kurtosis mencatat nilai -0.113

Bagi Sekolah C, min bagi tahap motivasi guru ialah 3.8855. Median mencatatkan nilai
4.0556. Varian pula mencatatkan nilai 0.640 manakala sisihan piawai data motivasi guru
ialah 0.79990. Nilai julat mencatat nilai 2.57 manakala nilai Skewness mencatat nilai
-0.345 dan kurtosis mencatat nilai -0.930.

Bagi Sekolah C, min bagi tahap motivasi guru ialah 3.7396. Median mencatatkan nilai
3.8333. Varian pula mencatatkan nilai 0. 458 manakala sisihan piawai data motivasi guru
ialah 0. 67672. Nilai julat mencatat nilai 2.38 manakala nilai Skewness mencatat nilai
-0.683 dan kurtosis mencatat nilai 0.548.

Tests of Normality

Classification by Public School and Private Kolmogorov-Smirnova Shapiro-Wilk


School Statistic df Sig. Statistic df Sig.

Motivation Public School .097 56 .200* .949 56 .019


level Private School .112 64 .046 .942 64 .005

*. This is a lower bound of the true significance.


a. Lilliefors Significance Correction

Berdasarkan ujian normaliti di atas, distribusi data antara jenis sekolah swasta dan tahap
motivasi guru adalah tidak normal. Ini boleh diperhatikan daripada nilai Sig dalam ujian
Kolmogorov di mana nilainya ialah 0.046. Nilai tersebut adalah kurang daripada nilai 0.05
iaitu nilai piawaian bagi nilai distribusi yang tidak normal.
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

Descriptives

Classification by Public School and Private School Statistic Std. Error

Mean 4.0908 .08986

Lower Bound 3.9107


95% Confidence Interval for Mean
Upper Bound 4.2709

5% Trimmed Mean 4.1196

Median 4.0625

Variance .452

Public School Std. Deviation .67249

Minimum 2.53

Maximum 5.00

Range 2.47

Interquartile Range 1.09

Skewness -.285 .319

Kurtosis -.704 .628


Motivation level
Mean 3.8882 .09108

Lower Bound 3.7062


95% Confidence Interval for Mean
Upper Bound 4.0703

5% Trimmed Mean 3.9101

Median 4.0208

Variance .531

Private School Std. Deviation .72867


Minimum 2.36

Maximum 5.00

Range 2.64

Interquartile Range 1.06

Skewness -.487 .299

Kurtosis -.754 .590

Berdasarkan jadual di atas, nilai skewness dan kurtosis bagi sekolah swasta ialah masing-
masing -0.487 dan -0.754. Nilai ini menggambarkan bentuk taburan lengkung sesebuah
pembolehubah. Nilai skewness dan kurtosis yang semakin jauh dari nilai 0 menunjukkan
taburan data adalah semakin tidak normal.
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

Berdasarkan histogram di atas, ekornya memanjang ke arah nilai negatif manakala


skewerness condong ke arah kanan. Ini menunjukkan taburan data yang tidak normal dalam
data sekolah swasta.

Motivation level Stem-and-Leaf Plot for


Construct1_Type_of_School= Private School

Frequency Stem & Leaf

3.00 2 . 344
7.00 2 . 5788899
6.00 3 . 000002
16.00 3 . 5556677788888999
20.00 4 . 01111222222333333444
10.00 4 . 5667888889
2.00 5 . 00

Stem width: 1.00


Each leaf: 1 case(s)
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

Berdasarkan lakaran plot di atas, plot lengkungan tersebut juga sama seperti lengkungan
daripada histogram tadi. Lengkungan ini menunjukkan bentuk yang kurang normal.

Outlier

Berdasarkan plot graf Q-Q di atas, taburan data sepatutnya berada tidak jauh daripada garisan
normal. Terdapat beberapa outliers ataupun data yang ekstrem boleh dilihat pada graf
tersebut. Data ekstrem boleh dilihat pada label anak panah.

G. Describe how you would go about addressing missing values in a dataset when
respondents failed to fill-up their responses.

Terdapat beberapa cara untuk menangani masalah missing value ataupun data yang hilang
dalam analisis statistik. Antara cara penyelesaiannya adalah seperti berikut.

a. Prosedur berasaskan unit yang lengkap

Pada prosedur ini, analisis hanya dilakukan terhadap unit (sebanyak n1 case, baris pada
matriks data n x m) di mana untuk seluruh m variable, nilainya tercatat atau memiliki data
yang lengkap. Sedangkan sebanyak n2 cases yang terdapat data hilang pada variabel-
LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

variabelnya diabaikan, atau dikeluarkan dari analisis. Metode ini cukup memuaskan jika
jumlah missing data tidak terlalu besar, tapi prosedur ini menjadi tidak efisyen jika peratus
data hilang meningkat atau jika data hilang tersebut mengelompok. Hal ini akan
menyebabkan keputusan analisis yang sangat bias.

b. Prosedur berasaskan Imputasi.

Imputasi merupakan suatu alternatif yang umum dan fleksibel. Dalam prosedur ini, data
yang hilang diisi dengan menganggar atau menggunakan penduga berasaskan kaitan dengan
data lain. Namun bagaimanapun cara ini tetap menghasilkan bias, dimana nilai yang
dimasukkan masih berbeza dengan nilai sebenarnya dari missing data. Terdapat beberapa
pendekatan untuk imputasi ini,

i. Hot deck imputation, di mana dari unit-unit yang tercatat digantikan terhadap missing
data.
ii. Cold deck imputation, di mana missing value diganti oleh nilai yang konstan.
iii. Mean imputation, di mana nilai yang hilang diganti oleh min dari kelompok sampel
unit yang berkaitan.

H. Discuss the differences between dependent variable and independent variable in


statistical analysis.

Pembolehubah bersandar ialah pembolehubah yang memberikan respon apabila


dihubungkan dengan pembolehubah tidak bersandar. Pembolehubah bersandar mempunyai
faktor yang diperhati dan diukur untuk menentukan pengaruh daripada pembolehubah tidak
bersandar. Pembolehubah bersandar juga dikenali sebagai pembolehubah kriterion. Sebagai
contoh, pengaruh saiz terhadap minat membeli buku, maka pembolehubah bersandarnya
adalah “minat membeli”.

Pembolehubah bebas merupakan pembolehubah stimulus atau pembolehubah yang


mempengaruhi pembolehubah lain. Pembolehubah bebas merupakan pembolehubah yang
faktornya diukur, dimanipulasi, atau dipilih oleh penyelidik untuk menentukan
hubungannya dengan sesuatu gejala yang diperhatikan.

You might also like