Statistik OUM

LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH
FAKULTI PENDIDIKAN DAN BAHASA
JANUARI 2017
HMEF5113
STATISTICS FOR EDUCATIONAL RESEARCH
NO. MATRIKULASI : CGS01497606

NO. KAD PENGNEALAN : 900125-12-5303
NO. TELEFON : 0126340603
E-MEL : frekeysh@gmail.com
PUSAT PEMBELAJARAN : LAHAD DATU LEARNING CENTRE

A) Generate the frequency tables and bar charts to show the distribution by
Construct1_Schools and Construct1_Type_of_School. Describe the frequency
distribution output.
Jadual Kekerapan
Schools which participated in the survey
Frequency Percent Valid Percent Cumulative

Percent
School A 31 25.8 25.8 25.8
School B 48 40.0 40.0 65.8
Valid School C 29 24.2 24.2 90.0
School D 12 10.0 10.0 100.0
Total 120 100.0 100.0
Berdasarkan jadual kekerapan, Sekolah B mencatatkan kekerapan tertinggi iaitu sebanyak 48

dengan peratusan 40% manakala Sekolah D mencatatkan kekerapan terendah iaitu sebanyak
12 dengan peratusan 10%. Sekolah A dan Sekolah C masing-masing mencatatkan kekerapan
sebanyak 31 dan 29.
Carta Bar
Berdasarkan carta bar di atas, Sekolah D mencatatkan kekerapan terendah iaitu 12 manakala
Sekolah B mencatatkan kekerapan tertinggi iaitu 48. Sekolah A dan Sekolah C masing-
masing mencatatkan kekerapan sebanyak 31 dan 29.
B) What is random sampling? Using the HMEF5113 Dataset for Assignments 1 & 2.sav,
create a random sample comprising 30 cases or respondents from the 120 teachers
who participated in the survey. Run the frequency procedure to show the output using
the Construct1_Schools variable.
Teknik pengambilan sampel secara rambang adalah kaedah yang digunakan untuk
mengelakkan bias dalam kajian. Persampelan rawak adalah jenis pensampelan asas, kerana ia
boleh menjadi satu komponen kaedah persampelan yang lebih kompleks lagi. Prinsip
persampelan rawak ialah setiap sampel mempunyai kebarangkalian dipilih yang sama.
Gambar di atas menunjukkan sampel yang telah ditapis secara rawak menggunakan aplikasi
SPSS.
Schools which participated in the survey

Percent
School A 11 36.7 36.7 36.7
School B 12 40.0 40.0 76.7
Valid School C 4 13.3 13.3 90.0
School D 3 10.0 10.0 100.0
Total 30 100.0 100.0
Jadual di atas menunjukkan kekerapan 30 buah sekolah yang menyertai kajian ini. Sekolah A
menunjukkan nilai kekerapan 11 iaitu 36.7 %, Sekolah B mempunyai nilai kekerapan 12
bersamaan dengan 40%. Sekolah C mempunyai 4 kekerapan dengan 13.3 % dan Sekolah D
mempunyai nilai kekerapan sebanyak 3 iaitu 10%.
C) Using the Construct1_Age variable, create an ordinal-type variable with the following
age categories: i. 20 years and below, ii. 21 to 40 years, iii. 41 to 60 years, and 4. 61
years and above. Show a frequency distribution table of the newly created ordinal-
type Age Category variable. Describe the frequency distribution table.
Statistics
Age New
Valid 120
N
Missing 0
Mean 2.54
Std. Deviation .620
Age New

Percent
20 Years and Below 3 2.5 2.5 2.5
21 to 40years 54 45.0 45.0 47.5
Valid 41 to 60 years 58 48.3 48.3 95.8
61 years and above 5 4.2 4.2 100.0
Total 120 100.0 100.0

Berdasarkan jadual di atas, nilai min bagi data di atas ialah 2.54. Nilai sisihan piawai bagi
data di atas ialah 0.620. Jadual di atas menunjukkan kekerapan julat umur responden. Julat
tertinggi ialah umur di antara 41 hingga 60 tahun iaitu sebanyak 58 orang membawa
peratusan sebanyak 48.3% . Julat terendah ialah 20 tahun ke bawah iaitu sebanyak 3 orang
dengan 2.5%, Bagi julat umut 21 hingga 40 tahun mencatatkan sebanyak 54 orang iaitu 45%
manakala 61 tahun ke atas mencatat jumlah sebanyak 5 orang iaitu 4.2%. Jumlah responden
kesemuanya adalah sebanyak 120 responden.
D) Using the Construct1_Age variable of teachers who participated in the survey,

compute the following measures of central tendency: i. Mean, ii. Median, iii. Mode
and the measures of dispersion comprising i. Range, ii. Variance, and iii. Standard
deviation. Describe the output for measures of central tendency and measures of
dispersion.
Statistics
Age of teachers
Valid 120
N
Missing 0
Mean 41.96
Median 44.00
Mode 47
Std. Deviation 11.903
Variance 141.671
Range 47
Jadual di atas menunjukkan data julat umur responden. Berdasarkan jadual di atas, nilai min
ialah 41.96. Nilai median ialah 44.00 dan mod mencatatkan nilai 47. Sisihan piawai mencatat
nilai 11.903, manakala nilai Varian ialah 141.671. Nilai julat ialah sebanyak 47.
E) Run a crosstabulation between the Construct1_Schools variable and the Age

Category variable (new variable created under section c. above). Describe the
crosstabulation findings.
Schools which participated in the survey * Age New Crosstabulation
Age New Total
20 Years 21 to 41 to 60 61 years
and Below 40years years and above
Count 0 17 14 0 31
% within Schools which 0.0% 54.8% 45.2% 0.0% 100.0%

School participated in the
A survey
% within Age New 0.0% 31.5% 24.1% 0.0% 25.8%
% of Total 0.0% 14.2% 11.7% 0.0% 25.8%
Count 3 19 24 2 48

B survey
% within Age New 100.0% 35.2% 41.4% 40.0% 40.0%

Schools which
% of Total 2.5% 15.8% 20.0% 1.7% 40.0%
participated in the
Count 0 13 13 3 29
survey
C survey
% within Age New 0.0% 24.1% 22.4% 60.0% 24.2%
% of Total 0.0% 10.8% 10.8% 2.5% 24.2%
Count 0 5 7 0 12

D survey
% within Age New 0.0% 9.3% 12.1% 0.0% 10.0%
% of Total 0.0% 4.2% 5.8% 0.0% 10.0%

Count 3 54 58 5 120

participated in the
Total
survey
% within Age New 100.0% 100.0% 100.0% 100.0% 100.0%
% of Total 2.5% 45.0% 48.3% 4.2% 100.0%

Jadual di atas menunjukkan julat umur responden mengikut sekolah. Bagi Sekolah A, tiada
responden yang berumur 20 tahun ke bawah. Sebanyak 17 responden iaitu 54.8% yang
berumur di antara 21 hingga 40 tahun. Terdapat 14 responden iaitu 45.2% yang berumur 41
hingga 60 tahun dan tiada responden yang berumur 60 tahun ke atas. Bagi sekolah B, terdapat
3 responden iaitu 6.3% yang berumur 20 tahun ke bawah. Sebanyak 19 responden iaitu
39.6% berumur 21 hingga 40 tahun. Sebanyak 24 iaitu 50% responden berumur dari 41
hingga 60 tahun dan 2 orang responden iaitu 4.2% berumur 60 tahun ke atas. Bagi Sekolah C,
tiada responden yang berumur 20 tahun ke bawah. 13 responden iaitu 44.8% tercatat berumur
21-40 tahun. Terdapat 13 responden iaitu 44.8% yang berumur 41 hingga 60 tahun dan 3
responden iaitu 10.3 % yang berumur 60 tahun ke atas. Bagi Sekolah D, tiada responden
yang berumur 20 ke bawah. 5 responden tercatat iaitu 41.7% berumur 21-40 tahun. Terdapat
7 responden iaitu 58.3% yang berumur 41 hingga 60 tahun dan tiada responden yang berumur
60 tahun ke atas.
F) Run an exploratory data analysis of Construct5 (Motivation level) variable by

Construct1_Type_of_School (Classification by Public School and Private School).
Describe the exploratory data analysis output.
Descriptives
Schools which participated in the survey Statistic Std. Error
Motivation level Mean 4.0058 .12390

Lower Bound 3.7528
95% Confidence Interval for Mean
Upper Bound 4.2589
5% Trimmed Mean 4.0092
Median 3.9861
Variance .476
School A Std. Deviation .68985
Minimum 2.93
Maximum 5.00
Range 2.07
Interquartile Range 1.33
Skewness -.150 .421
Kurtosis -1.253 .821
School B Mean 4.0874 .09601
95% Confidence Interval for Mean Lower Bound 3.8942
Upper Bound 4.2805

Median 4.1667
Variance .442
Std. Deviation .66514
Minimum 2.42
Maximum 5.00
Range 2.58
Interquartile Range .94
Skewness -.609 .343
Kurtosis -.113 .674
Mean 3.8855 .14854
Lower Bound 3.5813

Upper Bound 4.1898
Median 4.0556
Variance .640
School C Std. Deviation .79990
Minimum 2.43
Maximum 5.00
Range 2.57
Skewness -.345 .434
Kurtosis -.930 .845
Mean 3.7396 .19535
Lower Bound 3.3096

Upper Bound 4.1696
Median 3.8333
Variance .458
School D Std. Deviation .67672
Minimum 2.36
Maximum 4.74
Range 2.38
Interquartile Range .69
Skewness -.683 .637
Kurtosis .548 1.232

Jadual di atas menunjukkan tahap motivasi guru. Bagi sekolah A, min bagi tahap motivasi
guru ialah 4.0058. Median mencatatkan nilai 3.9861. Varian pula mencatatkan nilai 0.476
manakala sisihan piawai data motivasi guru ialah 0.68985. Nilai julat mencatat nilai 2.07
manakala nilai Skewness mencatat nilai -0.150 dan kurtosis mencatat nilai -1.253.
Bagi sekolah B, min bagi tahap motivasi guru ialah 4.0874. Median mencatatkan nilai
4.1667. Varian pula mencatatkan nilai 0.442 manakala sisihan piawai data motivasi guru
ialah 0. 66514. Nilai julat mencatat nilai 2.58 manakala nilai Skewness mencatat nilai
-0.609 dan kurtosis mencatat nilai -0.113
Bagi Sekolah C, min bagi tahap motivasi guru ialah 3.8855. Median mencatatkan nilai
4.0556. Varian pula mencatatkan nilai 0.640 manakala sisihan piawai data motivasi guru
ialah 0.79990. Nilai julat mencatat nilai 2.57 manakala nilai Skewness mencatat nilai
-0.345 dan kurtosis mencatat nilai -0.930.
Bagi Sekolah C, min bagi tahap motivasi guru ialah 3.7396. Median mencatatkan nilai
3.8333. Varian pula mencatatkan nilai 0. 458 manakala sisihan piawai data motivasi guru
ialah 0. 67672. Nilai julat mencatat nilai 2.38 manakala nilai Skewness mencatat nilai
-0.683 dan kurtosis mencatat nilai 0.548.
Tests of Normality
Classification by Public School and Private Kolmogorov-Smirnova Shapiro-Wilk

School Statistic df Sig. Statistic df Sig.
Motivation Public School .097 56 .200* .949 56 .019

level Private School .112 64 .046 .942 64 .005
*. This is a lower bound of the true significance.

a. Lilliefors Significance Correction
Berdasarkan ujian normaliti di atas, distribusi data antara jenis sekolah swasta dan tahap
motivasi guru adalah tidak normal. Ini boleh diperhatikan daripada nilai Sig dalam ujian
Kolmogorov di mana nilainya ialah 0.046. Nilai tersebut adalah kurang daripada nilai 0.05
iaitu nilai piawaian bagi nilai distribusi yang tidak normal.
Descriptives
Classification by Public School and Private School Statistic Std. Error
Mean 4.0908 .08986
Lower Bound 3.9107

Upper Bound 4.2709
Median 4.0625
Variance .452
Public School Std. Deviation .67249
Minimum 2.53
Maximum 5.00
Range 2.47
Skewness -.285 .319
Kurtosis -.704 .628

Motivation level
Mean 3.8882 .09108
Lower Bound 3.7062

Upper Bound 4.0703
Median 4.0208
Variance .531
Private School Std. Deviation .72867

Minimum 2.36
Maximum 5.00
Range 2.64
Skewness -.487 .299
Kurtosis -.754 .590
Berdasarkan jadual di atas, nilai skewness dan kurtosis bagi sekolah swasta ialah masing-
masing -0.487 dan -0.754. Nilai ini menggambarkan bentuk taburan lengkung sesebuah
pembolehubah. Nilai skewness dan kurtosis yang semakin jauh dari nilai 0 menunjukkan
taburan data adalah semakin tidak normal.
Berdasarkan histogram di atas, ekornya memanjang ke arah nilai negatif manakala

skewerness condong ke arah kanan. Ini menunjukkan taburan data yang tidak normal dalam
data sekolah swasta.
Motivation level Stem-and-Leaf Plot for

Construct1_Type_of_School= Private School
Frequency Stem & Leaf
3.00 2 . 344
7.00 2 . 5788899
6.00 3 . 000002
16.00 3 . 5556677788888999
20.00 4 . 01111222222333333444
10.00 4 . 5667888889
2.00 5 . 00
Stem width: 1.00

Each leaf: 1 case(s)
Berdasarkan lakaran plot di atas, plot lengkungan tersebut juga sama seperti lengkungan
daripada histogram tadi. Lengkungan ini menunjukkan bentuk yang kurang normal.
Outlier
Berdasarkan plot graf Q-Q di atas, taburan data sepatutnya berada tidak jauh daripada garisan
normal. Terdapat beberapa outliers ataupun data yang ekstrem boleh dilihat pada graf
tersebut. Data ekstrem boleh dilihat pada label anak panah.
G. Describe how you would go about addressing missing values in a dataset when
respondents failed to fill-up their responses.
Terdapat beberapa cara untuk menangani masalah missing value ataupun data yang hilang
dalam analisis statistik. Antara cara penyelesaiannya adalah seperti berikut.
a. Prosedur berasaskan unit yang lengkap
Pada prosedur ini, analisis hanya dilakukan terhadap unit (sebanyak n1 case, baris pada
matriks data n x m) di mana untuk seluruh m variable, nilainya tercatat atau memiliki data
yang lengkap. Sedangkan sebanyak n2 cases yang terdapat data hilang pada variabel-
variabelnya diabaikan, atau dikeluarkan dari analisis. Metode ini cukup memuaskan jika
jumlah missing data tidak terlalu besar, tapi prosedur ini menjadi tidak efisyen jika peratus
data hilang meningkat atau jika data hilang tersebut mengelompok. Hal ini akan
menyebabkan keputusan analisis yang sangat bias.
b. Prosedur berasaskan Imputasi.
Imputasi merupakan suatu alternatif yang umum dan fleksibel. Dalam prosedur ini, data
yang hilang diisi dengan menganggar atau menggunakan penduga berasaskan kaitan dengan
data lain. Namun bagaimanapun cara ini tetap menghasilkan bias, dimana nilai yang
dimasukkan masih berbeza dengan nilai sebenarnya dari missing data. Terdapat beberapa
pendekatan untuk imputasi ini,
i. Hot deck imputation, di mana dari unit-unit yang tercatat digantikan terhadap missing
data.
ii. Cold deck imputation, di mana missing value diganti oleh nilai yang konstan.
iii. Mean imputation, di mana nilai yang hilang diganti oleh min dari kelompok sampel
unit yang berkaitan.
H. Discuss the differences between dependent variable and independent variable in

statistical analysis.
Pembolehubah bersandar ialah pembolehubah yang memberikan respon apabila

dihubungkan dengan pembolehubah tidak bersandar. Pembolehubah bersandar mempunyai
faktor yang diperhati dan diukur untuk menentukan pengaruh daripada pembolehubah tidak
bersandar. Pembolehubah bersandar juga dikenali sebagai pembolehubah kriterion. Sebagai
contoh, pengaruh saiz terhadap minat membeli buku, maka pembolehubah bersandarnya
adalah “minat membeli”.
Pembolehubah bebas merupakan pembolehubah stimulus atau pembolehubah yang

mempengaruhi pembolehubah lain. Pembolehubah bebas merupakan pembolehubah yang
faktornya diukur, dimanipulasi, atau dipilih oleh penyelidik untuk menentukan
hubungannya dengan sesuatu gejala yang diperhatikan.

Statistik OUM

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Statistik OUM

Uploaded by

Copyright:

Available Formats

LESLIE CHANG - STATISTICS FOR EDUCATIONAL RESEARCH

FAKULTI PENDIDIKAN DAN BAHASA

STATISTICS FOR EDUCATIONAL RESEARCH

NO. MATRIKULASI : CGS01497606

PUSAT PEMBELAJARAN : LAHAD DATU LEARNING CENTRE

Schools which participated in the survey

Frequency Percent Valid Percent Cumulative

School A 31 25.8 25.8 25.8

School B 48 40.0 40.0 65.8

Valid School C 29 24.2 24.2 90.0

School D 12 10.0 10.0 100.0

Total 120 100.0 100.0

Berdasarkan jadual kekerapan, Sekolah B mencatatkan kekerapan tertinggi iaitu sebanyak 48

Schools which participated in the survey

Frequency Percent Valid Percent Cumulative

School A 11 36.7 36.7 36.7

School B 12 40.0 40.0 76.7

Valid School C 4 13.3 13.3 90.0

School D 3 10.0 10.0 100.0

Total 30 100.0 100.0

Frequency Percent Valid Percent Cumulative

20 Years and Below 3 2.5 2.5 2.5

21 to 40years 54 45.0 45.0 47.5

Valid 41 to 60 years 58 48.3 48.3 95.8

61 years and above 5 4.2 4.2 100.0

Total 120 100.0 100.0

D) Using the Construct1_Age variable of teachers who participated in the survey,

E) Run a crosstabulation between the Construct1_Schools variable and the Age

Schools which participated in the survey * Age New Crosstabulation

Age New Total

% within Schools which 0.0% 54.8% 45.2% 0.0% 100.0%

% within Age New 0.0% 31.5% 24.1% 0.0% 25.8%

% of Total 0.0% 14.2% 11.7% 0.0% 25.8%

% within Schools which 6.3% 39.6% 50.0% 4.2% 100.0%

% within Age New 100.0% 35.2% 41.4% 40.0% 40.0%

% within Age New 0.0% 24.1% 22.4% 60.0% 24.2%

% of Total 0.0% 10.8% 10.8% 2.5% 24.2%

% within Schools which 0.0% 41.7% 58.3% 0.0% 100.0%

% within Age New 0.0% 9.3% 12.1% 0.0% 10.0%

% of Total 0.0% 4.2% 5.8% 0.0% 10.0%

% within Schools which 2.5% 45.0% 48.3% 4.2% 100.0%

% within Age New 100.0% 100.0% 100.0% 100.0% 100.0%

% of Total 2.5% 45.0% 48.3% 4.2% 100.0%

F) Run an exploratory data analysis of Construct5 (Motivation level) variable by

Schools which participated in the survey Statistic Std. Error

Motivation level Mean 4.0058 .12390

5% Trimmed Mean 4.0092

School A Std. Deviation .68985

Interquartile Range 1.33

Skewness -.150 .421

Kurtosis -1.253 .821

School B Mean 4.0874 .09601

95% Confidence Interval for Mean Lower Bound 3.8942

Upper Bound 4.2805

5% Trimmed Mean 4.1236

Std. Deviation .66514

Interquartile Range .94

Skewness -.609 .343

Kurtosis -.113 .674

Mean 3.8855 .14854

Lower Bound 3.5813

5% Trimmed Mean 3.9028

School C Std. Deviation .79990

Interquartile Range 1.18