You are on page 1of 35

17-Aug-13 1

TAJUK 5 :

KESAHAN DAN
KEBOLEHPERCAYAAN
UJIAN
17-Aug-13 2
C Thorndike (1991) konsep kesahan merujuk
kepada keseluruhan apa yang kita hendak ukur
dan tiada lain selain apa yang kita hendak ukur.
C Sesuatu ujian sepatutnya mengukur apa yang
sepatutnya diukur (Umum)
C Kesahan bermaksud kebolehan ujian mengukur
apa yang sepatutnya diukur (Youngman &
Eggleston, 1982; Sax & Newton, 1997
KESAHAN PENTAKSIRAN
Jenis
Kesahan
Kesahan
Telahan
Kesahan
Serentak
Kesahan
gagasan
Kesahan
Muka
Kesahan
Kandungan
17-Aug-13 4
Kesahan Kandungan (Content Validity)
Kesahan Konstruk (Construct validity)
Kesahan Muka (Face Validity)
Kesahan Berkaitan Kriteria (Criterian-
related Validity)
Kesahan Semasa (Concurrent Validity)
Kesahan Telahan (Predictive Validity

17-Aug-13 5

Item ujian merangkumi
kandungan ujian yang hendak
diukur
Merujuk kepada objektif
pengajaran yang jelas dan
bahan-bahan pengajaran yang
ditentukan atau kepada bidang
pengajaran yang dikhususkan.
17-Aug-13 6
Kandungan ujian mewakili
perkara yang hendak diukur
atau diuji
Digunakan dalam ujian
pencapaian
Mengukur penguasaan
pengetahuan atau kemahiran
tertentu bagi mata pelajaran
tertentu
17-Aug-13 7
O Memastikan setiap konstruk yang
diuji mewakili setiap aspek penting
pelajaran yang diajar
O Bergantung kepada relevensi atau
kesesuaian tingkah laku yang
ingin diperhatikan atau diketahui
O Perlu memenuhi Huraian Sukatan
Pelajaran, JSU dan Spesifikasi
Ujian
17-Aug-13 8
E Perbezaan antara kesahan semasa dengan
kesahan ramalan bergantung kepada
prosedur mentadbir ujian:-
E Pentadbiran ujian pada jangka masa yang
singkat bagi ujian piawaian (concurrent),
atau setelah masa beberapa bulan
(predictive).
17-Aug-13 9
- Hubungkait antara skor ujian
dengan kumpulan pelajar
berdasarkan kriterian tertentu
- Ditadbir pada masa yang sama
atau dalam jangka masa yang
pendik.
- Skor ujian/pep. akhir tahun bagi
sampel pelajar dibandingkan
dengan jangkaan guru tentang
kebolehan pelajar, misalnya skor
Sejarah dalam pep. SPM

17-Aug-13 10
Ditentukan dengan membuat
penilaian setepat mana ramalan
yang dibuat masa kini
(menggunakan instrumen untuk
mengumpul data) dapat disahkan
berdasarkan eviden yang
dikumpulkan pada masa hadapan.
17-Aug-13 11

Contoh:-
Maklumat dikumpul melalui
ujian/kriteria/ tingkahlaku dan
tunggu sehingga tingkah laku yang
hendak diukur oleh ujian berlaku
Buat perbandingan antara maklumat
yang dikumpul dan skor yang
diperolehi daripada pelajar
mengambil ujian tersebut.
17-Aug-13 12

Merujuk kepada sejauh mana sesuatu
alat ukuran itu dapat mengukur
sesuatu konstruk/gagasan seperti: -
kecerdasan
kreativiti
emosi
17-Aug-13 13
Contoh:-
Ujian ditadbir kepada pelajar yang
julat pencapaiannya luas
keputusan ujian membezakan
antara pelajar yang
pencapaiannya tinggi dengan
yang rendah ujian tersebut
dianggap mengukur kebolehan
konstruk.
17-Aug-13 14

Ujian dilihat mengukur apa yang
sepatutnya diukur.
mempunyai kesahan yang tinggi.
memberi keyakinan kepada
inventori yang digunakan.

17-Aug-13 15
+ Meningkatkan motivasi semasa pelajar
mengambil ujian
+ Mengurangkan perasaan kurang puas
hati atau tidak adil kepada golongan
yang skornya rendah
+ Membantu menyakinkan pengguna
yang berpotensi (e.g. guru, pentadbir
sekolah) untuk menggunakan ujian
tersebut
17-Aug-13 16
+ Menyakinkan orang ramai,
apabila mereka dapat
hubungkaitkan antara ujian
dengan pencapaian atau ciri-ciri
ujian itu sepatutnya mengukur
+ Pelajar/calon akan bertindak
lebih baik kepada ujian yang
mempunyai kesahan muka yang
tinggi.

17-Aug-13 17
FAKTOR YANG MENYUMBANG
KEPADA KETIDAKSAHAN SKOR
17-Aug-13 18
17-Aug-13 19
. Tahap ketekalan antara skor-skor
ujian yang senantiasa tetap dengan
tidak adanya ralat pengukuran
(Test Style Manual, ETS, New
Jersey, USA).
17-Aug-13 20
. petunjuk bagi konsistensi skor-skor;
antara pemeriksa
mengikut masa
Tugasan-tugasan yang berlainan
item-item yang mengukur perkara yang sama
(parallel test)
. Kebolehpercayaan ujian bergantung
kepada ketekalan skor yang dihasilkannya
walaupun diulang uji beberapa kali.
(www.cresst96.cse.ucla.edu/glossary)
Faktor-faktor mempengaruhi
Kebolehpercayaan
CPanjang ujian
CKepantasan
CSebaran markat
CKesukaran ujian
CKeobjektifan

17-Aug-13 21
Panjang Ujian
C Indeks kebolehpercayaan akan meningkat, sekiranya ujian
bertambah panjang. Begitu juga sebaliknya, jika item asal dibuang,
indeks kebolehpercayaan akan menurun.
C Bagaimanapun, item yang ditambah perlulah setara/seragam
dengan item-item asal ujian.
C Sekiranya item yang tidak setara ditambah kepada ujian asal,
indeks kebolehpercayaan tidak akan meningkat, dan mungkin akan
menurun disebabkan oleh item-itemnya tidak lagi setara.
C Rumus Spearman-Brown yang digunakan untuk mengira pekali
Ketekalan Dalaman Belah-Dua boleh digunakan juga untuk mengira
indeks kebolehpercayaan ujian apabila itemnya ditambah atau
dikurangkan.

17-Aug-13 22
C Rumus am Spearman-Brown ialah seperti berikut:
rSB = [Kr ]
[1+ (K-1)r]
di mana:
C K ialah nisbah bilangan item dalam ujian baru kepada bilangan item dalam ujian
asal dan r ialah pekali kebolehpercayaan ujian asal.
C Bagi Ketekalan Dalaman Belah-Dua, nilai K=2, iaitu ujian baru (sebenar) ialah 2 kali
ganda panjang/item ujian asal (separuh ujian sebenar) dan r= r .
C Sekiranya bilangan item ditambah menjadi 3 kali ganda, iaitu K=3, dan andaikan
r=0.60, maka indeks kebolehpercayaan menjadi:
C rSB = [Kr ] = [(3)(0.60)] = [1.80] = 1.80 = 1.80 = 0.82
C [1+ (K-1)r] [1+ (3-1)(0.60)] [1+ (2)(0.60)] [1+ (1.20)] 2.20
17-Aug-13 23
Kepantasan
C Sekiranya ujian dijalankan dalam masa yang terhad, kekurangan
masa boleh mengurangkan kebolehpercayaan skala.
C Masa mestilah cukup untuk responden untuk menjawab semua
item (Oncu 1994).
C Had dalam masa menyebabkan kegembiraan dan kecuaian,
kebolehpercayaan item berkurangan.
C Dalam kes kekurangan masa dalam menjawab ujian, jawapan
yang cuai akan diberikan dan yang akan menyebabkan
mendapatkan nilai hampir kepada sifar dalam indeks
kebolehpercayaan (Oncu 1994; Carey 1988; Traub 1994; Turgut
1993).
17-Aug-13 24
Sebaran Markat
CSebaran markat berbeza-beza
17-Aug-13 25
Kesukaran ujian
C Ujian yang terdiri daripada item-item yang mudah memberi peluang kepada
kebanyakan pelajar/calon untuk menjawab soalan dengan baik, yang
seterusnya akan memberikan skor yang hampir sama kepada pelajar/calon.
C Ini akan menghasilkan varians skor yang rendah disebabkan oleh skor yang
homogenus, yang seterusnya, menghasilkan indeks kebolehpercayaan
yang rendah.
C Bagi ujian yang terdiri daripada item-item yang sukar, skor pelajar/calon
akan menjadi agak berbeza/heterogenus.
C Ini akan menghasilkan varians skor yang besar dan seterusnya indeks
kebolehpercayaan yang tinggi.
C Kesimpulannya, ujian yang susah akan mewujudkan kumpulan yang
heterogenus, yang akan meningkatkan indeks kebolehpercayaan
17-Aug-13 26
Keobjektifan
Citem-item yang mempunyai jawapan yang lebih
objektif akan mempunyai indeks
kebolehpercayaan yang lebih tinggi
CSebaliknya, item-item yang mempunyai jawapan
yang lebih subjektif akan mempunyai indeks
kebolehpercayaan yang lebih rendah.
17-Aug-13 27
Kaedah penentuan
kebolehpercayaan
CUji-ulang-kaji
CUjian setara
CUjian bahagi dua
CKaedah Kuder-Richardson
CAntara pemeriksa dan antara
Cpemerhatian
17-Aug-13 28
Uji-Ulang-Uji
C Ukuran Kestabilan, yang juga dipanggil anggaran kebolehpercayaan uji-uji semula (test-
restest estimate of reliability) boleh dikira dengan memberikan ujian yang sama sekali lagi
kepada kumpulan pelajar yang sama selepas ujian pertama ditadbirkan, dan seterusnya,
mengira pekali korelasi Pearson antara dua/pasangan skor yang diperoleh setiap pelajar.
C Ukuran Kestabilan ini akan menggambarkan tahap keyakinan kepada kita untuk membuat
generalisasi skor yang akan diperoleh pelajar, sekiranya ujian ini diberi lagi sekali kepada
mereka pada masa akan datang.
C Bagaimanapun, Ukuran Kestabilan ini akan berbeza mengikut jarak masa dan
pengalaman/intervensi yang dilalui pelajar/calon antara dua pentadbiran ujian tersebut.
C Biasanya Ukuran Kestabilan adalah tinggi sekiranya jarak masa antara dua pentadbiran
ujian adalah pendek.
C Ini adalah disebabkan oleh, pertama, pelajar masih ingat jawapan kepada soalan-soalan
ujian, dan kedua, tidak ada pengalaman/intervensi (seperti latih-tubi, kelas tuisyen) antara
dua pentadbiran ujian ini
17-Aug-13 29
Ujian Setara
C Ukuran Kesetaraan [atau Ukuran Keselarian (parallel)] dikira dengan memberikan dua (2) ujian
yang berbeza tapi setara (kesamaan dari segi kandungan, Jadual Spesifikasi Ujian, format
soalan dan arahan menjawab serta min, varians dan interkorelasi skor) kepada kumpulan
pelajar dan hari yang sama, dan seterusnya, mengira pekali korelasi Pearson antara
dua/pasangan skor yang diperoleh setiap pelajar.
C Ukuran Kesetaraan ini akan menggambarkan tahap keyakinan kepada kita untuk membuat
generalisasi skor yang akan diperoleh pelajar, sekiranya mereka diberi ujian yang terdiri
daripada item-item lain yang setara dengan item-item ujian yang telah diberikan.
C Ujian yang setara ini penting sekiranya seseorang penyelidik enggan menggunakan soalan
yang sama sebagai ujian-pra dan ujian-pos (untuk mengelak daripada pelajar menghafal
jawapan).
C Dalam hal ini, dua ujian yang setara boleh digunakan, satu sebagai ujian-pra dan satu lagi
sebagai ujian-pos.
C Selain itu, ujian yang setara juga boleh digunakan untuk menguji dua kumpulan pelajar yang
berbeza pada berlainan masa.
17-Aug-13 30
Ujian Bahagi Dua
C Ukuran Ketekalan Dalaman Belah-Dua (r ) boleh dikira dengan
menggunakan korelasi Pearson (r) antara skor pelajar bagi separuh pertama
ujian dengan skor pelajar bagi separuh kedua ujian, yang boleh dikira
menggunakan rumus berikut:
r = [(xi-x)(yi -y)]
[nsxsy]
di mana:
ialah jumlah, xi ialah skor separuh pertama ujian, yi ialah skor separuh
kedua ujian; x ialah min skor separuh pertama ujian, y ialah min skor separuh
kedua ujian; n ialah bilangan pelajar, sx ialah sisihan piawai skor separuh
pertama ujian dan sy ialah sisihan piawai skor separuh kedua ujian.
C Bagaimanapun, ukuran yang diperoleh melalui kaedah belah-dua ini hanya
memberikan darjah ketakalan dalaman bagi separuh ujian sahaja. Untuk
17-Aug-13 31
Kaedah Kuder-Richardson
C Terdapat dua (2) kaedah Kuder-Richardson yang digunakan untuk mengira Ukuran
Ketekalan Dalaman bagi item yang berjawapan dikotomi (betul/salah), iaitu K-R 20 dan
K-R 21.
C K-R 20 digunakan sekiranya Indeks Kesukaran Item (p) berbeza bagi semua item,
dan K-R 21 digunakan sekiranya indeks ini sama bagi semua item.
C Bagaimanapun, rumus K-R 21 adalah lebih mudah digunakan oleh guru disebabkan
rumus ini tidak memerlukan banyak pengiraan.

K-R20 = k [1 - pq]
k 1 Sx2
K-R21 = k [1 - x(k-x)]
k 1 kSx2

17-Aug-13 32
C Rumus-rumus tersebut dijelaskan seperti berikut:
C di mana:
k ialah bilangan item dalam ujian, ialah jumlah, p ialah kadar
pelajar yang menjawab item dengan betul (Indeks Kesukaran
Item), q ialah kadar pelajar yang salah menjawab item (q= 1-p,
pq adalah varians skor item), x ialah min skor keseluruhan
item dan Sx 2 ialah ialah variance skor keseluruhan ujian.


17-Aug-13 33
Antara Pemeriksa & pemerhatian
C Kebolehpercayaan pemeriksa bermaksud ketekalan ukuran/skor yang diberikan oleh
dua atau lebih pemeriksa apabila memeriksa kertas jawapan yang sama (tetapi bukan
dalam ujian berbentuk objektif).
C Indeks Kebolehpercayaan Pemeriksa boleh dikira dengan memberikan jawapan
sekumpulan pelajar yang sama kepada dua/ lebih pemeriksa.
C Indeks Kebolehpercayaan Pemeriksa boleh dikira dengan mencari pekali korelasi
Pearson antara dua skor pemeriksa bagi setiap soalan; atau korelasi Spearman-Brown
antara jumlah skor/skor min pemeriksa bagi keseluruhan ujian.
C Kebolehpercayaan Pemeriksa ini akan memberikan tahap keyakinan untuk membuat
generalisasi bahawa skor yang diberikan oleh dua/lebih pemeriksa kepada pelajar
adalah sama.
C Kebolehpercayaan ini adalah penting untuk menyeragamkan pemberian markah,
apabila skrip/jawapan ujian diperiksa oleh ramai pemeriksa
17-Aug-13 34
17-Aug-13 35

Anda di sini diberi ilmu
Jangan disimpan di dalam dada
Makan minum tidur pun secara percuma

Ramai lagi guru ingin tahu
Anda semualah harapan saya
Balik nanti latihlah mereka
Sekian sahaja.
Home

You might also like