Professional Documents
Culture Documents
B
Baabb 77
K
KE
EU
UTTU
UH
HA
AN
ND
DA
AN
NK
KE
ES
SA
AH
HA
AN
N TTE
EK
KN
NIIK
KP
PE
EN
NTTA
AK
KS
SIIR
RA
AN
N
Di akhir bab ini, anda harus boleh:
7.1
7.2
7.3
7.4
Bab 1: Pengenalan
Bab 2: Memutuskan apa yang akan
ditaksir
Bab 3: Mentaksir Hasil Pembelajaran
Menggunakan Ujian Objectif
Bab 4: Mentaksir Hasil Pembelajaran
Menggunakan Ujian Karangan
Bab 5: Mentaksir Hasil Pembelajaran
Menggunakan Projek dan Amali
Bab 6: Mentaksir Hasil Pembelajaran
Menggunakan Pencerapan, Ujian
Lisan, dan Portfolio
Bab 7: Kebolehpercayaan dan Kesahan
Kaedah Pentaksiran
Bab 8: Analisis Item
Bab 9: Analisis Pemarkahan Ujian dan
Melaporkan Pentaksiran Pelajar
130
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
7.1 APAKAH ITU KEUTUHAN?
131
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
sekiranya mereka mengambil dua jenis pentaksiran yang berbeza? Soalan-soalan ini
berkait dengan konsistensi ujian anda dalam mengukur keupayaan, kemahiran dan
sikap atau nilai pelajar anda. Nama generik untuk konsistensi adalah keutuhan.
Keutuhan merupakan pelopor kepada ujian kesahan. Iaitu, sekiranya markah
ujian tidak boleh dijalankan dengan konsisten, mustahil untuk merumuskan bahawa
markah tersebut mengukur domain yang diperhatikan dengan tepat. Kesahan merujuk
kepada sejauhmana inferens yang dibuat daripada ujian dapat dijustifikasi dan tepat.
Sebagai contoh, sekiranya seorang pelajar gagal dalam sebuah ujian, adakah anda
pasti bahawa ia adalah kerana pelajar tidak mengetahui bahan atau adakah kerana
sebab-sebab lain.
Walau bagaimanapun, menentukan kesahan sesebuah ujian secara formal
boleh jadi suatu proses yang memerlukan tenaga dan mengambil masa. Dengan itu,
analisis keutuhan selalunya dianggap sebagai langkah pertama dalam proses ujian
keutuhan (Wells dan Wollack, 2003). Sekiranya sebuah ujian tidak utuh, kita tidak
perlu membuang masa menyiasat samada ia adalah sah kerana ia tentunya tida.
Sekiranya ujian itu mempunyai keutuhan, maka menyiasat kesahan ujian tersebut
boleh dilakukan.
6.1 AKTIVITI
132
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
dengan menggunakan item-item yang sama, markah-markah pelajar akan tidak jauh
berbeza. Keutuhan rendah bermaksud bahawa soalan-soalan tidak berkaitan diantara
satu sama lain daripada segi siapa yang menjawabnya dengan betul. Markah ujian
yang terhasil mencerminkan bahawa sesuatu tidak kena dengan item-item atau situasi
pengujian dan bukannya pengetahuan pelajar dalam mata pelajaran tersebut. Panduan
berikut boleh digunakan untuk menginterpretasi pekali keutuhan untuk ujian dalam
bilik darjah (lihat Jadual 7.1):
Keutuhan
0.90 dan ke atas
0.80 0.90
0.70 0.80
0.60 0.70
0.50 0.60
0.50 dan ke bawah
Interpretasi
Keutuhan yang cemerlang (sama seperti ujian
standard yang terbaik)
Sangat baik untuk ujian dalam bilik darjah
Baik untuk ujian dalam bilik darjah tetapi
terdapat beberapa item yang boleh diperbaiki
Agak rendah. Mungkin terdapat item-item
yang perlu dikeluarkan atau diperbaiki
Ujian perlu dikaji semula
Keutuhan yang boleh dipersoalkan dan ujian
harus digantikan ataupun perlukan rombakan
133
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
Uji-Uji Semula
Kaedah Untuk
Menganggar
Keutuhan
134
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
Bentuk Y
Gambarajah 7.3 Bentuk X dan Bentuk Y Ujian Serupa Tetapi Tidak Sama
SEMAK KENDIRI 7.1
Pecah-Separuh
Bagi menyelesaikan masalah terpaksa mentadbir dua ujian yang sama dua
kali, teknik pecah-separuh digunakan. Dalam teknik pecah-separuh,
sebuah ujian ditadbir sekali kepada sekumpulan pelajar. Ujian itu
dibahagikan kepada dua bahagian selepas pelajar selesai mengambil ujian.
Teknik ini paling sesuai untuk ujian yang memasukkan item aneka pilihan,
item betul-salah dan mungkin juga esei jawaban pendek. Item-item dipilih
mengikut kaedah genap-ganjil di mana separuh daripada ujian terdiri
daripada item-item bernombor genap manakala separuh lagi terdiri
daripada item-item bernombor ganjil. Seterusnya, markah yang diterima
untuk kedua-dua bahagian dikorelasi bagi menentukan keutuhan
keseluruhan ujian menggunakan pekali korelasi Spearman-Brown.
135
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
2rxy
rsb =
(1 + rxy)
Dalam formula ini, rsb adalah pekali keutuhan pecah-separuh, dan rxy
mewakili korelasi di antara kedua-dua bahagian. Misalnya, anda telah
menentukan bahawa pekali korelasi di antara dua bahagian adalah 0.65.
Apakah keutuhan keseluruhan ujian?
2rxy
2 (0.65)
rsb =
(1 + rxy)
(ii)
1.3
1 + 0.65
= 0.78
1.65
Alfa Cronbach
Alfa pekali Cronbach boleh digunakan untuk item-item jenis binari
(1 = betul, 0 = salah atau 1 = benar & 0 = salah) dan juga item-item skala
(1 = sangat setuju, 2 = setuju, 3 = tidak setuju, 4 = sangat tidak setuju).
Keutuhan dianggarkan dengan menghitung korelasi di antara individu
soalan dan sejauhmana individu soalan berkorelasi dengan keseluruhan
ujian. Inilah yang dimaksudkan dengan konsistensi internal. Kuncinya
adalah internal. Tidak seperti uji-uji semula dan bentuk serupa atau
selaras yang memerlukan sebuah ujian lain sebagai rujukan eksternal.
Lebih kukuh item-item berkait, lebih tinggi kemungkinan ujian tersebut
konsisten. Lebih tinggi alfa, lebih utuh ujian tersebut. Tidak ada pemisah
yang dipersetujui umum. Selalunya, 0.7 dan ke atas boleh diterima
(Nunnally, 1978). Formula untuk Alfa Cronbach adalah seperti berikut:
k
pi (1- pi)
k
Alfa Cronbach () =
i =1
1
k1
2x
Contohnya:
Andainya dalam sebuah ujian aneka pilihan yang terdiri daripada 5 item
atau soalan indeks kepayahan berikut untuk setiap item telah diperhatikan:
p1 = 0.4, p2 0.5, p3 = 0.6, p4 = 0.75 dan p5 = 0.85. Percanggahan sampel
(2x ) = 1.84. Alfa Cronbach dihitung seperti berikut:
5
1.045
136
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
1
51
= 0.54
1.840
137
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
7.4 KEUTUHAN INTER-PENANDA DAN INTRA-PENANDA
Dalam bab-bab terdahulu, kita telah membincangkan pentaksiran hasil
pembelajaran menggunakan esei, projek, amali, ujian lisan dan portfolio, yang adalah
sangat subjektif. Sebagai contoh, apabila menggunakan soalan esei untuk mentaksir
hasil pembelajaran anda terpaksa menggunakan tenaga manusia untuk memeriksa
jawaban kepada soalan-soalan tersebut. Apabila anda menggunakan tenaga manusia
sebagai sebahagian daripada prosedur pengukuran anda, anda perlu bimbang tentang
samada keputusan-keputusan yang anda terima adalah konsisten atau utuh. Orang
memang terkenal dengan tidak konsisten. Kita mudah diganggu. Kita menjadi letih
apabila membuat sesuatu tugasan secara berulang. Kita berkhayal. Kita kadang-kala
membuat interpretasi yang salah. Bagaimanakah kita dapat menentukan samada dua
orang membuat pemerhatian atau memberi markah semasa memeriksa kertas
peperiksaan dengan konsisten?
Bagaimanakah kita menentukan bahawa dua pemeriksa memeriksa kertas esei
dengan konsisten?
Bagaimanakah kita menentukan bahawa dua pemeriksa memeriksa sebuah
projek dengan konsisten?
A) Keutuhan Inter-Pemeriksa
Apabila dua atau lebih orang memeriksa sebuah soalan esei, sejauhmana mereka
bersetuju dalam markah yang diperuntukkan dipanggil keutuhan inter-pemeriksa.
Lebih tinggi persetujuan, lebih tinggilah keutuhan inter-pemeriksa.
Pemeriksa A
Pemeriksa B
138
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
Skema
pemarkahan ini
mengelirukan dan
aku dah lambat.
b) Keutuhan Intra-Pemeriksa
Sementara keutuhan inter-pemeriksa melibatkan dua atau lebih orang individu,
keutuhan intra-pemeriksa adalah konsistensi penggredan oleh satu orang pemeriksa.
Markah dalam sebuah ujian diperiksa oleh seorang pemeriksa pada ketika yang
berlainan. Apabila kita menggred sebuah ujian pada waktu yang berbeza, kita
mungkin menjadi tidak konsisten dalam penggredan kita disebabkan berbagai faktor.
Sebagai contoh, sesetengah kertas yang digred pada waktu siang mungkin mendapat
perhatian penuh manakala kertas lain yang digred di penghujung hari mungkin
diimbas dengan cepat. Sama juga keadaannya, perubahan dalam angin kita mungkin
mempengaruhi penggredan kertas. Dalam situasi-situasi ini, kurang konsisten
mungkin mempengaruhi keutuhan intra-pemeriksa dalam penggredan jawaban
pelajar.
SEMAK KENDIRI 7.2
139
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
7.5 KESAHAN
Kesahan konstruk
Jenis-jenis
Kesahan
Kesahan Kandungan
Kesahan Meramal
Kesahan Berkaitan
Kriteria
Kesahan Bersama
140
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
a) Kesahan Konstruk:
Kesahan konstruk berkait dengan bagaimana sebuah ujian merupakan ukuran
yang sesuai bagi konstruk yang mendasari. Sebuah konstruk mungkin suatu fenomena
seperti pencapaian matematik, kemahiran membaca peta, kefahaman bacaan, sikap
terhadap sekolah, pertimbangan induktif, kesedaran persekitaran, keupayaan mengeja
dan sebagainya. Anda dapat menganggap kesahan konstruk sebagai melabel,
adakah anda melabel sesuatu itu dengan betul? Contohnya, semasa anda mengukur
apa yang anda labelkan sebagai pemikiran kritis, adakah itu yang anda sebenarnya
mengukur?
Dengan itu, bagi memastikan kesahan konstruk yang tinggi, anda mesti jelas
tentang takrif konstruk yang anda ingin ukur. Contohnya, suatu konstruk seperti
kefahaman membaca mungkin termasuk pembinaan kosa kata, membaca untuk
maksud literal dan membaca untuk maksud inferensial. Ada pakar dalam pengukuran
pendidikan berhujah bahawa kesahan konstruk merupakan jenis kesahan yang paling
penting. Anda dapat menentukan kesahan konstruk sesebuah instrument dengan
mengkorelasikannya dengan sebuah ujian yang mengukur konstruk yang sama.
Sebagai contoh, anda boleh membandingkan markah yang diperolehi dalam ujian
kefahaman membaca dengan markah yang diperolehi dalam sebuah lagi ujian
kefahaman membaca yang diketahui, yang diberikan kepada sampel pelajar yang
sama. Sekiranya markah bagi kedua-dua ujian tersebut berkorelasi tinggi, maka anda
bolehlah merumuskan bahawa ujian kefahaman membaca anda mempunyai kesahan
konstruk yang tinggi.
Suatu konstruk ditentukan dengan merujuk kepada teori. Contohnya, sekiranya
anda berminat untuk mengukur konstruk harga diri, anda perlu jelas apa itu harga
diri. Kemungkinan, anda perlu merujuk pustaka dalam bidang yang menjelaskan ciriciri harga diri. Anda mungkin mendapati secara teori, harga diri terdiri daripada ciriciri berikut; harga diri fizikal, harga diri akademik dan harga diri sosial. Berdasarkan
kepada sudut pandang teori ini, anda dapat membina item-item atau soalan-soalan
bagi mengukur harga diri yang memasukkan ketiga-tiga jenis harga diri tadi. Melalui
proses seperti itu anda lebih meungkin dapat memastikan kesahan konstruk yang
tinggi.
SUKATAN
MATA PELAJARAN
Cahaya
Bunyi
Kepanasan
Magnetisma
Letrik
UJIAN
141
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
Gambarajah 7.5 Sampel Kandungan yang Diuji Bagi Unit Tentang Tenaga
dan Daya
b) Kesahan Kandungan:
Kesahan Kandungan lebih mudah dan mungkin berkait dengan kesahan
konstruk. Ia berkait dengan memasukkan kandungan yang sesuai dan diperlukan i.e.
adakah ujian memasukkan kemahiran-kemahiran yang diperlukan untuk prestasi yang
bagus, ataupun semua aspek mata pelajaran yang diajar? Ia berkaitan dengan
perwakilan populasi sampel; i.e. fakta, konsep dan prinsip yang diliputi oleh itemitem ujian harus mewakili domain yang besar (e.g. sukatan mata pelajaran) daripada
segi fakta, konsep dan prinsip.
Sebagai contoh, unit sains tentang Tenaga dan Daya mungkin memasukkan
fakta, konsep, prinsip dan kemahiran tentang cahaya, bunyi, kepanasan, magnetisma
dan letrik. Walau bagaimanapun, adalah sukar, kalaupun tidak mustahil, untuk
mentadbir sebuah ujian selama 2-3 jam untuk meliputi kesemua aspek-aspek dalam
sukatan mata pelajaran tentang Tenaga dan Daya (lihat Gambarajah 7.5). Dengan
itu, hanya fakta, konsep, prinsip dan kemahiran terpilih daripada sukatan pelajaran
(atau domain) disampelkan. Kandungan yang dipilih akan ditentukan oleh pakar
bidang yang akan mempertimbangkan keterkaitan kandungan dalam ujian kepada
kandungan dalam sukatan pelajaran atau domain tersebut.
Topik
Cahaya
Bunyi
Kepanasan
Magnetisma
Letrik
JUMLAH
Memahami
Konsep
7
7
7
3
8
Aplikasi
Konsep
4
4
4
3
3
Jumlah
11 (22%
11 (22%)
11 (22%)
6 (11%)
11 (22%)
32 (64%)
18 (36%)
50
Jadual 7.1 Jadual Spesifikasi Untuk Unit Tentang Tenaga dan Daya
Kesahan kandungan akan menjadi rendah sekiranya soalan-soalan dalam ujian
termasuk soalan yang menguji kandungan yang tidak berkait dengan domain atau
sukatan pelajaran. Bagi memastikan kesahan kandungan dan cakupan, ramai di antara
guru yang menggunakan Jadual Spesifikasi. Jadual 7.1 adalah suatu contoh jadual
spesifikasi yang mengkhususkan pengetahuan dan kemahiran yang akan diukur dan
topic-topik yang dimasukkan dalam unit tentang Tenaga dan Daya. Anda tidak boleh
mengukur semua kandungan dalam topic dan dengan itu anda terpaksa menumpukan
kepada bahagian-bahagian penting dan memberikannya pemberat yang sesuai kepada
bahagian-bahagian yang penting itu. Sebagai contoh, guru membuat keputusan
bahawa 64% daripada soalan-soalan akan menekankan pemahaman konsep sementara
36% akan menumpukan kepada aplikasi konsep untuk lima topik. Suatu jadual
142
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
spesifikasi memberi guru bukti bahawa ujian mempunyai kesahan kandungan yang
tinggi, bahawa ia mencakupi apa yang ia harus cakupi.
c) Kesahan Berkaitan Kriteria
Kesahan berkaitan kriteria sesebuah ujian ditentukan dengan mengaitkan markah
yang diperolehi kepada markah yang diperolehi untuk beberapa kriteria lain atau ujian
lain. Terdapat dua jenis kesahan berkaitan kriteria:
Kesahan Ramalan berkait dengan samada sebuah ujian dapat meramal
dengan tepat prestasi atau keupayaan masa hadapan. Adakah STPM suatu
peramal prestasi dalam universiti? Kesukaran dalam menghitung kesahan
ramalan bagi STPM ialah kerana hanya mereka yang lulus peperiksaan itu
yang akan meneruskan pelajaran ke universiti (secara umumnya) dan kita
tidak tahu sejauhmana baik pencapaian pelajar yang gagal (Wood, 1991). Dan
juga, hanya sebahagian kecil populasi yang mengambil STPM dan korelasi di
antara gred STPM dan prestasi di peringkat sarjana muda mungkin akan
tinggi.
Deale (1975) mencadangkan bahawa untuk membina ujian yang sah dan utuh, faktorfaktor berikut harus diambil kira:
a) Panjang Ujian
Secara umumnya lebih panjang ujian lebih utuh dan sah ujian tersebut. Sebuah
ujian yang pendek tidak mungkin merangkum kerja selama setahun. Sukatan
pelajaran perlu disampelkan. Ujian tersebut harus terdiri daripada cukup
soalan agar mewakili pengetahuan, kemahiran dan kecekapan dalam sukatan
pelajaran. Walau bagaimanapun, terdapat juga suatu lagi masalah dengan ujian
yang terlalu panjang. Sebuah ujian yang panjang mungkin sah tetapi ia akan
mengambil masa yang terlalu lama dan keletihan akan muncul dan
mempengaruhi prestasi serta keutuhan ujian tersebut.
b) Pemilihan Topik
Topik-topik yang dipilih dan soalan-soalan ujian yang disediakan harus
mencerminkan cara topic-topik diolah semasa pengajaran. Kita harus jelas
tentang hasil pembelajaran dan mereka bentuk item-item yang mengukur hasil
pembelajaran tersebut. Contohnya, dalam pengajaran anda pelajar tidak diberi
peluang berfikir secara kritis dan menyelesai masalah. Sebaliknya, ujian anda
143
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
terdiri daripada item-item yang memerlukan pelajar berfikir secara kritis dan
menyelesai masalah. Dalam situasi sebegini, keutuhan dan kesahan ujian itu
akan mendapat kesan.
c) Pilihan Teknik Pengujian
Teknik pengujian yang dipilih akan juga membawa kesan kepada kesahan dan
keutuhan ujian tersebut. Contohnya, sekiranya anda memilih untuk
menggunakan soalan esei, kesahan mungkin tinggi tetapi keutuhan mungkin
rendah. Soalan esei selalunya kurang utuh berbanding soalan jawaban pendek.
Esei berstruktur selalunya lebih utuh daripada esei terbuka.
d) Kaedah Mentadbir Ujian
Masa yang mencukupi harus diberi kepada kebanyakan pelajar untuk
menyudahkan ujian. Ini akan mengurangkan pelajar meneka membuta tuli dan
sebaliknya menggalakkan pelajar berfikir dengan teliti tentang jawaban.
Arahan perlu jelas bagi mengurangkan kesan kekeliruan terhadap keutuhan
dan kesahan. Keadaan fizikal dalam mana ujian diambil harus menyenangkan
pelajar. Harus ada cukup ruang, cahaya dan suhu yang bersesuaian. Pelajar
harus boleh kerja dengan berdikari dan kemungkinan gangguan dalam bentuk
pergerakan dan kebisingan mesti dijauhi.
e) Kaedah Memeriksa
Memeriksa haruslah seobjektif mungkin. Memeriksa bergantung kepada
penggunaan pertimbangan manusia seperti dalam esei, pemerhatian aktiviti
dalam bilik darjah dan amali, dan semua itu terbuka kepada kepelbagaian sifat
manusia. [Rujuk kepada keutuhan inter-pemeriksa yang dibincangkan lebih
awal]. Adalah mudah untuk memeriksa item objektif dengan cepat, tetapi
adalah juga mudah untuk membuat kesilapan yang remeh. Ini benar dalam
keadaan memeriksa bilangan skrip yang banyak. Suatu sistem semakan sangat
digalakkan. Satu kaedah ialah dengan mendapatkan komen daripada pelajar itu
sendiri setelah skripnya diperiksa.
7.7 HUBUNGKAIT ANTARA KEUTUHAN DAN KESAHAN
Ada yang menganggap bahawa keutuhan dan kesahan adalah dua konsep yang
berasingan. Hakikatnya, keutuhan dan kesahan adalah saling berkait. Trochim (2005)
menawarkan analogi berikut (lihat Gambarajah 7.6).
144
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
a) Utuh tetapi
tidak sah
b) Sah tetapi
tidak utuh
Pusat sasaran merupakan konsep yang kita cuba mengukur. Misalnya, sebagai
contoh, semasa cuba mengukur konsep pertimbangan induktif, anda
mungkin mengena pusat (atau pusat sasaran) sekiranya ujian Pertimbangan
Induktif anda adalah utuh dan sah, iaitu apa yang semua pembina ujian
sasarkan (lihat Gambarajah 7.6d).
Sebaliknya, ujian Pertimbangan Induktif anda mungkin utuh tetapi tidak sah.
Bagaimana mungkin? Ujian anda mungkin tidak mengukur pertimbangan
induktif tetapi markah yang anda dapat setiap kali anda mentadbir ujian
tersebut lebih kurang sama (lihat Gambarajah 7.6a). Dalam erti kata lain, ujian
tersebut adalah konsisten dan mengukur dengan sistematik konstruk yang
salah (i.e. pertimbangan induktif). Bayangkan kesan daripada membuat
keputusan tentang pertimbangan induktif pelajar menggunakan ujian seperti
itu!
Senario yang paling buruk adalah apabila ujian anda tidak utuh dan tidak sah
(lihat Gambarajah 7.6c). Dalam senario ini markah yang pelajar terima
tertumpu kepada separuh bahagian atas sasaran dan mereka dengan konsisten
tersasar daripada pusat. Pengukuran anda dalam kes ini tidak utuh dan tidak
sah, dan ujian tersebut harus ditolak atau diperbaiki.
145
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
RINGKASAN
Lebih tinggi keutuhan dan kesahan ujian anda, lebih kemungkinan anda akan
mengukur markah sebenar pelajar anda.
Dengan menggunakan teknik Uji-Uji Semula, ujian yang sama ditadbir sekali lagi
kepada pelajar yang sama.
Untuk teknik ini, dua ujian yang serupa (atau bentuk serupa) ditadbir kepada
kumpulan pelajar yang sama.
Konsistensi internal ditentukan menggunakan hanya satu ujian yang ditadbir satu
kali kepada pelajar.
Apabila dua atau lebih orang memeriksa soalan esei, sejauhmana terdapat
persetujuan dalam markah yang diperuntukkan dipanggil kutuhan inter-pemeriksa.
Kesahan konstruk berkait dengan samada ujian adalah cukup untuk mengukur
konstruk yang mendasari.
Ada yang menganggap keutuhan dan kesahan merupakan dua konsep yang
berasingan. Hakikatnya, keutuhan dan kesahan adalah saling berkaitan.
146
Bab 7: Keutuhan dan Kesahan Kaedah Pentaksiran
ISTILAH
PENTING
Markah sebenar
Keutuhan
- Uji uji semula
- bentuk-selaras
- konsistensi internal
Kesahan
- konstruk
- kandungan
- berkaitan kriteria
- meramal
RUJUKAN