Nota Ea BM

Machine Translated by Google
HPGD2303
Penilaian Pendidikan
Copyright © Open University Malaysia (OUM)

HPGD2303
PENDIDIKAN
PENILAIAN
Prof Dr John Arul Phillips

Edisi keempat 2021 (CS)

Edisi ketiga 2020
Edisi kedua 2017
Edisi pertama 2011
Dibangunkan oleh Pusat Reka Bentuk dan Teknologi Pengajaran, OUM.
Hak Cipta © Open University Malaysia (OUM), HPGD2303 Hak cipta

terpelihara. Tiada bahagian daripada karya ini boleh diterbitkan semula dalam apa jua bentuk atau dengan apa cara
sekalipun tanpa kebenaran bertulis daripada Presiden Open University Malaysia (OUM).
www.oum.edu.my

Isi kandungan
Panduan Kursus ixÿxix
Panduan Tugasan Kursus xxiaxxv
Topik 1 Peranan Pentaksiran dalam Pengajaran dan Pembelajaran 1

1.1 Ujian, Pengukuran, Penilaian dan Penilaian 1.2 Mengapa Kita 2
Menilai? 5
1.3 Prinsip Umum Penilaian 1.4 Jenis-jenis 10
Penilaian 1.4.1 Penilaian Formatif vs Sumatif 11

1.4.2 Ujian Rujukan Norma vs Rujukan Kriteria 1.5 Trend 11
Semasa dalam Ringkasan Pentaksiran Terma Utama 15
17
19
19
Topik 2 Asas untuk Pentaksiran: Apa yang Perlu Ditaksir 2.1 Apa 20
yang Perlu Dinilai 2.2 Tiga Jenis Hasil Pembelajaran 21
2.3 Menilai Hasil Pembelajaran Kognitif 2.4 Menilai 22
Hasil Afektif 2.5 Menilai Hasil Pembelajaran Psikomotor 24
Ringkasan Istilah Utama 30

35
40
41
Topik 3 Merancang Ujian Bilik Darjah 3.1 Tujuan 42

Ujian Bilik Darjah 3.2 Merancang Ujian Bilik 43
Darjah 3.2.1 Menentukan Tujuannya 3.2.2 44
Menentukan Objektif Pembelajaran 44
3.2.3 Membangunkan Spesifikasi Ujian 3.2.4 Memilih 45
Jenis Item Terbaik 3.2.5 Menyediakan Rubrik atau 45
Skema Pemarkahan 3.2.6 Menyediakan Item Ujian 49
3.3 Menilai Ringkasan Ujian Guru Sendiri Terma Utama 50

51
52
53
54

iv ÿ ISI KANDUNGAN
Topik 4 Membina Item Ujian Objektif 4.1 Apakah itu Ujian 55

Objektif? 56
4.2 Soalan Jawapan Pendek 4.3 57
Soalan Betul-Salah 60 4.3.1 Had Soalan Betul-Salah 61 4.3.2 Cadangan Pembinaan
Soalan Betul-Salah 62 4.4 Soalan Padanan 64 4.4.1 Kelebihan Soalan Padanan65
4. Soalan Padanan 4.4.3 Cadangan Menulis Soalan Padanan Yang Baik
66
67
4.5 Soalan Aneka pilihan 4.5.1 Bahagian 68
Soalan Aneka pilihan 4.5.2 Pembinaan Soalan Aneka 69
pilihan 4.5.3 Kelebihan dan Had MCQ 4.5.4 Membina MCQ 70
untuk Mengukur Pemikiran Aras Tinggi (HOT) 75

77
Ringkasan 81
Syarat Utama 82
Topik 5 Membina Soalan Esei 5.1 Apakah Soalan 83

Esei? 84
5.2 Jenis-jenis Karangan 85
5.3 Mengapakah Soalan Esei Digunakan? 86
5.4 Memutuskan Sama ada Menggunakan Esei Atau Soalan Objektif 5.5 87
Batasan Soalan Esei 5.6 Beberapa Kesalahpahaman tentang Soalan Esei 5.7 88
Beberapa Garis Panduan Membina Soalan Esei 5.8 Kata Kerja Menghuraikan 89
Pelbagai Jenis Tugasan Mental 5.9 Menanda Soalan Utama Esei 91

98
103
108
109
Topik 6 Pentaksiran Tulen 110

6.1 Apakah itu Penilaian Tulen? 111
6.1.1 Jenis-jenis Pentaksiran Tulen 6.1.2 Ciri-ciri 112

Pentaksiran Tulen 113
6.2 Bagaimana untuk Mencipta Penilaian Tulen? 115
6.2.1 Kelebihan Pentaksiran Tulen 6.2.2 Kritikan Terhadap 116
Pentaksiran Tulen 6.3 Perbezaan antara Pentaksiran 117
Tradisional dan Pentaksiran Tulen 118

ISI KANDUNGAN ÿ v
6.4 Alat Penilaian 6.4.1 Rubrik 121
Pemarkahan 6.4.2 Skala 122
Penilaian 6.4.3 Ringkasan 124

Senarai Semak Terma Utama 126
127
127
Topik 7 Penilaian Projek dan Portfolio 7.1 Penilaian Projek 128

7.1.1 Menilai Pelajar dengan Projek 7.1.2 129
Merekabentuk Projek Berkesan 7.1.3 Kemungkinan 132
Masalah dengan Kerja Projek 7.1.4 Kerja Kumpulan 135
dalam Projek 7.1.5 Menilai Kerja Projek 7.1.6 Proses 138
Penilaian dalam Projek 7.2 Penilaian Portfolio 139
140
145
149
7.2.1 Apakah itu Penilaian Portfolio? 150
7.2.2 Rasional untuk Penilaian Portfolio 7.2.3 Jenis 150
Portfolio 7.2.4 Cara Membangunkan Portfolio 7.2.5 151
Kelebihan dan Kelemahan Penilaian Portfolio 7.2.6 152
Bagaimana dan Bila Portfolio Perlu Ditaksir? 153
155
Terma Utama 158
Ringkasan 159
Topik 8 Kebolehpercayaan dan Kesahan Ujian 8.1 160

Apakah itu Kebolehpercayaan? 160
8.2 Pekali Kebolehpercayaan 8.3 Kaedah 162
untuk Menganggar Kebolehpercayaan Ujian 8.4 Kebolehpercayaan 165
Antara Penilai dan Intra Penilai 8.5 Jenis Kesahan 8.6 Faktor yang 169
Mempengaruhi Kebolehpercayaan dan Kesahan 8.7 Hubungan 171
antara Kebolehpercayaan dan Ringkasan Kesahan Terma Utama 175

176
178
179

vi ÿ ISI KANDUNGAN
Topik 9 Menilai Ujian Bilik Darjah dan Analisis Item 180

9.1 Apakah Analisis Item? 181
9.2 Langkah-langkah dalam 181
Analisis Item 9.3 Indeks Kesukaran 183
9.4 Indeks Diskriminasi 9.5 Aplikasi 185
Analisis Item pada Soalan jenis Esei 9.6 Hubungan antara Indeks 188
Kesukaran dan Diskriminasi 191
Indeks
9.7 Analisis Pengganggu 9.8 193
Pendekatan Praktikal untuk Analisis Item 9.9 194
Kegunaan Analisis Item kepada Guru 9.10 Awas dalam 196
Mentafsir Keputusan Analisis Item 9.11 Bank Item 9.12 Perisian 198
Psikometrik Ringkasan Terma Utama 199
200
201
202
Topik 10 Analisis dan Tafsiran Skor Ujian 10.1 Mengapa Kami 203
Menggunakan Statistik? 204
10.2 Menghuraikan Markah Ujian 206
10.3 Markah Piawai 10.4 Terma 214
Utama Ringkasan Keluk Biasa 218
219
220
Rujukan 221

PANDUAN KURSUS


Isi kandungan
Selamat datang ke HPGD2303 x
Apa yang Anda Akan Dapatkan daripada Kursus ini? x

Penerangan Kursus
Matlamat Kursus
Hasil Kursus
Bagaimana Anda boleh Mendapat Manfaat Terbaik daripada Kursus ini? xii
Panduan Susunan
Teks Sinopsis Kursus
Pakej Pembelajaran
Bagaimana Anda Akan Dinilai? xv
Apakah Sokongan yang Anda Akan Dapatkan dalam Mempelajari Kursus ini? xv
Seminar
myINSPIRE Sumber Perpustakaan
Fasilitator Perbincangan Dalam Talian
Bagaimana Anda harus Belajar untuk Kursus ini? xvi

Komitmen Masa untuk Mengkaji
Cadangan Strategi Kajian

x ÿ PANDUAN KURSUS
SELAMAT DATANG KE HPGD2303 EDUCATIONAL

PENILAIAN
Selamat datang ke HPGD2303 Penilaian Pendidikan, yang merupakan salah satu
kursus yang diperlukan untuk program Diploma Perguruan Lepasan Ijazah. Kursus ini
menganggap tiada pengetahuan sebelumnya tentang penilaian pendidikan tetapi anda
digalakkan untuk memanfaatkan pengalaman anda sebagai guru, pengajar, pensyarah
atau jurulatih dan mengaitkannya dengan prinsip penilaian yang dibincangkan. Kursus
ini bernilai 3 jam kredit dan harus dilindungi selama 8 hingga 15 minggu.
APA YANG ANDA AKAN DAPAT DARI KURSUS INI?
Penerangan Kursus
Kursus ini membincangkan perbezaan antara ujian, pengukuran dan penilaian atau
penilaian. Tumpuan diberikan kepada peranan penilaian dan diikuti dengan
perbincangan tentang „apa yang perlu dinilai‰, yang membentuk asas penilaian.
Berkenaan dengan „apa‰, penekanan adalah pada hasil kognitif, hasil afektif dan hasil
psikomotor. Topik seterusnya merangkumi aspek cara menilai dengan penekanan
kepada kemahiran berfikir aras tinggi. Selain ujian objektif dan esei biasa, teknik
penilaian autentik lain seperti projek dan portfolio dibentangkan. Turut dibincangkan
ialah teknik untuk menentukan keberkesanan pelbagai pendekatan penilaian yang
memberi tumpuan kepada kebolehpercayaan, kesahan dan analisis item. Akhir sekali,
pelbagai prosedur statistik asas dibentangkan dalam analisis keputusan penilaian dan
tafsirannya.
Matlamat Kursus
Matlamat utama kursus ini adalah untuk menyediakan pelajar asas mengenai prinsip
dan teori ujian dan penilaian pendidikan serta aplikasinya di dalam bilik darjah.

PANDUAN KURSUS ÿ xi
Hasil Pembelajaran Kursus

Pada akhir kursus ini, anda sepatutnya dapat melakukan perkara berikut:
1. Mengaplikasikan prinsip yang berbeza dalam pembangunan teknik penilaian untuk persekitaran
bilik darjah.
2. Rancang dan bina ujian bilik darjah yang berbeza untuk tujuan yang berbeza.
3. Melaksanakan ujian bilik darjah menggunakan statistik untuk menganalisis dan mentafsir penilaian
keputusan.
JADUAL PENGAJIAN
Ia adalah amalan OUM standard bahawa pelajar mengumpul 40 jam belajar untuk setiap jam kredit.
Oleh itu, untuk kursus 3 jam kredit, anda dijangka menghabiskan 120 jam belajar. Rajah 1
menunjukkan masa pembelajaran pelajar (SLT).
Rajah 1: Masa Pembelajaran Murid

xii ÿ PANDUAN KURSUS
BAGAIMANAKAH ANDA BOLEH MENDAPATKAN YANG TERBAIK

DARI KURSUS INI?
Pakej Pembelajaran
Dalam Pakej Pembelajaran ini anda dibekalkan dengan tiga jenis bahan kursus:
1. Panduan Kursus yang sedang anda baca;
2. Kandungan Kursus (terdiri daripada 10 topik);
3. Panduan Penilaian Kursus (yang menerangkan tugasan yang perlu dihantar dan peperiksaan
yang anda perlu duduki); dan
4. Platform Kursus Dalam Talian iaitu Perbincangan Dalam Talian myINSPIRE.
Sila pastikan anda mempunyai semua bahan ini dan url yang betul.
Sinopsis Kursus
Untuk membolehkan anda mencapai empat hasil kursus, kandungan kursus telah dibahagikan
kepada 10 topik. Hasil pembelajaran khusus dinyatakan pada permulaan setiap topik yang
menunjukkan perkara yang anda sepatutnya dapat capai selepas menyelesaikan setiap topik.
Topik Tajuk Minggu
1. Peranan Pentaksiran dalam Pengajaran dan Pembelajaran 1
2. Asas untuk Penilaian: Apa yang Perlu Dinilai 2ÿ3
3. Merancang Ujian Bilik Darjah 3
4. Membina Item Ujian Objektif 4ÿ5
5. Membina Ujian Esei 6ÿ7
6. Penilaian Tulen 8
7. Penilaian Projek dan Portfolio 8ÿ9
8. Kebolehpercayaan dan Kesahan Ujian 10
9. Menilai Ujian Bilik Darjah dan Analisis Item 11
10. Analisis dan Interpretasi Skor Pentaksiran 12

PANDUAN KURSUS ÿ xiii
Topik 1 membincangkan perbezaan antara ujian, pengukuran, penilaian dan penilaian, peranan penilaian
dalam pengajaran dan pembelajaran dan beberapa prinsip umum penilaian. Turut diterokai ialah perbezaan
antara penilaian formatif dan sumatif serta perbezaan antara ujian rujukan kriteria dan norma. Topik ini
diakhiri dengan perbincangan ringkas tentang trend semasa
dalam penilaian.
Topik 2 membincangkan tingkah laku yang akan diuji memfokuskan pada hasil pembelajaran kognitif,
afektif dan psikomotor serta sebab mengapa penilaian dua hasil yang terakhir diabaikan.
Topik 3 menyediakan beberapa garis panduan berguna untuk membantu guru merancang penilaian yang
sah, boleh dipercayai dan berguna. Perbincangan termasuk menentukan perkara yang hendak diukur dan
meminimumkan ketidakrelevanan pengukuran. Topik ini juga akan membimbing guru untuk merangka
strategi untuk mengukur domain dengan baik. Contoh Jadual Spesifikasi, jadual 2 hala dibentangkan.
Topik 4 membincangkan reka bentuk dan pembangunan ujian objektif dalam penilaian pelbagai jenis
tingkah laku dengan penekanan kepada batasan dan kelebihan menggunakan alat penilaian jenis ini.
Topik 5 mengkaji peranan ujian esei dalam menilai pelbagai jenis hasil pembelajaran serta batasan dan
kekuatannya, dan prosedur yang terlibat dalam reka bentuk soalan esei yang baik.
Topik 6 memperkenalkan satu bentuk penilaian di mana pelajar ditugaskan untuk melaksanakan tugas
dunia sebenar yang menunjukkan aplikasi bermakna pengetahuan dan kemahiran penting. Guru akan
dapat memahami bagaimanakah Pentaksiran Autentik serupa atau berbeza dengan Pentaksiran
Tradisional. Penekanan juga diberikan kepada rubrik pemarkahan.
Topik 7 membincangkan secara terperinci dua contoh penilaian autentik iaitu penilaian portfolio dan projek.
Garis panduan kepada penyertaan portfolio dan kerja projek dan kriteria penilaian dibincangkan secara
terperinci.
Topik 8 memberi tumpuan kepada konsep asas kebolehpercayaan dan kesahan ujian. Topik ini juga
termasuk kaedah untuk menganggarkan kebolehpercayaan sesuatu ujian dan faktor untuk meningkatkan
kebolehpercayaan dan kesahan sesuatu ujian.

xiv ÿ PANDUAN KURSUS
Topik 9 mengkaji konsep analisis item dan prosedur yang berbeza untuk mewujudkan
keberkesanan ujian objektif dan jenis esei yang memfokuskan kepada kesukaran item dan
diskriminasi item. Topik diakhiri dengan penerangan ringkas tentang bank item.
Topik 10 memberi tumpuan kepada analisis dan tafsiran data yang dikumpul oleh ujian.
Untuk analisis kuantitatif data, pelbagai prosedur statistik digunakan. Beberapa prosedur
statistik yang digunakan dalam tafsiran dan analisis keputusan penilaian ialah ukuran
kecenderungan memusat dan pekali korelasi.
Panduan Susunan Teks

Sebelum anda melalui modul ini, adalah penting untuk anda perhatikan susunan teks.
Memahami susunan teks akan membantu anda mengatur pengajian kursus ini dengan
cara yang lebih objektif dan berkesan. Secara amnya, susunan teks bagi setiap topik
adalah seperti berikut:
Hasil Pembelajaran: Bahagian ini merujuk kepada perkara yang perlu anda capai selepas
anda menyelesaikan topik sepenuhnya. Semasa anda meneliti setiap topik, anda harus
kerap merujuk kepada hasil pembelajaran ini. Dengan melakukan ini, anda boleh terus
mengukur pemahaman anda tentang topik tersebut.
Semakan Kendiri: Komponen modul ini disisipkan di lokasi strategik sepanjang modul. Ia
boleh disisipkan selepas satu subtopik atau beberapa subtopik.
Ia biasanya datang dalam bentuk soalan. Apabila anda menjumpai komponen ini, cuba
renungkan apa yang telah anda pelajari setakat ini. Dengan cuba menjawab soalan, anda
seharusnya dapat mengukur sejauh mana anda telah memahami subtopik. Selalunya,
jawapan kepada soalan boleh didapati terus daripada modul itu sendiri.
Aktiviti: Seperti Semak Kendiri, komponen Aktiviti juga diletakkan di pelbagai lokasi atau
persimpangan sepanjang modul. Komponen ini mungkin memerlukan anda menyelesaikan
soalan, meneroka kajian kes pendek atau menjalankan pemerhatian atau penyelidikan. Ia
mungkin memerlukan anda menilai senario tertentu. Apabila anda menjumpai Aktiviti, anda
harus cuba merenung apa yang telah anda kumpulkan daripada modul dan gunakannya
dalam situasi sebenar. Anda harus, pada masa yang sama, melibatkan diri anda dalam
pemikiran aras tinggi di mana anda mungkin diperlukan untuk menganalisis, mensintesis
dan menilai dan bukannya hanya perlu mengingat dan mentakrifkan.

PANDUAN KURSUS ÿ xv
Ringkasan: Anda akan menemui komponen ini pada akhir setiap topik. Komponen ini
membantu anda meringkas keseluruhan topik. Dengan melalui ringkasan, anda seharusnya
dapat mengukur tahap pengekalan pengetahuan anda. Sekiranya anda mendapati perkara
dalam ringkasan yang anda tidak faham sepenuhnya, adalah idea yang baik untuk anda
menyemak semula butiran dalam modul.
Istilah Utama: Komponen ini boleh didapati pada akhir setiap topik. Anda harus melalui
komponen ini untuk mengingatkan diri anda tentang istilah atau jargon penting yang
digunakan sepanjang modul. Sekiranya anda menemui istilah di sini yang tidak dapat anda
jelaskan, anda harus mencari istilah dalam modul.
Rujukan: Bahagian Rujukan ialah tempat senarai buku teks, jurnal, artikel, kandungan
elektronik atau sumber yang relevan dan berguna boleh ditemui. Senarai itu boleh muncul
di beberapa lokasi seperti dalam Panduan Kursus (di bahagian Rujukan), pada akhir setiap
topik atau di belakang modul. Anda digalakkan untuk membaca atau merujuk kepada
sumber yang dicadangkan untuk mendapatkan maklumat tambahan yang diperlukan dan
untuk meningkatkan pemahaman keseluruhan kursus anda.
BAGAIMANA ANDA AKAN DINILAI?
Kaedah Penilaian
Sila rujuk myINSPIRE.
APA SOKONGAN YANG ANDA AKAN DAPAT DALAM

MEMPELAJARI KURSUS INI?
Seminar
Terdapat 15 jam seminar atau interaksi bersemuka yang menyokong kursus.
Ini terdiri daripada empat hingga lima sesi seminar selama 3 jam setiap satu. Anda akan
dimaklumkan tentang tarikh, masa dan lokasi seminar ini bersama-sama dengan nama
dan nombor telefon tutor anda sebaik sahaja anda ditugaskan ke kumpulan tutorial.

xvi ÿ PANDUAN KURSUS
Perbincangan Dalam Talian MyINSPIRE
Selain sesi tutorial bersemuka, anda mendapat sokongan perbincangan dalam talian. Anda harus
berinteraksi dengan pelajar lain dan fasilitator anda menggunakan myINSPIRE. Penyertaan dan
sumbangan anda kepada perbincangan dalam talian akan meningkatkan pemahaman anda
tentang kandungan kursus, membimbing anda dalam tugasan serta persediaan untuk peperiksaan.
Fasilitator
Fasilitator anda akan menandakan tugasan anda dan membantu anda semasa kursus. Jangan
teragak-agak untuk berbincang semasa sesi tutorial atau dalam talian jika:
ÿ Anda tidak memahami mana-mana bahagian kandungan kursus atau yang diberikan
bacaan;
ÿ Anda menghadapi kesukaran dengan ujian kendiri dan aktiviti; atau
ÿ Anda mempunyai soalan atau masalah dengan tugasan.
Sumber Perpustakaan
Perpustakaan Digital mempunyai banyak koleksi buku dan jurnal yang boleh anda akses
menggunakan ID pelajar anda.
BAGAIMANAKAH ANDA PERLU BELAJAR UNTUK KURSUS INI?
1. Komitmen Masa untuk Belajar

Anda harus merancang untuk menghabiskan kira-kira enam hingga lapan jam setiap topik
membaca nota, melaksanakan ujian kendiri dan aktiviti serta merujuk kepada bacaan yang
dicadangkan. Anda juga mesti menjadualkan masa anda untuk mengambil bahagian
dalam perbincangan dalam talian. Selalunya lebih mudah untuk anda mengagihkan jam
dalam beberapa hari daripada menghabiskan satu hari penuh setiap minggu untuk belajar
anda. Sesetengah topik mungkin memerlukan lebih banyak kerja daripada yang lain, oleh
itu, adalah dicadangkan, secara purata, anda menghabiskan kira-kira tiga hari bagi setiap
topik.

PANDUAN KURSUS ÿ xvii
2. Cadangan Strategi Kajian

Berikut adalah cadangan strategi untuk bekerja melalui kursus. Jika anda menghadapi
sebarang masalah, bincangkannya dengan fasilitator anda sama ada dalam talian atau
semasa sesi seminar. Ingat, fasilitator ada untuk membantu anda.
(a) Langkah yang paling penting ialah membaca kandungan Panduan Kursus ini dengan teliti.
(b) Susun jadual belajar. Perhatikan masa yang anda dijangka luangkan untuk setiap topik
dan tarikh penyerahan tugasan serta tarikh seminar dan peperiksaan. Ini dinyatakan
dalam Panduan Penilaian Kursus anda. Catatkan semua maklumat ini di satu tempat
seperti diari anda atau kalendar dinding. Catat tarikh anda sendiri untuk mengerjakan
setiap topik. Anda mempunyai sedikit fleksibiliti kerana terdapat 10 topik yang tersebar
dalam tempoh 14 minggu.
(c) Sebaik sahaja anda telah mencipta jadual belajar anda sendiri, berusaha sedaya upaya
untuk „berpegang padanya‰. Sebab utama pelajar tidak dapat mengatasi adalah kerana
mereka ketinggalan dalam kerja kursus mereka.
(d) Untuk mula membaca topik:
ÿ Ingat bahawa dalam pembelajaran jarak jauh, banyak masa anda akan dibelanjakan
untuk MEMBACA kandungan kursus. Kaji senarai topik yang diberikan pada
permulaan setiap topik dan periksa hubungan topik dengan topik lain.
ÿ Baca hasil pembelajaran topik tersebut (apa yang diharapkan daripada anda).
Adakah anda sudah mengetahui beberapa perkara penting dalam topik tersebut?
Apakah perkara yang anda tidak tahu?
ÿ Baca pengenalan (untuk melihat bagaimana ia berhubung dengan yang sebelumnya

topik).
ÿ Bekerja melalui topik (kandungan topik disusun untuk

sediakan urutan untuk anda ikuti).

xviii ÿ PANDUAN KURSUS
ÿ Semasa anda menyelesaikan topik, anda akan diarahkan untuk melakukan ujian kendiri pada
selang masa yang sesuai sepanjang topik. Ini akan membolehkan anda mengetahui sama
ada anda memahami perkara yang baru anda baca.
ÿ Kerjakan aktiviti yang dinyatakan (untuk melihat sama ada anda boleh menggunakan konsep
yang dipelajari dalam situasi dunia sebenar).
(f) Apabila anda telah menyelesaikan topik tersebut, semak semula hasil pembelajaran untuk
mengesahkan bahawa anda telah mencapainya dan mampu melakukan apa yang diperlukan.
(g) Jika anda yakin, anda boleh meneruskan ke topik seterusnya. Teruskan topik demi topik melalui
kursus dan cuba mempercepatkan kajian anda supaya anda mengikut jadual yang dirancang.
(h) Selepas menyelesaikan semua topik, semak semula kursus dan sediakan diri anda untuk
peperiksaan akhir. Semak bahawa anda telah mencapai semua topikÊ hasil pembelajaran dan
objektif kursus (disenaraikan dalam Panduan Kursus ini).
MAKLUMAN AKHIR
Sekali lagi, selamat datang ke kursus. Untuk memaksimumkan keuntungan anda daripada kursus ini, anda
harus cuba pada setiap masa untuk mengaitkan perkara yang anda pelajari dengan dunia sebenar. Lihatlah
persekitaran dalam organisasi anda dan tanya diri anda sama ada idea yang dibincangkan terpakai. Kebanyakan
idea, konsep dan prinsip yang anda pelajari dalam kursus ini mempunyai aplikasi praktikal. Adalah penting
untuk menyedari bahawa kebanyakan perkara yang kita lakukan dalam pendidikan dan latihan mestilah
berdasarkan asas teori yang kukuh.
Kandungan kursus ini hanya membincangkan prinsip asas dan konsep pentaksiran dalam pendidikan. Anda
dinasihatkan untuk melangkaui kursus dan teruskan dengan banyak belajar sendiri untuk meningkatkan lagi
pengetahuan anda tentang pendidikan
penilaian.
Kami berharap anda berjaya dengan kursus ini dan berharap anda akan mendapati ia menarik, berguna dan
relevan dalam pembangunan anda sebagai seorang profesional. Kami berharap anda akan menikmati
pengalaman anda dengan OUM dan kami ingin mengakhiri dengan pepatah oleh Confucius ÿ „Pendidikan
tanpa berfikir adalah hilang tenaga‰.

PANDUAN TUGASAN KURSUS


Isi kandungan
pengenalan xxii
Penulisan Akademik xxii
(a) Plagiarisme
(b) Mendokumentasikan Sumber
(i) Apakah Plagiarisme?
(ii) Bagaimanakah Saya Boleh Mengelakkan Plagiarisme?
• Petikan Langsung
• Petikan Tidak Langsung
• Petikan pihak ketiga
(c) Rujukan
• Artikel Jurnal
• Jurnal Dalam Talian
• Laman web
• Buku
• Artikel dalam Buku
• Akhbar Bercetak
Butiran tentang Tugasan xxvi

xxii ÿ PANDUAN TUGASAN KURSUS
PENGENALAN
Panduan ini menerangkan asas di mana anda akan dinilai dalam kursus ini pada semester tersebut. Ia
mengandungi butiran tugasan yang ditanda fasilitator, peperiksaan akhir dan penyertaan yang diperlukan
untuk kursus.
Satu elemen dalam strategi penilaian kursus ialah semua pelajar dan fasilitator harus diberikan maklumat
yang sama tentang bagaimana pelajar akan dinilai. Oleh itu, panduan ini juga mengandungi kriteria
pemarkahan yang akan digunakan oleh fasilitator dalam menilai kerja anda.
Sila baca keseluruhan panduan. Ia perlu dibaca pada permulaan kursus.
PENULISAN AKADEMIK
(a) Plagiarisme
(i) Apakah Plagiarisme?

Sebarang tugasan bertulis (esei, projek, ujian bawa pulang dan lain-lain) yang diserahkan
oleh pelajar tidak boleh menipu berkenaan dengan kebolehan, pengetahuan atau jumlah
kerja yang disumbangkan oleh pelajar.
Terdapat banyak cara peraturan ini boleh dilanggar. Antaranya ialah:
Parafrasa Hujah pengarang yang beralasan rapat diparafrasa tetapi pelajar tidak mengakui berbuat
demikian. (Jelas sekali, semua pengetahuan kita diperolehi dari suatu tempat tetapi
hujah terperinci daripada sumber yang boleh dikenal pasti dengan jelas mesti diakui.)
Plagiarisme Bahagian besar kertas hanya disalin daripada sumber lain dan bahagian yang
secara terang-terangan disalin tidak diiktiraf sebagai petikan.
Lain-lain Ini selalunya termasuk esei yang ditulis oleh pelajar lain atau dijual oleh organisasi
sumber yang tidak bertanggungjawab. Petikan daripada kertas tersebut adalah sah jika
tanda petikan digunakan dan sumbernya disebut.
Kerja oleh Mengambil kredit dengan sengaja atau tidak sengaja untuk karya yang dihasilkan
orang lain oleh orang lain tanpa memberikan pengakuan yang sewajarnya.
Kerja-kerja ini termasuk gambar, carta, graf, lukisan, statistik, klip video, klip audio,
pertukaran lisan seperti temu bual atau kuliah, persembahan di televisyen dan teks
yang dicetak di Web.
Penduaan Pelajar menghantar esei yang sama untuk dua atau lebih kursus.

PANDUAN TUGASAN KURSUS ÿ xxiii
(ii) Bagaimanakah Saya Boleh Mengelakkan Plagiarisme?
• Masukkan tanda petikan untuk „salin dan tampal‰ klausa, frasa, ayat dan
perenggan, dan nyatakan sumber asal;
• Menghuraikan klausa, frasa, ayat atau perenggan dengan perkataan anda sendiri
dan sebutkan sumber anda;
• Patuhi format gaya APA (American Psychological Association), yang mana

berkenaan, apabila memetik sumber dan semasa menulis bibliografi atau
halaman rujukan;
• Cuba untuk menulis secara bebas tanpa terlalu bergantung kepada maklumat
daripada karya asal orang lain; dan
• Didik diri anda tentang perkara yang boleh dianggap sebagai pengetahuan umum
(tidak perlu hak cipta), domain awam (hak cipta telah tamat tempoh atau tidak
dilindungi di bawah undang-undang hak cipta) atau hak cipta (dilindungi secara
sah).
(b) Mendokumentasikan Sumber

Setiap kali anda memetik, menghuraikan, meringkaskan atau merujuk kepada karya
orang lain, anda dikehendaki memetik dokumentasi sumber asalnya. Ditawarkan di sini
adalah beberapa bentuk bahan yang paling biasa disebut.
• Petikan Langsung Sekadar mempunyai kemahiran berfikir bukanlah jaminan

bahawa kanak-kanak akan menggunakannya. Untuk membolehkan
kemahiran tersebut menjadi sebahagian daripada tingkah laku seharian,

mereka mesti dipupuk dalam persekitaran yang menghargai dan mengekalkan
mereka. „Sama seperti kemahiran muzik kanak-kanak berkemungkinan besar

terbiar dalam persekitaran yang tidak menggalakkan
muzik, kemahiran berfikir pelajar cenderung merosot dalam
budaya yang tidak menggalakkan pemikiran‰ (Tishman,
Perkins & Jay, 1995, hlm. 5).
• Petikan Tidak Langsung Menurut Wurman (1988), penyakit baru yang

Abad ke-21 akan menjadi kebimbangan maklumat, yang telah
telah ditakrifkan sebagai jurang yang semakin melebar antara
apa yang difahami dan apa yang difikirkan
patut faham.

xxiv ÿ PANDUAN TUGASAN KURSUS
(c) Rujukan
Semua sumber yang anda sebutkan dalam kertas kerja anda hendaklah Rujukan
disenaraikan dalam bahagian di penghujung kertas anda. Berikut ialah cara anda harus
menyenaraikan rujukan anda:
Artikel Jurnal DuFour, R. (2002). Pengetua berpusatkan pembelajaran:

Kepimpinan Pendidikan, 59 (8). 12ÿ15.
Jurnal Dalam Talian Evnine, SJ (2001). Kesejagatan logik: Mengenai hubungan

antara rasional dan keupayaan logik [Versi elektronik].
Ingat 110
, , 335ÿ367.
Laman sesawang Perkhidmatan Taman Negara. (2003, 11 Februari).

Bersejarah Negara Tempat Lahir Abraham Lincoln
Tapak. Diperoleh pada 13 Februari 2003, daripada http://
www.nps.gov/abli/
Buku Naisbitt, J., & Aburdence, M. (1989). Aliran Mega 2000 .

London, England: Pan Books.
Artikel dalam a Nickerson, R. (1987). Mengapa mengajar berfikir? Di JB

Buku Baron & RJ Sternberg (Eds.). Mengajar berfikir
kemahiran: Teori dan pr berlakon. New York, NY: WH
Freeman dan Syarikat. 27ÿ37.
Dicetak Holden, S. (1998, 16 Mei). Frank Sinatra meninggal dunia pada usia 82 tahun:
surat khabar Penggaya pop yang tiada The New York Times ,
tandingan. ms A1, A22ÿA23.
BUTIRAN TENTANG TUGASAN

Tugasan Bertanda Fasilitator (FMA)
Anda akan dapat menyiapkan tugasan daripada maklumat dan bahan yang terkandung dalam
cadangan bacaan dan kandungan kursus anda. Walau bagaimanapun, adalah wajar dalam
semua pendidikan peringkat siswazah untuk menunjukkan bahawa anda telah membaca dan
menyelidik lebih meluas daripada minimum yang diperlukan. Menggunakan rujukan lain akan
memberi anda perspektif yang lebih luas dan mungkin memberikan pemahaman yang lebih
mendalam tentang subjek tersebut. Apabila anda telah menyelesaikan tugasan, serahkannya
bersama-sama dengan borang FMA kepada fasilitator anda. Pastikan tugasan anda sampai
kepada fasilitator pada atau sebelum tarikh akhir.

PANDUAN TUGASAN KURSUS ÿ xxv
Kriteria Umum untuk Penilaian FMA

Secara umum, fasilitator anda akan mengharapkan anda menulis dengan jelas, menggunakan ejaan yang
betul (sila gunakan penyemak ejaan anda) dan tatabahasa. Fasilitator anda akan mencari perkara berikut:
• Anda telah berfikir secara kritis tentang isu yang dibangkitkan dalam kursus;
• Anda telah mempertimbangkan dan menghargai pelbagai sudut pandangan termasuk

mereka dalam kursus;
• Anda memberikan pandangan dan pendapat anda sendiri;
• Anda menyatakan hujah-hujah anda dengan jelas dengan bukti-bukti sokongan dan wajar
rujukan sumber; dan
• Anda telah mengambil daripada pengalaman anda sendiri.

xxvi ÿ PANDUAN TUGASAN KURSUS

Topik ÿ Peranan
Penilaian dalam
1 Pengajaran dan
Pembelajaran
HASIL PEMBELAJARAN
Pada akhir topik ini, anda seharusnya dapat:
1. Bezakan antara ujian, pengukuran, penilaian dan
penilaian;
2. Menjelaskan peranan pentaksiran dalam pengajaran dan pembelajaran;
3. Menerangkan prinsip umum pentaksiran;

4. Bezakan antara penilaian formatif dan sumatif; dan
5. Wajarkan apabila ujian rujukan norma dan rujukan kriteria
diterima pakai.
ÿ PENGENALAN
Topik ini membincangkan perbezaan antara ujian, pengukuran, penilaian dan penilaian, peranan
penilaian dalam pengajaran dan pembelajaran, dan beberapa prinsip umum penilaian. Turut
diterokai ialah perbezaan antara penilaian formatif dan sumatif serta perbezaan antara ujian
rujukan kriteria dan norma. Topik ini diakhiri dengan perbincangan ringkas mengenai trend semasa
dalam penilaian.

2 ÿ TOPIK 1 PERANAN PENTAKSIRAN DALAM PENGAJARAN DAN PEMBELAJARAN
Bolehkah anda membezakan antara ujian, pengukuran, penilaian dan penilaian

(lihat Rajah 1.1)?
Rajah 1.1: Bolehkah anda membezakan antara ujian, pengukuran, dan penilaian
dan penilaian?
1.1 UJIAN, PENGUKURAN, PENILAIAN

DAN PENILAIAN
Tidak hairanlah ramai orang keliru dengan perbezaan asas antara ujian,
pengukuran, penilaian dan penilaian kerana ia digunakan dalam pendidikan.
Penjelasan berikut tentang konsep ini akan membantu menjelaskan kekeliruan.
(a) Ujian
Kebanyakan orang biasa dengan ujian kerana kita semua, pada satu ketika dalam hidup
kita, telah mengambil beberapa bentuk ujian. Di sekolah, ujian diberikan untuk mengukur
kebolehan akademik kita dan secara tidak langsung untuk menilai sama ada kita telah
mendapat daripada pengajaran oleh guru. Di tempat kerja, ujian dijalankan untuk memilih
orang yang sesuai untuk pekerjaan tertentu, ujian digunakan sebagai asas untuk kenaikan
pangkat pekerjaan dan ujian digunakan untuk menggalakkan pembelajaran semula. pakar perubatan,

TOPIK 1 PERANAN PENTAKSIRAN DALAM PENGAJARAN DAN PEMBELAJARAN ÿ 3
peguam, perunding insurans, ejen hartanah, jurutera, penjawat awam dan banyak lagi
profesion lain dikehendaki mengambil ujian untuk menunjukkan kecekapan mereka dalam
bidang tertentu dan dalam beberapa kes untuk dilesenkan untuk mengamalkan profesion
atau perdagangan mereka.
Sepanjang kerjaya profesional mereka, guru, kaunselor dan pentadbir sekolah dikehendaki
menjalankan, menskor dan mentafsir pelbagai jenis ujian. Sebagai contoh, pentadbir
sekolah menilai prestasi guru individu dan kaunselor sekolah merekodkan prestasi klien
mereka. Ada kemungkinan seorang guru boleh membina, mentadbir dan menilai beribu-
ribu ujian semasa kerjayanya!
Item ujian boleh ditulis dalam pelbagai format termasuk soalan aneka pilihan, padanan,
benar atau salah, jawapan pendek dan esei. Format ini berbeza dalam kekuatan dan
kelemahan. Tiada satu format yang sesuai untuk semua keadaan.
Menurut jawatankuasa bersama American Psychological

Persatuan (APA), Persatuan Penyelidikan Pendidikan Amerika
(AERA) dan Majlis Pengukuran dalam Pendidikan Kebangsaan (NCME),
Ujian boleh dianggap sebagai satu set tugasan atau soalan yang bertujuan untuk
menimbulkan jenis tingkah laku tertentu apabila dibentangkan dalam keadaan piawai
dan untuk menghasilkan skor yang akan mempunyai sifat psikometrik yang diingini
(1974).
Walaupun kebanyakan orang tahu apa itu ujian, ramai yang mengalami kesukaran
membezakan antara pengukuran, penilaian dan penilaian. Ada juga yang berpendapat
bahawa mereka serupa!
(b) Pengukuran
Pengukuran ialah tindakan memberikan nombor kepada fenomena. Dalam pendidikan, ia
adalah proses di mana sifat-sifat seseorang diukur dan diberi nombor. Ingat ia adalah satu
proses, menunjukkan terdapat langkah-langkah tertentu yang terlibat!
Sebagai pendidik, kita sering mengukur sifat-sifat manusia seperti sikap, pencapaian
akademik, kebolehan, minat, keperibadian dan sebagainya.
Oleh itu, untuk mengukur kita perlu menggunakan instrumen tertentu supaya kita boleh
membuat kesimpulan bahawa Ahmad lebih baik dalam matematik berbanding Kumar
manakala Tajang lebih positif terhadap sains berbanding Kong Beng. Kami mengukur
untuk mendapatkan maklumat tentang „apa itu‰. Maklumat sedemikian mungkin atau mungkin tidak

berguna bergantung pada ketepatan instrumen yang kita gunakan dan kemahiran kita
menggunakannya. Sebagai contoh, kita mengukur suhu menggunakan termometer,
dan termometer ialah alat yang digunakan.
Bagaimanakah anda mengukur prestasi dalam matematik, contohnya? Kami

menggunakan ujian matematik yang merupakan instrumen yang mengandungi soalan
dan masalah untuk diselesaikan oleh pelajar. Bilangan jawapan yang betul yang
diperolehi merupakan petunjuk prestasi individu pelajar dalam matematik.
Ambil perhatian bahawa kami hanya mengumpul maklumat. Kami tidak menilai!
Oleh itu, penilaian agak berbeza daripada pengukuran.
(c) Penilaian dan Penilaian

Literatur telah menggunakan istilah „penilaian‰ dan „penilaian‰ dalam pendidikan
sebagai dua konsep yang berbeza. Penilaian ialah proses membuat pertimbangan
berdasarkan kriteria dan bukti. Penilaian ialah proses mendokumentasikan
pengetahuan, kemahiran, sikap dan kepercayaan, biasanya dari segi yang boleh
diukur. Matlamat penilaian adalah untuk membuat penambahbaikan berbanding hanya
dinilai. Dalam konteks pendidikan, penilaian ialah proses menghuraikan, mengumpul,
merekod, menskor dan mentafsir maklumat tentang pembelajaran. Kedua-dua istilah
itu juga digunakan secara bergantian.
Sebagai contoh, sesetengah pengarang menggunakan istilah „penilaian formatif‰

manakala yang lain menggunakan istilah „penilaian formatif‰. Kami akan menggunakan
kedua-dua istilah secara bergantian kerana terdapat terlalu banyak pertindihan dalam
tafsiran kedua-dua konsep. Secara umumnya, penilaian dilihat sebagai proses
mengumpul maklumat dengan tujuan membuat keputusan tentang pelajar.
Kami mungkin mengumpul maklumat menggunakan pelbagai ujian, pemerhatian

pelajar dan temu bual. Rowntree (1974) melihat penilaian sebagai,
Pertemuan manusia di mana seseorang berinteraksi dengan orang lain secara

langsung atau tidak langsung dengan tujuan mendapatkan dan mentafsir
maklumat tentang pengetahuan, pemahaman, kebolehan dan sikap yang dimiliki
oleh seseorang itu.
Sebagai contoh, berdasarkan maklumat penilaian kita boleh menentukan sama ada
Chee Keong memerlukan perkhidmatan khas untuk membantunya mengembangkan
kemahiran membacanya atau sama ada Khairul yang telah dikenal pasti sebagai
kanak-kanak disleksia memerlukan perhatian khusus. Kata kunci dalam definisi
penilaian ialah mengumpul data dan membuat keputusan. Oleh itu, untuk membuat
keputusan seseorang perlu menilai, iaitu proses membuat pertimbangan, tentang
situasi tertentu.

Apabila kita menilai, kita mengatakan bahawa sesuatu itu baik, sesuai, sah atau positif, sebagai contoh.
Untuk membuat penilaian, kita memerlukan maklumat dan maklumat diperoleh dengan mengukur
menggunakan instrumen yang boleh dipercayai.
Sebagai contoh, anda mengukur suhu di dalam bilik darjah dan ia adalah 30 darjah Celsius, yang
merupakan maklumat semata-mata. Sesetengah pelajar mungkin mendapati suhu terlalu panas untuk
pembelajaran manakala yang lain mungkin mengatakan bahawa ia sesuai untuk pembelajaran. Pada
satu ketika pada siang hari, kami sedang menilai sesuatu atau seseorang!
Pendidik sentiasa menilai pelajar. Ini biasanya dilakukan berbanding dengan beberapa piawaian.
Sebagai contoh, jika objektif pelajaran adalah untuk pelajar menggunakan Undang-undang BoyleÊs
untuk menyelesaikan masalah dan 80 peratus pelajar dapat menyelesaikan masalah itu, maka guru
boleh membuat kesimpulan bahawa pengajaran prinsip itu agak berjaya. Oleh itu, penilaian ialah
perbandingan apa yang diukur terhadap beberapa kriteria yang ditetapkan dan untuk menentukan sama
ada ia telah dicapai, sama ada ia sesuai, sama ada ia baik, sama ada ia munasabah, sama ada ia sah
dan sebagainya.
1.2 KENAPA KITA MENILAI?

Mari kita mulakan dengan bertanya soalan, „Mengapa kita, sebagai pendidik, menilai pelajar?‰ Sesetengah
daripada kita mungkin mendapati soalan itu agak pelik. Yang berikut mungkin merupakan tindak balas yang
berkemungkinan:
Soalan : Mengapa anda menilai?
Jawapan : Baik, saya menilai untuk mengetahui sama ada pelajar saya faham apa yang telah diajar.
Soalan : Apakah yang anda maksudkan dengan „faham‰?
Jawapan : Sama ada mereka boleh ingat apa yang saya ajar dan mampu menyelesaikan masalah.
Soalan : Apa yang anda lakukan dengan keputusan ujian?
Jawapan : Baiklah, saya menyediakan jawapan yang betul kepada pelajar dan menunjukkan kesilapan
yang dilakukan semasa menjawab soalan.
Perkara di atas boleh menjadi alasan yang diberikan oleh pendidik apabila ditanya tentang tujuan penilaian.
Dalam konteks pendidikan, penilaian dilakukan untuk mendapatkan pemahaman tentang kekuatan dan
kelemahan seseorang individu untuk membuat keputusan pendidikan yang sesuai. Keputusan pendidikan
terbaik adalah berdasarkan

maklumat dan keputusan yang lebih baik biasanya berdasarkan lebih banyak maklumat
(Salvia & Ysseldyke, 1995). Berdasarkan alasan penilaian yang diberikan oleh Harlen
(1978) dan Deale (1975), dua sebab utama dikenal pasti (rujuk Rajah 1.2).
Rajah 1.2: Tujuan penilaian
Berkenaan dengan pembelajaran, penilaian bertujuan untuk menyediakan maklumat

yang akan membantu membuat keputusan mengenai pemulihan, pengayaan, pemilihan,
kekhususan, kemajuan dan pensijilan. Berkenaan dengan pengajaran, pentaksiran
menyediakan maklumat mengenai pencapaian objektif, keberkesanan kaedah pengajaran
dan bahan pembelajaran.
(a) Menilai untuk Membantu Pembelajaran

Mari kita lihat aspek penilaian berikut yang dapat membantu pembelajaran:
(i) Diagnosis
Penilaian atau penilaian diagnostik dilakukan pada permulaan pelajaran
atau unit untuk bidang mata pelajaran tertentu untuk menilai kesediaan dan
latar belakang pelajar untuk perkara yang akan diajar. Penilaian pra
pengajaran ini dilakukan apabila anda memerlukan maklumat tentang pelajar
tertentu, kumpulan pelajar atau keseluruhan kelas sebelum anda boleh
meneruskan kaedah pengajaran yang paling berkesan. Sebagai contoh,
anda boleh mentadbir Ujian Membaca kepada murid Tahun Satu untuk
menilai tahap bacaan mereka. Berdasarkan maklumat, anda mungkin ingin
menetapkan pembaca yang lemah untuk campur tangan khas atau tindakan
pemulihan. Sebaliknya, ujian mungkin mendedahkan bahawa sesetengah
pelajar membaca pada tahap yang sangat tinggi dan anda mungkin ingin
mengesyorkan agar mereka ditugaskan ke program pengayaan (rujuk Jadual 1.1).

Jadual 1.1: Tujuan Pentaksiran: Untuk Membantu Pembelajaran
Untuk membantu
Soalan yang Perlu Dijawab
Pembelajaran
Diagnosis untuk • Perlukah murid dihantar ke kelas pemulihan supaya kesukaran dalam
tindakan pemulihan pembelajaran dapat diatasi?
Diagnosis untuk • Perlukah murid dibekalkan dengan aktiviti pengayaan?

pengayaan
Keistimewaan • Adakah murid tersebut mempunyai keperluan pembelajaran khas yang

memerlukan bantuan pendidikan khas?
Pemilihan • Patutkah pelajar disalurkan ke kelas X atau Y?
Kemajuan • Sejauh manakah kemajuan pelajar ke arah matlamat pengajaran

tertentu?
Komunikasi • Bagaimanakah keadaan anak di sekolah dan bagaimanakah ibu bapa

kepada ibu bapa boleh membantu?
Pensijilan • Apakah kekuatan dan kelemahan dalam prestasi keseluruhan pelajar

dalam bidang tertentu yang dinilai?
Pentadbiran dan • Bagaimanakah prestasi sekolah berbanding sekolah lain?

kaunseling
• Mengapakah pelajar perlu dirujuk kepada kaunseling?
(ii) Penilaian
Exceptionality juga dijalankan untuk membuat keputusan tentang exceptionality.
Berdasarkan maklumat yang diperoleh daripada penilaian, guru boleh membuat
keputusan sama ada pelajar tertentu perlu ditugaskan ke kelas dengan pelajar
luar biasa. Pelajar luar biasa ialah pelajar yang berbeza dari segi fizikal, mental,
emosi atau tingkah laku daripada populasi normal. Sebagai contoh, berdasarkan
maklumat penilaian, kanak-kanak yang didapati mengalami disleksia boleh
ditugaskan untuk rawatan khas atau pelajar yang telah disahkan kurang upaya
pembelajaran boleh ditugaskan untuk pendidikan khas.
(iii) Pensijilan
Pensijilan mungkin sebab paling penting untuk penilaian. Sebagai contoh, Sijil
Pelajaran Malaysia (SPM) adalah peperiksaan yang bertujuan untuk
menyediakan sijil kepada pelajar. Markah yang diperoleh ditukar kepada gred
huruf yang menandakan tahap prestasi dalam pelbagai bidang mata pelajaran
dan digunakan sebagai asas perbandingan antara pelajar.
Sijil yang diperolehi selanjutnya digunakan untuk memilih pelajar untuk
melanjutkan pelajaran, biasiswa atau pekerjaan.
(iv) Penempatan
Selain pensijilan, penilaian juga dijalankan untuk tujuan penempatan. Pelajar
dikurniakan kebolehan yang berbeza-beza dan salah satu tugas sekolah adalah
menempatkan mereka mengikut kebolehan dan minat mereka. Sebagai contoh,
persembahan dalam Pentaksiran Tingkatan 3 (PT3) (sebelum ini Penilaian Menengah
Rendah) dijadikan asas untuk menempatkan pelajar dalam aliran seni atau sains.
Penilaian juga digunakan untuk menstrim pelajar mengikut prestasi akademik. Sudah
menjadi tradisi bahawa kelas „A‰ dan „B‰ terdiri daripada pencapaian tinggi
berdasarkan keputusan mereka pada peperiksaan akhir semester atau akhir tahun.
Ujian penempatan juga telah digunakan di prasekolah untuk menstrim kanak-kanak

mengikut tahap celik huruf mereka! Amalan meletakkan pelajar mengikut pencapaian
akademik telah diperdebatkan selama beberapa dekad dengan beberapa ahli
pendidikan membantahnya manakala yang lain menyokong meritnya.
AKTIVITI 1.1
„Menstrim pelajar mengikut kebolehan akademik seharusnya

tidak digalakkan di sekolah-sekolah Malaysia‰.
Berbincang dengan rakan kursus anda dalam forum dalam talian myINSPIRE.
(v) Berkomunikasi dengan Ibu Bapa

Ibu bapa ingin mengetahui prestasi anak mereka di sekolah dan menghargai
maklumat, terutamanya contoh khusus, tentang kemajuan anak mereka. Menunjukkan
contoh kerja anak mereka dari semasa ke semasa membolehkan ibu bapa menilai
secara peribadi pertumbuhan dan kemajuan anak mereka.
Adalah penting untuk menceritakan keseluruhan cerita apabila melaporkan maklumat
tentang kemajuan prestasi. Bercakap dengan ibu bapa tentang standard, berkongsi
sampel kerja pelajar, menggunakan rubrik dalam persidangan, dan membezakan
antara prestasi dan kemajuan adalah beberapa cara untuk memastikan mereka diberi
gambaran yang tepat tentang pembelajaran anak mereka.
(vi) Pentadbiran dan Kaunseling Sekolah

Sekolah mengumpul maklumat pentaksiran untuk menentukan prestasi sekolah
berkenaan dengan sekolah lain untuk semester atau tahun tertentu. Keputusan
pentaksiran juga digunakan untuk membandingkan prestasi sepanjang tahun bagi
sekolah yang sama. Berdasarkan keputusan tersebut, pentadbir sekolah boleh
mengambil langkah-langkah untuk memperbaiki kelemahan seperti menggunakan
lebih banyak sumber untuk membantu pelajar yang berprestasi rendah, contohnya,
untuk meningkatkan bilangan pelajar dalam penguasaan membaca dan menulis
daripada tahap lemah kepada tahap memuaskan.

Keputusan penilaian (terutama yang berkaitan dengan perkembangan sosioemosi) boleh

digunakan oleh pentadbir sekolah dan kaunselor dalam merancang strategi intervensi untuk
pelajar berisiko. Penilaian oleh kaunselor akan membolehkan mereka mengenal pasti pelajar
yang mengemukakan masalah sosioemosi tertentu yang memerlukan perkhidmatan
kaunseling atau rujukan kepada pakar seperti psikiatri, kaunselor undang-undang dan pihak
berkuasa penguatkuasaan undang-undang.
(b) Menilai Bagi Meningkatkan Pengajaran

Jika 70 peratus pelajar anda gagal dalam ujian, adakah anda menyiasat sama ada strategi
pengajaran-pembelajaran anda sesuai atau adakah anda mengaitkannya dengan pelajar anda
lemah dari segi akademik selain tidak menyemak semula pengajian mereka?
Kebanyakan pendidik akan mengaitkan prestasi yang buruk kepada yang terakhir.
Walau bagaimanapun, maklumat pentaksiran adalah berharga kerana ia boleh menunjukkan hasil
pembelajaran yang mana telah berjaya dicapai dan objektif pengajaran manakah yang paling sukar
dicapai oleh pelajar. Keputusan pentaksiran adalah bernilai dalam memberikan petunjuk tentang
keberkesanan strategi pengajaran yang dilaksanakan dan bahan pengajaran yang digunakan. Ia
juga menunjukkan sama ada pelajar mempunyai pengetahuan sedia ada yang diperlukan untuk
memahami konsep dan prinsip yang dibincangkan (rujuk Jadual 1.2).
Data penilaian juga boleh memberikan pandangan tentang mengapa sesetengah guru lebih berjaya
dalam mengajar kumpulan pelajar tertentu manakala yang lain kurang berjaya.
Jadual 1.2: Tujuan Pentaksiran: Untuk Meningkatkan Pengajaran
Untuk Meningkatkan Pengajaran Soalan yang Perlu Dijawab
Objektif Adakah hasil pembelajaran yang diingini tercapai?
Kaedah pengajaran Adakah kaedah pengajaran yang digunakan berkesan?
Pengetahuan sedia ada Adakah pelajar mempunyai pengetahuan sedia ada yang berkaitan?
Bahan pengajaran Adakah bahan pengajaran yang digunakan berkesan?
Perbezaan guru Adakah guru tertentu lebih berkesan daripada yang lain?
AKTIVITI 1.2
Sejauh manakah anda menggunakan data penilaian untuk menyemak strategi pengajaran
pembelajaran anda?
Bincangkan perkara ini dengan rakan kursus anda dalam forum dalam talian myINSPIRE.

1.3 PRINSIP AM PENTAKSIRAN

Mari kita bincangkan prinsip umum penilaian:
(a) Perkara yang hendak Dinilai hendaklah Dinyatakan Dengan Jelas

Spesifikasi ciri-ciri yang hendak diukur hendaklah mendahului pemilihan atau
pembangunan prosedur penilaian. Dalam menilai pembelajaran pelajar, matlamat atau
hasil pembelajaran yang dimaksudkan hendaklah dinyatakan dengan jelas. Dalam erti
kata lain, prosedur penilaian yang sesuai hanya boleh dipilih jika terdapat spesifikasi
yang jelas tentang hasil pembelajaran yang ingin diukur.
(b) Prosedur Pentaksiran hendaklah Dipilih Berdasarkan Perkaitannya dengan

Ciri atau Prestasi yang Perlu Diukur
Semasa memilih prosedur pentaksiran untuk mengukur hasil pembelajaran tertentu,
guru hendaklah sentiasa bertanya sama ada prosedur yang dipilih adalah kaedah yang
paling berkesan untuk mengukur pembelajaran atau perkembangan yang hendak dinilai.
Mesti ada padanan yang rapat antara hasil pembelajaran yang dihasratkan dan jenis
tugasan penilaian yang akan digunakan. Sebagai contoh, jika guru ingin menilai
keupayaan pelajar untuk menyusun idea, penggunaan ujian aneka pilihan akan menjadi
pilihan yang tidak baik.
(c) Prosedur Penilaian yang berbeza Diperlukan untuk Menyediakan yang Lengkap
Gambar Pencapaian dan Perkembangan Pelajar
Tiada prosedur penilaian tunggal boleh menilai semua hasil pembelajaran yang
berbeza dalam kurikulum sekolah. Prosedur penilaian yang berbeza (penilaian formatif,
sumatif dan autentik) boleh mencapai objektif yang berbeza. Sebagai contoh, soalan
aneka pilihan berguna untuk mengukur pengetahuan, pemahaman dan hasil aplikasi
manakala ujian esei sesuai untuk mengukur kebolehan menyusun dan menyatakan
idea. Projek yang memerlukan menjalankan penyelidikan perpustakaan diperlukan
untuk mengukur kemahiran tertentu dalam merumus dan menyelesaikan masalah.
Teknik pemerhatian diperlukan untuk menilai kemahiran prestasi dan pelbagai aspek
tingkah laku pelajar.
Menggunakan pelbagai jenis alat penilaian membolehkan guru menentukan strategi

pengajaran yang berkesan dan yang perlu diubah suai. Dengan cara ini, penilaian
boleh digunakan untuk menambah baik pengajaran bilik darjah, merancang kurikulum
dan menyelidik amalan pengajaran sendiri.

(d) Pentaksiran mesti Sejajar dengan Arahan Bagi

menggalakkan pemikiran aras tinggi dan kemahiran menyelesaikan masalah,
terdapat peningkatan keperluan untuk menyelaraskan kurikulum, arahan dan
penilaian. Teknik penilaian bilik darjah harus memfokuskan pada menjajarkan
penilaian dengan lebih dekat dengan strategi pengajaran yang digunakan dalam
bilik darjah. Dengan cara ini, apa yang hendak dinilai di dalam bilik darjah adalah
selaras dengan apa yang telah diajar dan begitu juga sebaliknya. Sebagai contoh,
adalah tidak adil untuk menilai pelajar tentang kemahiran berfikir aras tinggi
apabila apa yang diajar hanyalah kemahiran berfikir aras rendah.
1.4 JENIS-JENIS PENTAKSIRAN
Sebelum kita meneruskan untuk membincangkan lebih lanjut tentang penilaian, anda perlu jelas tentang
konsep yang sering digunakan ini dalam penilaian:
(a) Penilaian formatif (atau penilaian) dan penilaian sumatif (atau

penilaian);
(b) Penilaian rujukan kriteria dan penilaian rujukan norma; dan
(c) Penilaian autentik (contoh penilaian autentik akan dibincangkan dalam Topik 6 dan
7).
Mari kita teruskan dan baca lebih lanjut.
1.4.1 Penilaian Formatif vs Sumatif

Guru melibatkan pelajar dalam semua aspek pembelajaran mereka. Terdapat banyak
strategi untuk mencapai ini bermula daripada penyoalan tidak formal, kuiz dan
pemerhatian kepada ujian bulanan yang lebih formal dan peperiksaan akhir semester.
Dalam sistem penilaian yang seimbang, kedua-dua penilaian sumatif dan formatif adalah
bahagian penting dalam pengumpulan maklumat.
Pentaksiran boleh dilakukan pada pelbagai masa sepanjang tahun persekolahan. Pelan
penilaian yang komprehensif akan merangkumi kedua-dua penilaian formatif dan
sumatif. Titik di mana penilaian berlaku dan tujuan penilaian membezakan kedua-dua
kategori penilaian ini.

(a) Pentaksiran Formatif

Pentaksiran formatif selalunya dilakukan pada awal atau semasa tahun persekolahan,
sekali gus memberi peluang untuk bukti segera pembelajaran murid dalam bidang mata
pelajaran tertentu atau pada titik tertentu dalam program. Pentaksiran bilik darjah adalah
salah satu teknik penilaian formatif yang paling biasa digunakan. Tujuan teknik ini adalah
untuk meningkatkan kualiti pembelajaran pelajar dan tidak seharusnya bersifat evaluative
atau melibatkan penggredan pelajar. Dalam penilaian formatif, guru membandingkan
prestasi seseorang pelajar dengan prestasi pelajar lain dalam kelas dan bukan semua
pelajar dalam tahun yang sama. Biasanya, sebahagian kecil kandungan diuji untuk
menentukan sama ada objektif telah dicapai. Penilaian formatif adalah berorientasikan
tindakan dan menjadi asas untuk penambahbaikan kaedah pengajaran (Scriven, 1996).
Sebagai contoh, jika seorang guru memerhatikan bahawa sesetengah pelajar masih
belum memahami sesuatu konsep, dia mungkin mereka bentuk aktiviti semakan atau
menggunakan strategi pengajaran yang berbeza. Begitu juga, pelajar boleh memantau
kemajuan mereka dengan kuiz berkala dan tugasan prestasi. Keputusan penilaian
formatif digunakan untuk mengubah suai dan mengesahkan pengajaran. Ringkasnya,
penilaian formatif sedang berjalan dan termasuk ulasan dan pemerhatian tentang apa
yang berlaku di dalam bilik darjah.
Penilaian formatif biasanya mempunyai kepentingan yang rendah, yang bermaksud bahawa ia
mempunyai nilai mata yang minimum atau tiada.
(b) Penilaian Sumatif
„Apabila tukang masak merasai sup, itu adalah penilaian formatif; apabila tetamu
merasai sup, itu adalah penilaian sumatif‰
(Robert Stakes)
Penilaian sumatif bersifat menyeluruh. Ia menyediakan akauntabiliti dan digunakan untuk

menyemak tahap pembelajaran pada akhir program (yang mungkin pada akhir semester,
tahun atau selepas dua tahun). Sebagai contoh, selepas lima tahun di sekolah menengah,
pelajar menduduki peperiksaan Sijil Pelajaran Menengah (SPM) yang bersifat sumatif
kerana ia berdasarkan pengalaman pembelajaran kumulatif pelajar.

Penilaian sumatif juga digunakan untuk menilai keberkesanan program

pengajaran pada akhir tahun akademik atau pada masa yang telah ditetapkan.
Matlamat penilaian sumatif adalah untuk membuat pertimbangan kecekapan
pelajar selepas fasa pengajaran selesai.
Sebagai contoh, peperiksaan kebangsaan ditadbir setiap tahun di Malaysia. Ia
merupakan penilaian sumatif untuk menentukan pemerolehan setiap pelajar
bagi beberapa bidang mata pelajaran dengan liputan kandungan antara dua
hingga tiga tahun. Penilaian sumatif digunakan untuk menentukan sama ada
pelajar telah menguasai kecekapan khusus seperti yang ditetapkan oleh
program dan gred huruf ditugaskan untuk menilai pencapaian pelajar.
Penilaian sumatif selalunya mempunyai kepentingan yang tinggi, yang bermaksud bahawa ia
mempunyai nilai mata yang tinggi.
Jadual 1.3 menyerlahkan perbezaan antara formatif dan sumatif

penilaian.
Jadual 1.3: Perbezaan antara Penilaian Formatif dan Sumatif
Kriteria Penilaian Formatif Penilaian Sumatif
Masa • Dijalankan sepanjang proses • Dijalankan pada akhir a

pengajaran-pembelajaran. fasa pengajaran-pembelajaran
(contohnya, akhir semester atau
tahun).
Kaedah • Ujian kertas dan pensel, • Ujian kertas dan pensel, ujian lisan yang
pemerhatian, kuiz, latihan, sesi amali diberikan kepada kumpulan.
yang diberikan kepada kumpulan dan
individu.
Matlamat
• Untuk menilai kemajuan dan • Penggredan untuk menentukan
mengesyorkan tindakan pembaikan sama ada program ini berjaya. •
untuk tidak mencapai objektif. • Untuk memperakui pelajar dan menambah
Pemulihan atau pengayaan atau mengajar baik kurikulum.
semula topik.
Contoh • Kuiz, esei, ujian diagnostik, laporan makmal dan • Peperiksaan akhir, peperiksaan
rekod anekdot. kebangsaan dan kelayakan
ujian.

Bolehkah maklumat daripada penilaian sumatif digunakan secara formatif? Ujian yang diberikan
pada akhir unit kerja memberikan maklumat tentang sejauh mana setiap pelajar telah belajar atau
belum belajar. Jika dibiarkan sebagai proses sumatif, maka markah ujian pelajar hanya menjadi
rekod kejayaan atau kegagalan mereka pada satu-satu masa dan tidak secara langsung membantu
mereka untuk bertambah baik. Lebih-lebih lagi, sebenarnya sesetengah pelajar akan mengetahui
lebih daripada apa yang ditunjukkan dalam prestasi ujian mereka.
Walau bagaimanapun, apabila maklumat digunakan secara formatif, keputusan ujian boleh
menyediakan sumber penting bagi maklum balas individu yang terperinci dan mengenal pasti di
mana setiap pelajar perlu memperdalam pemahaman mereka dan meningkatkan ingatan mereka
tentang pengetahuan yang telah mereka pelajari.
Lebih banyak guru mengetahui tentang setiap pelajar semasa mereka terlibat dalam proses
pembelajaran, lebih baik guru boleh menyesuaikan arahan untuk memastikan semua pelajar terus
maju dalam pembelajaran mereka.
Kelebihan menggunakan maklumat yang diperoleh daripada penilaian sumatif untuk meningkatkan
prestasi pelajar masa hadapan ialah:
(a) Data sumatif mendedahkan prestasi pelajar pada akhir sesuatu program pembelajaran, iaitu
lanjutan, mahir, asas atau di bawah asas.
Contohnya, jika pelajar mendapat markah di bawah asas dalam peperiksaan semester dan
menunjukkan tanda pelajar bergelut, guru mungkin mahu meletakkan pelajar itu di hadapan
kelas supaya guru boleh mengakses pelajar dengan mudah apabila pelajar memerlukan
tambahan. sokongan;
(b) Pentaksiran sumatif boleh dijadikan panduan untuk menambah baik kaedah pengajaran. Guru
sering menggunakan kaedah pengajaran yang pelbagai di dalam bilik darjah. Pentaksiran
sumatif boleh membantu guru bekerjasama dan menambah baik kaedah pengajaran dari
tahun ke tahun; dan
(c) Penilaian sumatif membantu guru dan pentadbir dalam menambah baik kurikulum dan
perancangan kurikulum. Pengajaran berasaskan standard memainkan peranan yang besar
di sekolah pada masa kini. Apabila penilaian sumatif menunjukkan jurang yang konsisten
antara pengetahuan pelajar dan sasaran pembelajaran, sekolah mungkin beralih kepada
pihak berkuasa yang berkaitan di Kementerian Pendidikan untuk mencadangkan
penambahbaikan perancangan kurikulum atau kurikulum baharu bagi mengisi jurang pembelajaran tersebut.
Data yang dikumpul menggunakan penilaian sumatif dapat membantu guru dan sekolah membuat
keputusan berdasarkan arahan yang telah siap.
Ini berbeza dengan penilaian formatif, di mana penilaian formatif boleh membantu guru dan pelajar
semasa proses pengajaran. Adalah penting untuk memahami perbezaan antara kedua-duanya,
kerana kedua-dua penilaian boleh memainkan peranan penting dalam pendidikan.

1.4.2 Ujian rujukan norma vs rujukan kriteria
Perbezaan utama antara ujian rujukan norma dan ujian rujukan kriteria bergantung pada
tujuan atau matlamat menilai pelajar anda, cara kandungan dipilih dan proses pemarkahan
yang mentakrifkan cara keputusan ujian mesti ditafsirkan.
(a) Ujian rujukan norma

Sebab utama ujian rujukan norma adalah untuk mengklasifikasikan pelajar. Ujian ini
direka bentuk untuk menonjolkan perbezaan pencapaian antara dan di kalangan pelajar
untuk menghasilkan susunan pangkat pelajar yang boleh dipercayai merentasi kontinum
pencapaian daripada pencapaian tinggi kepada pencapaian rendah (Stiggins, 1994).
Dengan ujian rujukan norma, sekumpulan pelajar yang mewakili diberi ujian dan markah
mereka membentuk norma selepas melalui pentadbiran dan analisis yang kompleks.
Sesiapa yang mengambil ujian rujukan norma boleh membandingkan markahnya
dengan norma.
Sebagai contoh, pelajar yang memperoleh markah 70 pada ujian rujukan norma tidak
akan bermakna sehingga ia dibandingkan dengan norma. Jika dibandingkan dengan
norma, markahnya adalah dalam persentil ke-80 yang bermaksud bahawa dia
menunjukkan prestasi yang baik atau lebih baik daripada 20 peratus pelajar dalam kumpulan norma.
Maklumat jenis ini boleh berguna untuk menentukan sama ada pelajar memerlukan
bantuan pemulihan atau calon untuk program berbakat.
Walau bagaimanapun, skor memberikan sedikit maklumat tentang perkara yang sebenarnya diketahui
atau boleh dilakukan oleh pelajar. Kritikan utama terhadap ujian rujukan norma ialah mereka
cenderung memberi tumpuan kepada menilai tahap rendah, kemahiran asas (Romberg, 1989).
(b) Ujian rujukan kriteria

Ujian rujukan kriteria menentukan apa yang pelajar boleh atau tidak boleh lakukan dan
bukan bagaimana mereka membandingkan dengan orang lain (Anastasi, 1988). Ujian
rujukan kriteria melaporkan prestasi pelajar berbanding tahap prestasi yang telah
ditetapkan pada set matlamat atau hasil pendidikan tertentu yang disertakan dalam
kurikulum. Ujian rujukan kriteria digunakan apabila guru ingin mengetahui sejauh mana
pelajar telah mempelajari pengetahuan dan kemahiran yang dijangka telah mereka
kuasai. Maklumat ini boleh digunakan untuk menentukan sejauh mana pelajar
mempelajari kurikulum yang dikehendaki dan sejauh mana sekolah mengajar kurikulum
tersebut. Ujian rujukan kriteria memberikan maklumat terperinci tentang prestasi pelajar
pada setiap matlamat atau hasil pendidikan yang disertakan dalam ujian tersebut.
Sebagai contoh, skor ujian rujukan kriteria mungkin menerangkan operasi aritmetik
yang boleh dilakukan oleh pelajar atau tahap kesukaran membaca yang dialami.

Jadual 1.4 menggambarkan perbezaan antara ujian rujukan norma dan ujian rujukan kriteria.
Jadual 1.4: Perbezaan antara Ujian Rujukan Norma dan Rujukan Kriteria
Kriteria Ujian rujukan norma Ujian rujukan kriteria
Matlamat
• Bandingkan seseorang pelajar • Bandingkan prestasi pelajar
persembahan bersama dengan beberapa kriteria.
pelajar lain.
• Memilih pelajar untuk • Sejauh mana seseorang pelajar telah

pensijilan. memperoleh pengetahuan atau
kemahiran.
• Menambah baik pengajaran dan

pembelajaran.
Jenis-jenis • Soalan daripada mudah kepada • Soalan kesukaran yang hampir

soalan sukar. serupa berkaitan dengan kriteria.
Pelaporan tentang • Gred diberikan. • Tiada gred diberikan

keputusan
(sama ada kemahiran atau
pengetahuan dicapai).
Kandungan • Liputan kandungan yang luas. • Aspek khusus bagi

liputan kandungan.
Contoh • Peperiksaan kebangsaan UPSR, • Ujian kelas, latihan dan tugasan.

PT3, SPM, peperiksaan akhir
semester dan peperiksaan akhir
tahun.
SEMAK KENDIRI 1.1
1. Terangkan perbezaan antara ujian rujukan norma dan ujian rujukan kriteria.
2. Huraikan perbezaan utama antara formatif dan sumatif

penilaian.

1.5 TREND SEMASA DALAM PENILAIAN

Dalam dua dekad yang lalu, terdapat perubahan besar dalam amalan penilaian di banyak
bahagian dunia. Brown, Bull dan Pendlebury (1997) mengenal pasti trend berikut dalam penilaian
pendidikan:
(a) Peperiksaan bertulis secara beransur-ansur digantikan dengan penilaian dan kerja kursus
yang lebih berterusan;
(b) Terdapat satu langkah ke arah lebih banyak penglibatan dan pilihan pelajar dalam
penilaian;
(c) Penilaian kumpulan menjadi lebih popular dalam usaha untuk menekankan pembelajaran
kolaboratif antara pelajar dan mengurangkan persaingan yang berlebihan;
(d) Bidang mata pelajaran dan kursus menyatakan dengan lebih jelas tentang jangkaan dalam
penilaian, lebih khusus lagi jenis prestasi yang diperlukan daripada pelajar apabila mereka
dinilai. Ini tidak seperti amalan terdahulu di mana penilaian sangat rahsia dan pelajar perlu
memikirkan sendiri apa yang diperlukan daripada mereka;
(e) Pemahaman tentang proses kini dilihat sebagai, sekurang-kurangnya, sama pentingnya
dengan pengetahuan fakta. Ini selaras dengan peralihan umum daripada penilaian
berasaskan produk kepada penilaian berasaskan proses; dan
(f) „Hasil pembelajaran‰ yang berfokuskan pelajar telah mula menggantikan „objektif‰ yang
berorientasikan guru. Fokus lebih kepada apa yang pelajar akan pelajari dan bukannya
apa yang guru rancang untuk mengajar.

Meringankan Peperiksaan
Putrajaya: Mengurangkan bilangan mata pelajaran Antara langkah yang dicadangkan ialah:
peperiksaan dan mempunyai sistem semester
ÿ Mengurangkan bilangan mata pelajaran dalam
antara perubahan besar yang dirancang untuk
peperiksaan awam;
menjadikan sistem pendidikan lebih holistik dan
kurang tertumpu kepada pencapaian akademik.
ÿ Menekankan kemahiran dan kebolehan
daripada memberi tumpuan kepada
kandungan dan pencapaian;
Menteri Pendidikan, Datuk Seri Hishamumuddin

ÿ Menggalakkan pembangunan peribadi melalui
Tun Hussein berkata bahawa langkah-langkah ini
mata pelajaran seperti Seni dan Pendidikan
adalah selaras dengan matlamat Kerajaan untuk
Jasmani; dan
memperbaharui sistem pendidikan negara. “Kami
tidak berhasrat untuk memansuhkan peperiksaan
awam atau peringkat sekolah sama sekali, tetapi ÿ Menambah baik kaedah pengajaran-
kami menyedari bahawa sistem penilaian pembelajaran dengan menggalakkan lebih
sekarang perlu dilihat‰, katanya. banyak tugasan berasaskan projek.
Beliau berkata, penekanan harus diberikan

kepada pencapaian individu berbanding prestasi
sekolah dalam peperiksaan awam dan juga
menonjolkan pencapaian kokurikulum individu.
(The Star, 21 Mac, 2006)
AKTIVITI 1.3
Rujuk laporan mengenai „Meringankan Peperiksaan‰ dan bincangkan sejauh mana

anda bersetuju dengan langkah yang dicadangkan oleh Kementerian Pendidikan untuk
mengurangkan sistem pendidikan berorientasikan peperiksaan di Malaysia.
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.

• Ujian boleh dianggap sebagai satu set tugasan atau soalan yang bertujuan untuk menimbulkan jenis
tingkah laku tertentu apabila dibentangkan dalam keadaan piawai dan untuk menghasilkan skor
yang akan mempunyai sifat psikometrik yang diingini.
• Pengukuran dalam pendidikan ialah proses di mana sifat-sifat seseorang diukur dan diberi nombor.
• Pentaksiran dilihat sebagai proses mengumpul maklumat dengan tujuan membuat keputusan
berkenaan pelajar.
• Pentaksiran bertujuan untuk membantu pelajar dan menambah baik pengajaran.
• Penilaian sumatif bersifat menyeluruh, memberikan akauntabiliti dan digunakan untuk menyemak
tahap pembelajaran pada akhir program.
• Penilaian formatif selalunya dijalankan pada awal atau semasa tahun persekolahan, sekali gus
memberi peluang untuk bukti segera pembelajaran pelajar dalam bidang mata pelajaran tertentu
atau pada masa tertentu dalam sesuatu program.
• Maklumat daripada penilaian sumatif boleh digunakan secara formatif. Pelajar atau sekolah boleh
menggunakan maklumat tersebut untuk membimbing usaha dan aktiviti mereka dalam kursus
seterusnya.
• Sebab utama ujian rujukan norma adalah untuk mengklasifikasikan pelajar. Ujian ini direka bentuk
untuk menyerlahkan perbezaan pencapaian antara dan dalam kalangan pelajar untuk menghasilkan
susunan pangkat pelajar yang boleh dipercayai.
• Ujian rujukan kriteria menentukan apa yang pelajar boleh atau tidak boleh lakukan dan tidak
bagaimana mereka membandingkan dengan orang lain.
Penilaian Pengukuran
Ujian rujukan kriteria Ujian rujukan norma
Penilaian Penilaian sumatif
Penilaian formatif Ujian

Topik Asas untuk ÿ

Penilaian:
2 Apa yang Perlu Dinilai
HASIL PEMBELAJARAN
1. Wajarkan tingkah laku yang akan diukur untuk mempersembahkan holistik
penilaian pelajar;
2. Menghuraikan pelbagai jenis hasil pembelajaran kognitif yang perlu

dinilai;
3. Menghuraikan pelbagai jenis hasil pembelajaran afektif yang hendak dicapai

dinilai; dan
4. Menghuraikan pelbagai jenis hasil pembelajaran psikomotor yang perlu

dinilai.
ÿ PENGENALAN
Jika anda bertanya kepada seorang guru, apakah yang patut dinilai di dalam bilik darjah,
jawapan segera adalah, sudah tentu, fakta dan konsep yang diajar. Ia adalah fakta dan
konsep yang terdapat dalam sains, sejarah, geografi, bahasa, seni, pendidikan agama
dan mata pelajaran lain yang serupa. Walau bagaimanapun, Falsafah Pendidikan
Malaysia menyatakan bahawa pendidikan harus bermatlamat ke arah pembangunan
holistik individu. Oleh itu, adalah logik bahawa sistem penilaian juga harus berusaha
untuk menilai lebih daripada pemerolehan fakta dan konsep sesuatu bidang mata
pelajaran. Bagaimana pula dengan penilaian kebolehan fizikal dan motor? Bagaimana
pula dengan tingkah laku sosioemosi seperti sikap, minat, personaliti dan sebagainya?
Adakah mereka tidak menyumbang kepada orang yang holistik?
Dalam topik ini, anda akan mempelajari jenis hasil pembelajaran yang perlu dinilai dalam
kurikulum. Topik ini akan diakhiri dengan penerangan ringkas tentang cara merancang
jadual spesifikasi untuk ujian bilik darjah.

TOPIK 2 ASAS UNTUK PENILAIAN: APA YANG PERLU DINILAI ÿ 21
2.1 MENGENAL PASTI APA YANG PERLU DINILAI
Apabila pendidik ditanya apa yang patut dinilai di dalam bilik darjah, majoriti akan
merujuk kepada menilai pemerolehan fakta, konsep, prinsip, prosedur dan kaedah
sesuatu bidang mata pelajaran. Anda mungkin mendapati minoriti pendidik yang
menegaskan bahawa kemahiran yang diperoleh oleh pelajar juga harus dinilai
terutamanya dalam mata pelajaran seperti pendidikan jasmani, seni, drama, muzik,
lukisan teknikal, pertukangan kayu, kejuruteraan automobil dan sebagainya. Malah
lebih sedikit pendidik akan mencadangkan bahawa tingkah laku sosioemosi pelajar juga harus dinilai
Falsafah Kebangsaan Pendidikan Malaysia di

Malaysia adalah satu usaha berterusan ke arah memperkembangkan lagi potensi
individu secara menyeluruh dan bersepadu untuk melahirkan insan yang seimbang
dan harmonis dari segi intelek, rohani, emosi dan jasmani, berdasarkan kepercayaan
dan pengabdian kepada Tuhan. Usaha sebegini adalah bertujuan untuk melahirkan
warganegara Malaysia yang berilmu pengetahuan dan berketrampilan, berakhlak
mulia dan bertanggungjawab dan berkeupayaan mencapai tahap kesejahteraan diri
yang tinggi serta mampu menyumbang kepada keharmonian dan peningkatan
keluarga, masyarakat dan negara amnya.
(Pusat Perkembangan Kurikulum, Kementerian Pendidikan Malaysia, 1988)
Falsafah Kebangsaan Pendidikan Malaysia mempunyai implikasi penting terhadap

pentaksiran. Secara teorinya, sistem pentaksiran yang komprehensif harus berusaha
untuk memberikan maklumat sejauh mana Falsafah Pendidikan Kebangsaan telah
mencapai matlamatnya. Dalam erti kata lain, sistem penilaian harus berusaha untuk
menentukan:
(a) Sama ada sekolah kita telah membangunkan „potensi individu secara menyeluruh
dan bersepadu‰;
(b) Sama ada pelajar kita „seimbang dari segi intelek, rohani, emosi dan jasmani‰;
(c) Sama ada pelajar kita „berilmu dan berkebolehan‰ dan „memiliki
standard moral yang tinggi‰;
(d) Sama ada pelajar kita mempunyai „kesejahteraan peribadi yang tinggi‰; dan
(e) Sama ada pelajar dilengkapi dengan kebolehan dan sikap yang akan membolehkan
mereka „menyumbang kepada keharmonian dan kemajuan keluarga, masyarakat
dan negara secara amnya‰.

22 ÿ TOPIK 2 ASAS PENILAIAN: APA YANG PERLU DINILAI
Sebaliknya, dalam amalan sebenar penilaian cenderung terlalu menekankan kecekapan

intelek yang diterjemahkan ke dalam pengukuran hasil pembelajaran kognitif bidang
mata pelajaran tertentu. Aspek-aspek lain individu holistik diberi perhatian yang minimum
kerana pelbagai sebab. Sebagai contoh, bagaimanakah guru menilai pertumbuhan dan
perkembangan rohani atau emosi?
Ini adalah binaan yang sukar dinilai dan sangat subjektif. Oleh itu, tidak hairanlah bahawa
penilaian hasil kognitif kekal menjadi tumpuan kebanyakan sistem penilaian di seluruh
dunia kerana ia lebih mudah untuk diperhatikan dan diukur. Walau bagaimanapun, dalam
topik ini kita akan cuba membentangkan penilaian pembelajaran yang lebih „holistik‰,
memfokuskan kepada tiga jenis tingkah laku manusia yang utama. Ini adalah tingkah
laku yang telah cuba dinilai oleh ahli psikometrik dan psikologi dan diselaraskan rapat
untuk merealisasikan matlamat Falsafah Pendidikan Malaysia.
2.2 TIGA JENIS HASIL PEMBELAJARAN

Segelintir orang akan mempertikaikan bahawa tujuan persekolahan adalah pembangunan
insan holistik. Pada penghujung 1950-an dan awal 1960-an, sekumpulan ahli psikologi
dan psikometrik mencadangkan agar sekolah perlu menilai tiga domain hasil pembelajaran
(rujuk Rajah 2.1):
(a) Hasil pembelajaran kognitif (pengetahuan atau kemahiran mental);
(b) Hasil pembelajaran afektif (perasaan atau emosi); dan
(c) Hasil pembelajaran psikomotor (kemahiran manual atau fizikal).
Rajah 2.1: Penilaian holistik pelajar

Domain boleh dianggap sebagai kategori. Para pendidik sering merujuk kepada ketiga-tiga domain
ini sebagai KSA (Pengetahuan, Kemahiran dan Sikap). Setiap domain terdiri daripada subbahagian,
bermula daripada tingkah laku yang paling mudah kepada yang paling kompleks, seterusnya
membentuk taksonomi hasil pembelajaran. Setiap taksonomi tingkah laku pembelajaran boleh
dianggap sebagai „matlamat proses persekolahan.‰ Ini bermakna selepas persekolahan, pelajar
sepatutnya telah memperoleh kemahiran, pengetahuan, dan/atau sikap baharu. Walau
bagaimanapun, peringkat setiap bahagian yang digariskan bukanlah mutlak.
Walaupun terdapat sistem atau hierarki lain yang telah direka dalam dunia pendidikan, ketiga-tiga
taksonomi ini mudah difahami dan mungkin yang paling banyak digunakan hari ini.
Untuk menilai ketiga-tiga domain, seseorang perlu mengenal pasti dan mengasingkan tingkah laku
yang mewakili domain ini. Apabila kita menilai, kita menilai beberapa aspek tingkah laku pelajar,
contohnya, keupayaannya untuk membandingkan, menerangkan, menganalisis, menyelesaikan,
melukis, menyebut, merasa, merenung dan sebagainya. Istilah „tingkah laku‰ digunakan secara
meluas untuk merangkumi keupayaan pelajar untuk berfikir (kognitif), merasa (afektif) dan
melakukan sesuatu kemahiran (psikomotor). Sebagai contoh, anda baru sahaja mengajar tentang
„The Rainforest of Malaysia‰ dan anda ingin menilai pelajar anda dalam:
(a) Berfikir ÿ Anda boleh meminta mereka menyenaraikan ciri-ciri hutan hujan Malaysia dan
membandingkannya dengan hutan konifer Kanada;
(b) Perasaan (emosi, sikap) ÿ Anda boleh meminta mereka untuk mereka bentuk pameran tentang
bagaimana pelajar boleh menyumbang ke arah pemuliharaan hutan hujan; dan
(c) Kemahiran ÿ Anda boleh meminta mereka menyediakan peta satelit tentang perubahan hutan
hujan Malaysia dengan mengakses laman web daripada Internet.
AKTIVITI 2.1
Rujuk Rajah 2.1. Sejauh manakah afektif dan psikomotor

tingkah laku yang dinilai di institusi anda?
Berbincang dengan rakan kursus anda dalam forum dalam talian myINSPIRE.

2.3 MENILAI PEMBELAJARAN KOGNITIF

HASIL
Apabila kita menilai atau menilai seseorang manusia, kita sedang menilai atau menilai tingkah laku seseorang.
Ini mungkin agak mengelirukan bagi sesetengah orang. Adakah kita tidak menilai pemahaman seseorang tentang
fakta, konsep dan prinsip sesuatu bidang? Setiap mata pelajaran, sama ada sejarah, sains, geografi, ekonomi,
atau matematik, mempunyai himpunan unik fakta, konsep, prinsip, generalisasi, teori, undang-undang, prosedur
dan kaedah yang dihantar kepada pelajar (diilustrasikan dalam Rajah 2.2).
Rajah 2.2: Kandungan subjek yang dinilai
Apabila kami menilai kami tidak menilai storan pelajar bagi fakta, konsep atau prinsip sesuatu mata pelajaran
tetapi lebih kepada perkara yang pelajar boleh lakukan dengan fakta, konsep atau prinsip sesuatu bidang mata
pelajaran. Sebagai contoh, kami menilai keupayaan pelajar untuk membandingkan fakta, menerangkan konsep,
menganalisis generalisasi (atau pernyataan) atau menyelesaikan masalah berdasarkan prinsip yang diberikan.
Dalam erti kata lain, kita menilai kefahaman atau penguasaan badan pengetahuan berdasarkan apa yang pelajar
dapat lakukan dengan kandungan subjek. Mari kita lihat dua mekanisme yang digunakan untuk mengukur atau
menilai pembelajaran kognitif, iaitu Taksonomi Bloom dan The
Seratus yang Membantu.

(a) Taksonomi Bloom

Pada tahun 1956, Benjamin Bloom mengetuai sekumpulan ahli psikologi pendidikan untuk
membangunkan klasifikasi tahap tingkah laku intelek yang penting untuk pembelajaran. Mereka
mendapati bahawa lebih 95 peratus soalan ujian yang dihadapi oleh pelajar memerlukan mereka
berfikir hanya pada tahap yang paling rendah, iaitu mengingat kembali maklumat. Bloom dan rakan-
rakannya membangunkan taksonomi yang diterima secara meluas (kaedah klasifikasi pada tahap
yang berbeza) untuk objektif kognitif. Ini dirujuk sebagai Taksonomi BloomÊs (rujuk Rajah 2.3).
Terdapat enam peringkat dalam klasifikasi BloomÊs dengan tahap paling rendah dipanggil
pengetahuan. Tahap pengetahuan diikuti oleh lima tahap kebolehan mental yang semakin sukar:
kefahaman, aplikasi, analisis, sintesis dan penilaian.
Rajah 2.3: Taksonomi Bloom bagi hasil pembelajaran kognitif
Sekarang, baca lebih lanjut untuk mengetahui kandungan setiap peringkat.
(i) Pengetahuan: Tingkah laku pada tahap pengetahuan memerlukan pelajar mengingat kembali maklumat
tertentu. Tahap pengetahuan adalah tahap kognitif yang paling rendah. Contoh kata kerja yang
menerangkan tingkah laku pada tahap pengetahuan termasuk kebolehan untuk menyenaraikan,
mentakrifkan, menamakan, menyatakan, mengingat kembali, memadankan, mengenal pasti,
memberitahu, melabel, menggariskan, mencari, mengecam, memilih dan sebagainya. Sebagai
contoh, keupayaan pelajar untuk menyebut faktor-faktor yang membawa kepada Perang Dunia II,
memetik formula untuk ketumpatan dan daya, memberitahu peraturan keselamatan makmal.
(ii) Pemahaman: Tingkah laku pada tahap pemahaman yang merupakan tahap keupayaan mental
yang lebih tinggi daripada tahap pengetahuan memerlukan pemahaman tentang makna
konsep dan prinsip, terjemahan perkataan dan frasa ke dalam perkataan sendiri, interpolasi
yang melibatkan pengisian yang hilang. maklumat, tafsiran yang melibatkan membuat
kesimpulan dan melampaui maklumat yang diberikan. Contoh kata kerja yang menerangkan
tingkah laku pada tahap pemahaman ialah menerangkan, membezakan, membuat inferens,
mentafsir, menukar, menggeneralisasi, mempertahankan, menganggar, memanjangkan,
menghuraikan, menceritakan semula menggunakan perkataan sendiri, meramal, menulis
semula, meringkaskan, menterjemah dan sebagainya. Sebagai contoh, pelajar dapat

tulis semula tiga undang-undang gerakan Newton, terangkan dengan perkataan sendiri
langkah-langkah untuk melaksanakan tugas yang kompleks dan menterjemah persamaan
ke dalam hamparan komputer.
(iii) Aplikasi: Tingkah laku di peringkat aplikasi memerlukan pelajar untuk menggunakan peraturan
atau prinsip yang dipelajari di dalam bilik darjah ke dalam novel atau situasi baharu di
tempat kerja atau penggunaan abstraksi tanpa gesaan.
Contoh kata kerja yang menerangkan tingkah laku pada peringkat aplikasi ialah mengaplikasi,
menukar, mengira, menunjukkan, menemui, memanipulasi, mengubah suai, memberi
contoh, mengendalikan, meramal, menyediakan, menghasilkan, mengaitkan, menunjukkan,
menyelesaikan, menggunakan dan sebagainya. Sebagai contoh, pelajar boleh menggunakan
formula untuk gerakan peluru untuk mengira jarak maksimum lompat jauh lompat dan
menggunakan undang-undang statistik untuk menilai kebolehpercayaan sesuatu tulisan.
ujian.
(iv) Analisis: Tingkah laku di peringkat analisis memerlukan pelajar mengenal pasti bahagian
komponen dan menerangkan hubungannya, mengasingkan bahan atau konsep kepada
bahagian komponen supaya struktur organisasinya dapat difahami dan membezakan antara
fakta dan inferens. Contoh kata kerja yang menerangkan tingkah laku pada peringkat
analisis ialah menganalisis, memecahkan, membanding, membezakan, diagram,
menyahkonstruk, meneliti, membedah, membezakan, mendiskriminasi, membezakan,
mengenal pasti, menggambarkan, membuat kesimpulan, menggariskan, menghubungkait,
memilih, memisahkan dan sebagainya.
Sebagai contoh, pelajar dapat menyelesaikan masalah sesuatu peralatan dengan
menggunakan potongan logik, mengenali kesilapan logik dalam penaakulan, menganalisis
maklumat daripada syarikat dan menentukan keperluan untuk latihan.
(v) Sintesis: Tingkah laku di peringkat sintesis memerlukan pelajar membina struktur atau corak
daripada unsur-unsur yang pelbagai dan menyusun bahagian-bahagian untuk membentuk
keseluruhan dengan penekanan untuk mencipta makna atau struktur baharu. Contoh kata
kerja yang menerangkan tingkah laku pada peringkat sintesis ialah mengkategorikan,
menggabungkan, menyusun, mengarang, mencipta, mereka bentuk, mereka bentuk,
menerangkan, menjana, mengubah suai, menyusun, merancang, menyusun semula,
membina semula, mengaitkan, menyusun semula, mencari cara luar biasa, merumus,
menyemak semula. , menulis semula, meringkaskan, memberitahu, menulis dan sebagainya.
Sebagai contoh, pelajar dapat menulis cerpen yang kreatif, mereka bentuk kaedah untuk
melaksanakan tugas tertentu, mengintegrasikan idea daripada beberapa sumber untuk
menyelesaikan masalah, merangka pelan tindakan baharu untuk menambah baik hasil.

(vi) Penilaian: Tingkah laku di peringkat penilaian memerlukan pelajar membuat

pertimbangan tentang bahan dan kaedah, dan nilai idea atau bahan. Contoh kata
kerja yang menerangkan tingkah laku pada peringkat penilaian ialah menilai,
membandingkan, membuat kesimpulan, membezakan, mengkritik, mengkritik,
mempertahankan, menerangkan, memberi pangkat, memberi pendapat sendiri,
mendiskriminasi, menilai, menerangkan, mentafsir, nilai, mewajarkan, mengaitkan,
meringkaskan, menyokong. dan sebagainya. Sebagai contoh, pelajar dapat menilai
dan memutuskan penyelesaian yang paling berkesan kepada masalah, mewajarkan
pilihan prosedur atau tindakan baru.
(b) Ratusan Membantu

Heinich, Molenda, Russell dan Smaldino (2001) mencadangkan 100 kata kerja yang
menonjolkan prestasi atau tingkah laku yang boleh diperhatikan dan boleh diukur.
Ini bukan untuk mengatakan bahawa 100 kata kerja ini adalah satu-satunya tetapi ia pasti
menjadi rujukan yang bagus untuk pendidik. Jadual 2.1 memaparkan kata kerja yang
sesuai digunakan semasa anda menulis objektif pengajaran dalam setiap peringkat
Taksonomi Bloom.
Jadual 2.1: Ratusan Membantu
Tambah
pengiraan gerudi label menjangkakan
negeri
analisis abjad kelakuan anggaran cari sediakan tolak
digunakan membina menilai buat hadir cadangkan

kontras memanipulasi menghasilkan swing
susun atur menukar perlawanan

menerangkan ekstrapolasi sebut jadual baca lempar
betul sesuai mengukur
hadir potong
menjana ubah suai membina semula masa
belah dua menyimpulkan

graf darab kurangkan menterjemah
membina mempertahankan
genggam nama keluarkan taip
gua tentukan mengisar beroperasi menyemak semula garis bawah
kategorikan tunjuk cara pukul pesanan pilih lisan
pilih terbitkan tahan menyusun lakaran mengesahkan
mengelaskan huraikan mengenalpasti rangka ski menganyam
warna design menggambarkan selesaikan

timbang
bandingkan designate menunjukkan menyusun menulis
lengkap diagram pasang nyatakan

tendang
mengarang bezakan mengemas kedudukan
segiplot cat
empat sama

Pada tahun 2001, Krathwohl dan Anderson telah mengubahsuai Taksonomi Bloom yang asal (1956).
Mereka mengenal pasti dan mengasingkan senarai tingkah laku berikut yang perlu ditangani oleh
sistem penilaian (rujuk Jadual 2.2).
Jadual 2.2: Versi Semakan Taksonomi BloomÊs
Kategori dan Proses Kognitif Nama Alternatif
1. Mengingat ÿ
Mengenali ÿ ÿ Mengenal pasti ÿ
Mengingat Mendapat semula
2. Memahami ÿ
Mentafsir ÿ ÿ Menjelaskan, menghuraikan, mewakilkan,
Mencontohi ÿ menterjemah ÿ Mengilustrasikan, mengkategorikan
Mengklasifikasi ÿ ÿ Mengkategorikan, menyimpulkan ÿ Mengabstrak,
Merumus ÿ menggeneralisasi ÿ Membuat kesimpulan,
Menyimpul ÿ mengekstrapolasi, menginterpolasi, meramal ÿ
Membanding ÿ Membezakan, memetakan, memadankan ÿ Membina

model
Menjelaskan
3. Mengaplikasi
ÿ Melaksana ÿ ÿ Menjalankan ÿ
Melaksana Menggunakan
4. Menganalisis
ÿ Membezakan ÿ ÿ Mendiskriminasi, membezakan, memfokus, memilih
Menyusun ÿ ÿ Mencari keselarasan, menyepadukan,
Mengatributkan menggariskan, menstruktur ÿ Menyahkonstruk
5. Menilai ÿ
Menyemak ÿ ÿ Menyelaras, mengesan, memantau, menguji ÿ
Mengkritik Menghakimi
6. Mencipta
ÿ Menjana ÿ ÿ Hipotesis ÿ
Merancang ÿ Merekabentuk ÿ
Menghasil Membina
Sumber: Krathwohl & Anderson (2001)

TOPIK 2 ASAS PENILAIAN: APA YANG PERLU DINILAI ÿ 29
Ambil perhatian bahawa penjujukan beberapa peringkat telah disusun semula dan dinamakan semula.
Dua tahap asal pertama „pengetahuan‰ dan „pemahaman‰ masing-masing diganti dengan „mengingat‰
dan „memahami‰. Tahap „sintesis‰ telah dinamakan semula dengan istilah „mencipta‰. Ambil
perhatian bahawa dalam taksonomi asal jujukan ialah „sintesis‰ diikuti dengan „menilai‰. Dalam
taksonomi yang diubah suai, urutan itu disusun semula kepada „menilai‰ diikuti dengan „mencipta‰.
Seperti yang anda lihat, perbezaan utama antara taksonomi asal dan taksonomi yang disemak bukan
dalam penyenaraian atau kata semula daripada kata nama kepada kata kerja, atau dalam penamaan
semula beberapa komponen, atau malah dalam penempatan semula dua kategori terakhir. Perbezaan
utama terletak pada penambahan yang lebih berguna dan menyeluruh tentang cara taksonomi bersilang
dan bertindak ke atas pelbagai jenis dan tahap pengetahuan ÿ fakta, konseptual, prosedural dan
metakognitif.
(a) Pengetahuan fakta merujuk kepada fakta, istilah, butiran atau elemen penting yang pelajar mesti tahu
atau biasa dengannya untuk memahami sesuatu disiplin atau menyelesaikan masalah dengannya;
(b) Pengetahuan konseptual ialah pengetahuan tentang klasifikasi, prinsip, generalisasi, teori, model
atau struktur yang berkaitan dengan bidang disiplin tertentu;
(c) Pengetahuan prosedur merujuk kepada maklumat atau pengetahuan yang membantu pelajar
melakukan sesuatu yang khusus untuk sesuatu disiplin, mata pelajaran atau bidang pengajian. Ia
juga merujuk kepada kaedah inkuiri, kemahiran yang sangat khusus atau terhingga, algoritma,
teknik dan metodologi tertentu; dan
(d) Metakognisi hanyalah memikirkan tentang pemikiran seseorang. Lebih tepat lagi, ia merujuk kepada
proses yang digunakan untuk merancang, memantau dan menilai pemahaman dan prestasi
seseorang. Aktiviti seperti merancang cara mendekati tugasan pembelajaran yang diberikan,
memantau kefahaman dan menilai kemajuan ke arah menyiapkan tugasan adalah bersifat
metakognitif.
Matlamat Bloom adalah untuk menggalakkan bentuk pemikiran yang lebih tinggi dalam pendidikan seperti
menganalisis, mencipta dan menilai daripada hanya mengajar pelajar untuk mengingati fakta
(pembelajaran hafalan). Pemikiran aras tinggi (HOT) membawa pemikiran ke tahap yang lebih tinggi
selain daripada menyatakan semula fakta dan memerlukan pelajar melakukan sesuatu dengan fakta
seperti memahaminya, membuat kesimpulan daripadanya, menghubungkannya dengan fakta dan konsep
lain, mengkategorikannya, memanipulasinya, meletakkannya. mereka bersama-sama dengan cara
baharu atau baharu, dan gunakannya semasa kami mencari penyelesaian baharu kepada masalah baharu.

SEMAK KENDIRI 2.1
1. Terangkan perbezaan antara analisis dan sintesis mengikut

kepada Taksonomi Bloom.
2. Bagaimanakah versi semakan Taksonomi BloomÊs berbeza

dari versi asal?
AKTIVITI 2.2
1. Adakah anda bersetuju bahawa Taksonomi Bloom adalah satu hierarki kognitif
kebolehan? Mewajarkan.
2. Anda perlu boleh „menganalisis‰ sebelum boleh „menilai‰.

Komen.
3. Menggunakan The Helpful Hundred, senaraikan hasil pembelajaran

sesuai dengan bidang mata pelajaran yang anda ajar.
Kongsi semua jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
2.4 MENILAI HASIL AFEKTIF

Ciri afektif melibatkan perasaan atau emosi seseorang. Sikap, nilai, harga diri, lokus kawalan,
efikasi kendiri, minat, aspirasi dan kebimbangan adalah semua contoh ciri afektif. Malangnya,
hasil afektif tidak menjadi bahagian penting dalam sistem pendidikan kita walaupun ia boleh
dikatakan sama pentingnya dengan, atau lebih penting daripada, mana-mana domain kognitif
atau psikomotor hasil pembelajaran yang disasarkan oleh sekolah. Beberapa sebab yang
mungkin untuk kekurangan penekanan pada hasil afektif termasuk:
(a) Kepercayaan bahawa pembangunan perasaan yang sesuai adalah tugas keluarga dan
agama.
(b) Kepercayaan bahawa perasaan yang sesuai berkembang secara automatik daripada
pengetahuan dan pengalaman dengan kandungan dan tidak memerlukan perhatian
pedagogi khusus.

(c) Arahan sikap dan berorientasikan nilai sukar dibangunkan dan dinilai kerana:
(i) Matlamat afektif tidak ketara;
(ii) Hasil afektif tidak boleh dicapai dalam tempoh tipikal

pengajaran yang ditawarkan di sekolah;
(iii) Ciri-ciri afektif dianggap sebagai perkara peribadi dan bukannya perkara awam; dan
(iv) Tiada kaedah yang kukuh untuk mengumpul maklumat tentang ciri-ciri afektif.
Walau bagaimanapun, matlamat afektif tidak lebih tidak ketara daripada matlamat kognitif. Ada
yang mendakwa bahawa tingkah laku afektif boleh dibangunkan secara automatik apabila
pengetahuan khusus diajar manakala yang lain berpendapat bahawa tingkah laku afektif perlu
dikembangkan secara eksplisit di sekolah. Matlamat afektif tidak semestinya mengambil masa yang
lebih lama untuk dicapai di dalam bilik darjah berbanding matlamat kognitif. Apa yang diperlukan
ialah menyatakan matlamat dengan lebih konkrit dan berorientasikan tingkah laku supaya ia boleh
dinilai dan dipantau.
Terdapat juga kepercayaan bahawa ciri-ciri afektif adalah peribadi dan tidak boleh didedahkan
kepada umum. Walaupun orang ramai menghargai privasi mereka, orang ramai juga mempunyai
hak untuk mendapatkan maklumat. Jika maklumat yang dikumpul diperlukan untuk membuat
keputusan, maka pengumpulan maklumat tersebut secara amnya tidak dianggap sebagai pencerobohan privasi.
Sebagai contoh, jika penilaian digunakan untuk menentukan sama ada pelajar memerlukan
perhatian lanjut seperti pendidikan khas, maka pengumpulan maklumat tersebut bukanlah
pencerobohan privasi. Sebaliknya, jika maklumat yang dicari tidak berkaitan dengan tujuan yang
dinyatakan, maka pengumpulan maklumat tersebut berkemungkinan menjadi pencerobohan privasi.
Begitu juga, maklumat tentang ciri afektif boleh digunakan untuk kebaikan atau keburukan.
Sebagai contoh, jika guru matematik mendapati seorang pelajar mempunyai sikap negatif terhadap
matematik dan mengejek pelajar itu di hadapan kelas, maka maklumat tersebut telah disalahgunakan.
Walau bagaimanapun, jika guru menggunakan maklumat untuk mengubah kaedah pengajarannya
supaya dapat membantu pelajar mengembangkan sikap yang lebih positif terhadap matematik,
maka maklumat tersebut telah digunakan dengan bijak.
Krathwohl, Bloom dan Bertram serta rakan-rakan mereka membangunkan domain afektif pada
tahun 1973 yang memperkatakan perkara-perkara secara emosi seperti perasaan, nilai,
penghargaan, semangat, motivasi dan sikap. Lima kategori utama yang menyenaraikan tingkah
laku yang paling mudah kepada tingkah laku yang paling kompleks ialah menerima, bertindak balas,
menilai, organisasi dan pencirian (rujuk Rajah 2.4).

Rajah 2.4: Taksonomi Krathwohl, Bloom dan BertramÊs hasil pembelajaran afektif
Mari kita membaca untuk mengetahui lebih lanjut tentang taksonomi.
(a) Menerima
Tingkah laku di peringkat menerima memerlukan pelajar untuk menyedari, bersedia untuk
mendengar dan menumpukan perhatiannya. Contoh kata kerja yang menerangkan tingkah laku
pada peringkat penerima ialah tanya, pilih, huraikan, ikut, beri, pegang, cari, nama, tunjuk,
balas dan sebagainya.
Sebagai contoh, pelajar:
(i) Mendengar orang lain dengan hormat; dan
(ii) Mendengar dan mengingati nama pelajar lain.
(b) Bertindak Balas

Tingkah laku pada tahap bertindak balas memerlukan pelajar untuk menjadi peserta aktif, menghadiri
dan bertindak balas terhadap fenomena tertentu, bersedia untuk bertindak balas dan mendapat
kepuasan dalam bertindak balas (motivasi). Contoh kata kerja yang menerangkan tingkah laku pada
tahap memberi respons ialah menjawab, membantu, membantu, mematuhi, mematuhi, berbincang,
memberi salam, membantu, melabel, melakukan, berlatih, mempersembahkan, membaca, menyebut,
melaporkan, memilih, memberitahu, dan menulis.
(i) Mengambil bahagian dalam perbincangan kelas;
(ii) Memberi pembentangan; dan
(iii) Mempersoalkan cita-cita, konsep dan model baharu untuk memahaminya sepenuhnya.

(c) Menghargai
Tahap ini berkaitan dengan nilai atau nilai seseorang yang melekat pada objek, fenomena atau tingkah
laku tertentu. Ia terdiri daripada penerimaan mudah kepada keadaan komitmen yang lebih kompleks.
Penilaian adalah berdasarkan penghayatan set nilai tertentu manakala petunjuk kepada nilai ini
dinyatakan dalam pelajar sebagai tingkah laku terang-terangan dan selalunya boleh dikenal pasti.
Contoh kata kerja yang menerangkan tingkah laku pada peringkat menilai ialah menunjukkan,
membezakan, menerangkan, mengikut, membentuk, memulakan, menjemput, menyertai, mewajarkan,
mencadangkan, membaca, melaporkan, memilih, berkongsi, mengkaji dan bekerja.
(i) Menunjukkan kepercayaan kepada proses demokrasi;
(ii) Peka terhadap perbezaan individu dan budaya (nilai

kepelbagaian);
(iii) Menunjukkan kebolehan menyelesaikan masalah;
(iv) Mencadangkan rancangan untuk penambahbaikan sosial; dan
(v) Mengikuti dengan penuh komitmen.
(d) Organisasi
Pada peringkat ini, seseorang menyusun nilai ke dalam keutamaan dengan membezakan nilai yang
berbeza, menyelesaikan konflik antara mereka dan mewujudkan sistem nilai yang unik.
Penekanan adalah untuk membandingkan, menghubungkait dan mensintesis nilai. Contoh kata kerja
yang menerangkan tingkah laku pada peringkat organisasi ialah mematuhi, mengubah, menyusun,
menggabungkan, membanding, melengkapkan, mempertahankan, menerangkan, merumus,
menggeneralisasi, mengenal pasti, menyepadukan, mengubah suai, menyusun, menyusun,
menyediakan, mengaitkan dan mensintesis.
(i) Menyedari keperluan untuk keseimbangan antara kebebasan dan tanggungjawab

tingkah laku;
(ii) Menerima tanggungjawab terhadap tingkah lakunya;
(iii) Menerangkan peranan perancangan yang sistematik dalam menyelesaikan masalah;
(iv) Menerima standard etika profesional;
(v) Mencipta rancangan hidup yang selaras dengan kebolehan, minat dan kepercayaan; dan
(vi) Mengutamakan masa dengan berkesan untuk memenuhi keperluan organisasi, keluarga
dan diri sendiri.

(e) Perwatakan
Pada tahap ini, sistem nilai seseorang mengawal tingkah lakunya. Tingkah laku itu meresap,
konsisten, boleh diramal dan yang paling penting, mencirikan pelajar. Contoh kata kerja yang
menerangkan tingkah laku pada tahap ini ialah bertindak, mendiskriminasi, memaparkan,
mempengaruhi, mendengar, mengubah suai, melaksanakan, berlatih, mencadangkan,
melayakkan, menyoal, menyemak, melayani, menyelesaikan. dan mengesahkan
(i) Menunjukkan sikap berdikari apabila bekerja secara berdikari;
(ii) Bekerjasama dalam aktiviti kumpulan (mempamerkan kerja berpasukan);
(iii) Menggunakan pendekatan objektif dalam penyelesaian masalah;
(iv) Memaparkan komitmen profesional terhadap amalan etika setiap hari;
(v) Menyemak pertimbangan dan mengubah tingkah laku berdasarkan bukti baharu; dan
(vi) Menghargai orang kerana apa yang mereka ada, bukan penampilan mereka.
Jadual 2.3 menunjukkan bagaimana taksonomi afektif boleh digunakan pada nilai seperti
kejujuran. Ia mengesan perkembangan sifat afektif seperti kejujuran daripada peringkat
„menerima‰ sehingga ke peringkat „pencirian‰ di mana nilai menjadi sebahagian daripada
perwatakan individu.
Jadual 2.3: Taksonomi Afektif untuk Kejujuran
Watak Individu Penjelasan
Menerima (Menghadiri) Sedar bahawa perkara tertentu adalah jujur atau tidak jujur
Menjawab Mengatakan bahawa kejujuran adalah lebih baik dan berkelakuan

sewajarnya
Menghargai Secara konsisten (tetapi tidak selalu) bercakap benar
Organisasi Bersikap jujur dalam pelbagai situasi
Pencirian oleh nilai atau kompleks Jujur dalam kebanyakan situasi, mengharapkan orang lain bersikap jujur
nilai dan berinteraksi dengan orang lain dengan penuh kejujuran
SEMAK KENDIRI 2.2
Terangkan perbezaan antara pencirian dan penilaian mengikut

kepada taksonomi afektif hasil pembelajaran.

AKTIVITI 2.3
1. Peranan Kesan dalam Pendidikan
„Ada yang mengatakan sekolah hanya perlu mementingkan kandungan.‰
„Adalah mustahil untuk mengajar kandungan tanpa memberi kesan pengajaran juga.
‰ „Sejauh manakah, jika ada, kita harus prihatin dengan
penilaian hasil afektif?‰ Bincangkan tiga
pernyataan dalam konteks rakyat Malaysia
sistem pendidikan.
2. Pilih mana-mana dua nilai daripada senarai 16 nilai universal dan reka bentuk
taksonomi afektif bagi setiap nilai seperti yang ditunjukkan dalam Jadual 2.3.
3. „Seorang pelajar beroperasi pada tahap bertindak balas.‰
Apakah maksud pernyataan tersebut? Terangkan.
Kongsi semua jawapan anda dengan rakan kursus anda dalam forum dalam talian myINSPIRE.
2.5 MENILAI PEMBELAJARAN PSIKOMOTOR

HASIL
Domain psikomotor merangkumi pergerakan fizikal, koordinasi dan penggunaan kawasan kemahiran
motor. Pembangunan kemahiran ini memerlukan latihan dan diukur dari segi kelajuan, ketepatan, jarak,
prosedur atau teknik dalam pelaksanaan. Tujuh kategori utama yang disenaraikan daripada tingkah laku
yang paling mudah kepada yang paling kompleks ditunjukkan dalam Rajah 2.5.
Rajah 2.5: Taksonomi hasil pembelajaran psikomotor

Marilah kita membaca lebih lanjut untuk mengetahui lebih lanjut tentang pembelajaran psikomotor.
(a) Persepsi
Persepsi adalah keupayaan untuk menggunakan isyarat deria untuk membimbing aktiviti
motor. Ini terdiri daripada rangsangan deria melalui pemilihan isyarat kepada terjemahan.
Contoh kata kerja yang menerangkan jenis tingkah laku ini ialah memilih, menerangkan, mengesan,
membezakan, membezakan, mengenal pasti, mengasingkan, mengaitkan dan memilih..
(i) Mengesan isyarat komunikasi bukan lisan daripada jurulatih;
(ii) Anggaran di mana bola akan mendarat selepas ia dibaling dan kemudian bergerak ke
lokasi yang betul untuk menangkap bola;
(iii) Melaraskan haba dapur pada suhu yang betul melalui bau dan rasa makanan; dan
(iv) Melaraskan ketinggian tangga berhubung dengan titik di dinding.
(b) Tetapkan
Ia termasuk set mental, fizikal dan emosi. Ketiga-tiga set ini ialah kecenderungan yang
menentukan terlebih dahulu tindak balas seseorang terhadap situasi yang berbeza
(kadangkala dipanggil minda). Contoh kata kerja yang menerangkan „set‰ ialah mula,
paparkan, terangkan, gerakkan, teruskan, gerak balas, tunjukkan, nyatakan dan sukarela.
(i) Mengetahui dan bertindak mengikut urutan langkah dalam proses pembuatan;
(ii) Mengiktiraf kebolehan dan batasannya; dan
(iii) Menunjukkan keinginan untuk mempelajari proses baru (motivasi).
• Nota: Subbahagian domain psikomotor ini berkait rapat dengan subbahagian

„bertindak balas‰ domain afektif.
(c) Tindak Balas Terbimbing

Tindak balas terbimbing merujuk kepada peringkat awal pembelajaran kemahiran kompleks yang
merangkumi peniruan dan percubaan dan kesilapan. Kecukupan prestasi dicapai dengan berlatih.
Contoh kata kerja yang menerangkan „gerak balas terbimbing‰ ialah menyalin, mengesan,
.
mengikuti, bertindak balas, menghasilkan semula dan bertindak balas

TOPIK 2 YAYASAN UNTUK PENILAIAN: APA YANG PERLU DINILAI ÿ 37
(i) Melakukan persamaan matematik;
(ii) Ikut arahan semasa membina model a kampung rumah; dan
(iii) Membalas isyarat tangan jurulatih semasa belajar gimnastik.
(d) Mekanisme
Ini adalah peringkat pertengahan dalam mempelajari kemahiran yang kompleks. Tindak balas
yang dipelajari telah menjadi kebiasaan dan pergerakan boleh dilakukan dengan sedikit keyakinan
dan kemahiran. Contoh kata kerja yang menerangkan „mekanisme‰ termasuk memasang,
menentukur, membina, membongkar, memaparkan, mengikat, membetulkan, mengisar,
. menyusun
memanaskan, memanipulasi, mengukur, membaiki, mencampur dan
(i) Menggunakan komputer;
(ii) Membaiki paip yang bocor;
(iii) Membetulkan palam elektrik tiga pin; dan
(iv) Menunggang motosikal.
(e) Tindak balas Terlalu Kompleks

Tindak balas terang yang kompleks melibatkan prestasi lakuan motor yang mahir yang
melibatkan corak pergerakan yang kompleks. Kemahiran ditunjukkan oleh prestasi pantas,
tepat dan sangat diselaraskan yang memerlukan tenaga minimum.
Kategori ini termasuk persembahan tanpa teragak-agak dan prestasi automatik. Sebagai
contoh, pemain tenis seperti Maria Sharapova dan Serena Williams sering mengeluarkan
bunyi kepuasan atau makian sebaik sahaja mereka memukul bola tenis. Begitu juga dengan
pemain golf apabila mereka segera menyedari bahawa mereka telah melakukan pukulan
yang teruk. Ini kerana mereka boleh mengetahui dengan perasaan perbuatan dan hasil yang
akan menyusul. Contoh kata kerja yang menerangkan „tindak balas terang-terangan yang
kompleks‰ ialah memasang, membina, menentukur, membina, merungkai, mempamerkan,
mengikat, membetulkan, mengisar, memanaskan, memanipulasi, mengukur, membaiki,
mencampur, menyusun dan . melakar
(i) Menggerakkan kereta ke tempat letak kereta selari yang ketat;
(ii) Mengendalikan komputer dengan cepat dan tepat; dan
(iii) Mempamerkan kecekapan semasa bermain piano.

• Perhatikan bahawa kebanyakan kata kerja adalah sama dengan „mekanisme‰, tetapi
akan mempunyai kata adverba atau kata adjektif yang menunjukkan bahawa
prestasinya lebih cepat, lebih baik dan lebih tepat.
(f) Penyesuaian
Kemahiran berkembang dengan baik dan individu boleh mengubah suai corak pergerakan agar sesuai
dengan keperluan khas. Contoh kata kerja yang menerangkan „penyesuaian‰ ialah menyesuaikan,
.
mengubah, mengubah, menyusun semula, menyusun semula, menyemak dan mengubah
(i) Bertindak balas secara berkesan kepada pengalaman yang tidak dijangka;
(ii) Mengubah suai arahan untuk memenuhi keperluan pelajar;
(iii) Melaksanakan tugas dengan mesin yang pada asalnya tidak direka untuk
dilakukan (dengan andaian mesin itu tidak rosak dan tidak ada bahaya dalam
melaksanakan tugas baru).
(g) Asal
Asal ialah tentang mencipta pergerakan atau corak baharu agar sesuai dengan situasi
atau masalah tertentu. Hasil pembelajaran menekankan kreativiti berdasarkan kemahiran
yang sangat maju. Contoh kata kerja yang menerangkan „asal‰ ialah menyusun,
membina, menggabungkan, mengarang, membina, mencipta, mereka bentuk, memulakan,
.
membuat dan mengasal.
(i) Membina teori baharu;
(ii) Membangunkan teknik baru untuk penjaga gol; dan
(iii) Mencipta rutin gimnastik baharu.
SEMAK KENDIRI 2.3
Terangkan perbezaan antara penyesuaian dan tindak balas terbimbing

mengikut taksonomi psikomotor hasil pembelajaran

AKTIVITI 2.4
„Seorang pelajar beroperasi pada peringkat asal.‰
Apakah maksud pernyataan tersebut? Terangkan.
forum.
Sebagai panduan, Jadual 2.5 menunjukkan peruntukan masa bagi setiap jenis soalan.
Jadual 2.5: Peruntukan Masa untuk Setiap Jenis Soalan
Tugasan Anggaran Masa Setiap Item
Betul salah 20ÿ30 saat
Aneka pilihan (fakta) 40ÿ60 saat
Aneka pilihan (kompleks) 70ÿ90 saat
Padanan (5 batang atau 6 pilihan) 2ÿ4 minit
Jawapan-jawapan pendek 2ÿ4 minit
Aneka pilihan (dengan pengiraan) 2ÿ5 minit
Masalah perkataan (matematik mudah) 5ÿ10 minit
esei pendek 15ÿ20 minit
Analisis data atau grafik 15ÿ25 minit
Esei lanjutan 35ÿ50 minit
Setelah soalan anda dibangunkan, pastikan anda memasukkan arahan yang jelas untuk pelajar.
Untuk item objektif, nyatakan bahawa mereka harus memilih satu jawapan untuk setiap item dan
nyatakan nilai mata bagi setiap soalan, terutamanya jika anda memperuntukkan pemberat yang
berbeza kepada bahagian ujian yang berbeza. Untuk item esei, nyatakan nilai mata dan masa yang
dicadangkan untuk dibelanjakan untuk item tersebut. Kami akan membincangkan pelbagai jenis
soalan dengan lebih terperinci dalam Topik 3 dan 4. Jika anda mengajar kelas besar dengan susunan
tempat duduk yang rapat dan memberikan ujian objektif, anda mungkin ingin mempertimbangkan
untuk mentadbir beberapa versi ujian anda untuk meminimumkan peluang untuk menipu. Ini
dilakukan dengan mencipta versi ujian anda dengan penomboran item yang berbeza.

• Penilaian hasil kognitif kekal menjadi tumpuan kebanyakan sistem penilaian di seluruh dunia
kerana ia lebih mudah untuk diperhatikan dan
mengukur.
• Setiap domain pembelajaran terdiri daripada subbahagian, bermula daripada tingkah laku yang
paling mudah kepada yang paling kompleks sekali gus membentuk taksonomi hasil pembelajaran.
• Apabila kita menilai atau menilai seseorang manusia, kita sedang menilai atau menilai tingkah laku
seseorang.
• Setiap bidang mata pelajaran mempunyai repertoir unik fakta, konsep, prinsip, generalisasi, teori,
undang-undang, prosedur dan kaedah yang dihantar kepada pelajar.
• Terdapat enam tahap dalam taksonomi BloomÊs hasil pembelajaran kognitif dengan tahap paling
rendah dipanggil pengetahuan diikuti oleh lima tahap kebolehan mental yang semakin sukar,
iaitu kefahaman, aplikasi, analisis, sintesis dan penilaian.
• Enam peringkat dalam versi taksonomi Bloom yang disemak semula ialah mengingat, memahami,
mengaplikasi, menganalisis, menilai dan mencipta.
• Ciri afektif melibatkan perasaan atau emosi seseorang. Sikap, nilai, harga diri, lokus kawalan,
efikasi kendiri, minat, aspirasi dan kebimbangan adalah contoh ciri afektif.
• Lima kategori utama domain afektif daripada tingkah laku yang paling mudah kepada tingkah laku
yang paling kompleks ialah menerima, bertindak balas, menilai, organisasi dan perwatakan.
• Domain psikomotor merangkumi pergerakan fizikal, koordinasi, dan penggunaan kawasan

kemahiran motor.
• Tujuh kategori utama domain psikomotor daripada tingkah laku yang paling mudah kepada yang
paling kompleks ialah persepsi, set, gerak balas terpandu, mekanisme, respons terang-terangan
kompleks, penyesuaian dan asalan.

Hasil pembelajaran afektif Penilaian holistik
Taksonomi Bloom Hasil pembelajaran psikomotor

Hasil pembelajaran kognitif Ratusan Membantu

Topik ÿ Merancang
Ujian Bilik Darjah
3
HASIL PEMBELAJARAN
1. Rancang ujian bilik darjah dengan menentukan tujuannya;
2. Nyatakan objektif pembelajaran ujian bilik darjah; 3. Membangunkan
spesifikasi ujian ujian bilik darjah; Pilih jenis item terbaik ujian bilik
4. darjah;
5. Tentukan rubrik atau skema pemarkahan ujian bilik darjah; 6. Menyediakan item
ujian untuk ujian bilik darjah; dan 7. Huraikan pertimbangan dalam menyediakan
item ujian yang berkaitan.
ÿ PENGENALAN
Dalam topik ini kita akan memberi tumpuan kepada kaedah merancang ujian bilik darjah. Pengujian
adalah sebahagian daripada proses pengajaran dan pembelajaran. Kepentingan merancang dan
menulis ujian yang boleh dipercayai, sah dan adil tidak boleh dipandang remeh. Mereka bentuk ujian
adalah bahagian penting dalam menilai pemahaman pelajar tentang kandungan kursus dan tahap
kecekapan mereka dalam mengaplikasikan apa yang telah mereka pelajari. Sama ada anda
menggunakan kuiz berkepentingan rendah atau peperiksaan pertengahan dan akhir semester
berkepentingan tinggi, reka bentuk ujian yang teliti akan membantu memberikan keputusan yang lebih
ditentukur. Penilaian harus mendedahkan sejauh mana pelajar telah belajar berdasarkan apa yang guru mahu mereka belajar
arahan memudahkan pembelajaran mereka. Oleh itu, hanya menjalankan penilaian sumatif pada akhir
program pengajaran adalah tidak mencukupi. Adalah berguna untuk memikirkan tentang menilai pelajar
pada setiap peringkat proses perancangan. Mengenal pasti cara untuk menilai pelajar mereka
membantu menentukan aktiviti pembelajaran yang paling sesuai.

TOPIK 3 MERANCANG UJIAN BILIK DARJAH ÿ 43
Dalam topik ini kita akan membincangkan garis panduan umum yang digunakan untuk kebanyakan alat
penilaian. Topik 4 dan 5 akan membincangkan secara terperinci tentang objektif dan ujian esei. Alat
penilaian tulen seperti projek dan portfolio akan dibincangkan dalam topik masing-masing.
3.1 TUJUAN PENGUJIAN BILIK DARJAH

Ujian boleh dirujuk sebagai:
(a) Ujian kertas dan pensel tradisional atau berasaskan komputer dalam bentuk berbilang
pilihan, jawapan pendek atau ujian esei; dan
(b) Penilaian prestasi seperti projek, temu bual, pembentangan atau lain-lain
penilaian alternatif.
Ujian memberikan guru maklum balas objektif tentang sejauh mana pelajar telah belajar dan memahami
subjek yang diajar. Ujian pencapaian yang diterbitkan secara komersil boleh memberikan, sedikit
sebanyak, penilaian tahap pengetahuan pelajar individu tetapi hanya bimbingan pengajaran yang
terhad dalam menilai pelbagai kemahiran yang diajar dalam mana-mana bilik darjah.
Guru mengenali pelajar mereka. Ujian yang dibangunkan oleh setiap guru untuk digunakan dalam kelas
mereka sendiri adalah yang paling relevan dari segi pengajaran. Guru boleh menyesuaikan ujian untuk
menekankan maklumat yang mereka anggap penting dan sepadan dengan tahap keupayaan pelajar
mereka. Jika dibina dengan teliti, ujian bilik darjah boleh memberikan guru maklumat yang tepat dan
berguna tentang pengetahuan yang disimpan oleh pelajar mereka.
Kunci kepada proses ini ialah soalan ujian yang digunakan untuk mendapatkan bukti pembelajaran.
Soalan dan tugasan ujian bukan sekadar alat perancangan; mereka juga membentuk bahagian penting
dalam urutan pengajaran. Menggabungkan tugasan ke dalam pengajaran dan menggunakan bukti
pembelajaran pelajar untuk menentukan apa yang berlaku seterusnya dalam pelajaran adalah benar-
benar penilaian formatif tertanam.
„Perkongsian soalan berkualiti tinggi mungkin merupakan perkara paling penting yang boleh kita
lakukan untuk meningkatkan kualiti pembelajaran pelajar,‰ (William, D., 2011).

44 ÿ TOPIK 3 MERANCANG UJIAN BILIK DARJAH
3.2 MERANCANG UJIAN BILIK DARJAH

Ujian yang dibina dengan baik mesti mempunyai item berkualiti tinggi. Ujian yang dibina dengan baik
ialah instrumen yang mampu memberikan ukuran yang tepat bagi keupayaan pengambil ujian dalam
domain tertentu. Adalah berbaloi untuk meluangkan masa untuk menulis item berkualiti tinggi untuk ujian.
Untuk menghasilkan soalan berkualiti tinggi, pembinaan ujian perlu dirancang dengan betul. Berikut
ialah enam langkah perancangan ujian:
(a) Menentukan tujuannya;
(b) Menentukan objektif pembelajaran;
(c) Membangunkan spesifikasi ujian;
(d) Memilih jenis item terbaik;
(e) Memutuskan rubrik atau skema pemarkahannya; dan
(f) Menyediakan item ujian.
Kami akan melihat perkara ini secara terperinci dalam subtopik berikut.
3.2.1 Menentukan Tujuannya

Langkah pertama dalam perancangan ujian ialah menentukan tujuan ujian. Ujian boleh digunakan
untuk pelbagai tujuan. Jika ujian itu hendak digunakan secara formatif, ujian itu boleh menunjukkan
dengan tepat apa yang perlu dipelajari oleh pelajar dan ke tahap apa. Tujuan ujian formatif adalah
untuk menilai kemajuan dan mengarahkan proses pembelajaran. Ujian ini akan mempunyai sampel
hasil pembelajaran yang terhad. Guru mesti menyediakan campuran dan aras kesukaran item yang
mencukupi. Item ini digunakan untuk membuat preskripsi pembetulan seperti semakan untuk
keseluruhan kumpulan dan latihan latihan untuk sesetengah pelajar. Jika ujian itu hendak digunakan
secara sumatif, ujian itu akan mempunyai liputan objektif yang luas.

Satu lagi tujuan penting ujian ialah pemilihan. Ujian ini digunakan untuk membuat keputusan sama ada
calon akan diterima, lulus atau gagal atau tidak. Ujian yang membawa kepada penilaian dan memberikan
bukti bahawa tahap pengetahuan atau kemahiran tertentu telah dikuasai (contohnya dengan pemberian
kredit kursus) dirujuk sebagai ujian sumatif.
Ujian juga boleh berfungsi untuk tujuan diagnostik. Dalam kes sedemikian, ujian digunakan untuk
menyediakan pelajar dengan cerapan tentang jurang dalam pengetahuan dan set kemahiran semasa mereka.
Sebagai alternatif, ujian juga boleh digunakan untuk memotivasikan pelajar untuk mempamerkan tingkah
laku belajar yang berkesan.
3.2.2 Menentukan Objektif Pembelajaran

Langkah seterusnya ialah mempertimbangkan objektif pembelajaran dan kepentingan relatif objektif
pembelajaran. Guru perlu memilih pengetahuan dan kemahiran yang sesuai untuk dinilai dan memasukkan
lebih banyak soalan berkenaan dengan objektif pembelajaran yang lebih penting.
Objektif pembelajaran yang ingin ditekankan oleh guru akan menentukan bukan sahaja bahan yang perlu
dimasukkan dalam ujian tetapi juga bentuk ujian yang khusus. Sebagai contoh, jika penting bagi pelajar
untuk dapat menyelesaikan masalah pembahagian panjang dengan cepat, pertimbangkan untuk
memberikan ujian kelajuan. Jika penting untuk pelajar memahami bagaimana peristiwa sejarah
mempengaruhi satu sama lain, jawapan pendek atau soalan esei mungkin sesuai. Jika penting untuk
pelajar mengingati tarikh, soalan aneka pilihan atau isikan-kosong mungkin sesuai.
3.2.3 Membangunkan Spesifikasi Ujian

Membuat rangka tindakan ujian atau Jadual Spesifikasi adalah langkah penting seterusnya yang perlu
dilakukan oleh guru. Jadual menerangkan kandungan, tingkah laku pelajar dan bilangan soalan dalam
ujian yang sepadan dengan bilangan jam yang ditumpukan kepada objektif pembelajaran di dalam kelas.
Sebenarnya, berapa banyak soalan yang perlu dimasukkan dalam ujian adalah berdasarkan kepentingan
objektif, jenis soalan, perkara subjek dan jumlah masa yang ada untuk ujian.

Jadual Spesifikasi ialah pelan yang disediakan oleh guru kelas sebagai asas pembinaan ujian. Ia
adalah jadual dua hala yang menerangkan topik yang akan diliputi dalam ujian dan bilangan item yang
dikaitkan dengan setiap topik. Jadual memastikan bahawa sampel soalan yang adil dan mewakili
muncul dalam ujian. Guru tidak boleh mengukur setiap topik atau objektif dan tidak boleh menanyakan
setiap soalan yang mereka ingin tanya. Jadual Spesifikasi membolehkan guru membina ujian yang
memfokuskan kepada bidang utama dan wajaran (dalam peratusan) yang diberikan dalam bahagian
ujian yang berbeza berdasarkan kepentingannya. Jadual Spesifikasi menyediakan bukti kepada guru
bahawa sesuatu ujian mempunyai kesahan kandungan dan ia meliputi perkara yang perlu diliputi.
Jadual ini juga membolehkan guru melihat ujian secara keseluruhan.
Satu sampel Jadual Spesifikasi yang ditunjukkan dalam Jadual 3.1 mempunyai kandungan pada satu
lajur dan tahap kognitif di bahagian atas. Walau bagaimanapun, guru juga boleh menyusun kandungan
merentas bahagian atas dan peringkat bawah lajur. Dalam sampel ini, guru yang menyediakan jadual
mengumpulkan tahap „Mengingat‰ dan „Memahami‰ bersama-sama. Kemungkinan besar dia
percaya ingatan terus adalah terlalu mudah untuk dianggap sebagai pembelajaran sebenar.
Jadual 3.1: Contoh Jadual Spesifikasi
Tahap
Kandungan Jumlah
Mengingati dan Memohon Menganalisis, Menilai dan
Pemahaman (%) (%) Mencipta (%) (%)
Topik 1 15 15 30 60
Topik 2 10 20 10 40
Jumlah 25 35 40 100
Untuk Jadual Spesifikasi berguna, ia biasanya mengandungi lebih banyak butiran daripada sampel
yang ditunjukkan dalam Jadual 3.1. Bilangan soalan yang akan dimasukkan ke dalam sesuatu ujian
adalah berdasarkan kepentingan objektif, jenis soalan, subjek dan jumlah masa yang ada untuk ujian.
Jadual Spesifikasi yang lebih terperinci ditunjukkan dalam Jadual 3.2.


Dalam contoh yang ditunjukkan dalam Jadual 3.2, lajur menegak di sebelah kiri jadual
2 hala menunjukkan senarai topik yang diliputi dalam kelas dan jumlah masa yang
dibelanjakan untuk topik tersebut. Topik juga boleh dibahagikan lagi kepada subtopik
seperti „Tolak dua nombor tanpa mengumpul semula nombor 2 digit daripada nombor
2 digit‰ di bawah topik „Penolakan dalam lingkungan 1000‰.
Jumlah masa yang dihabiskan dalam topik seperti yang ditunjukkan dalam lajur „Jam
Interaksi‰ boleh digunakan sebagai asas untuk mengira wajaran atau peratusan dan
bilangan soalan atau item bagi setiap topik. Sebagai contoh, guru telah menghabiskan
20 jam mengajar tiga topik yang mana 6 jam diperuntukkan untuk „Tambahan dengan
jumlah tertinggi 1000‰. Maka, 6 jam daripada jumlah 20 jam berjumlah 30% atau 9
item daripada jumlah 30 item seperti yang dirancang oleh guru.
Guru mungkin mempunyai sebab untuk memperuntukkan 25%, 35% dan 40% untuk
tahap „Mengingat‰, „Memahami‰ dan „Mengaplikasi‰ masing-masing. Mungkin dia
cuba melatih pelajar Tahun 2nya untuk memberi lebih perhatian kepada soalan „berfikir‰.
25% daripada tahap „Mengingat‰ sebenarnya ialah 7.5 soalan, 35% daripada tahap
„Pemahaman‰ ialah 10.5 soalan dan 40% daripada tahap „Mengaplikasi‰ ialah 12
soalan. Jumlah 30 tidak terjejas kerana nombor 7.5 dan 10.5 mudah dibundarkan
kepada 8 dan 10.
Sel dalam # lajur boleh diisi atau dikira sewenang-wenangnya menggunakan formula
mudah. Dalam # lajur pertama, topik „Tambahan ...‰ di bawah tahap „Mengingat‰
hendaklah 25% ÿ 9 = 2.25, topik „Penolakan ...‰ di bawah „Mengingat‰ ialah 25% ÿ
9 = 2.25 dan topik „Pendaraban ...‰ di bawah „Mengingat‰ ialah 25% ÿ 12 = 3. Guru
boleh sama ada membundarkan nombor 2.25, 2.25, 3 hingga 3, 2, 3 atau 2, 3, 3.
Guru, terutamanya yang baru dilatih, dinasihatkan supaya Jadual Spesifikasi ini
bersama-sama sukatan pelajaran disemak oleh pakar mata pelajaran atau Ketua
Jabatan mata pelajaran untuk mengesahkan sama ada rancangan ujian itu benar-benar
mengukur apa yang ditetapkan untuk diukur. . Apabila item ujian telah digubal dan
dipasang, adalah dinasihatkan supaya sekali lagi menyerahkan draf kertas ujian dan
Jadual Spesifikasi kepada Ketua Jabatan atau pakar mata pelajaran yang diiktiraf untuk
menilai sama ada item ujian itu, sebenarnya, menilai. kandungan yang ditentukan.
Kesahan kandungan berbeza dengan kesahan muka. Kesahan muka menilai sama
ada ujian „kelihatan sah‰ kepada pemeriksa yang menduduki ujian manakala kesahan
kandungan memerlukan pakar subjek yang diiktiraf untuk menilai sama ada item ujian
menilai kandungan yang ditentukan.

Jelas sekali bahawa Jadual Spesifikasi memberi manfaat kepada pelajar dalam dua cara:
(a) Meningkatkan kesahan ujian konstruk guru; dan
(b) Dapat meningkatkan pembelajaran pelajar.
Jadual Spesifikasi membantu memastikan terdapat padanan antara apa yang diajar dan apa
yang diuji. Daripada contoh tersebut, kita dapat melihat bahawa pentaksiran bilik darjah
didorong oleh pengajaran bilik darjah yang seterusnya didorong oleh objektif pembelajaran.
SEMAK KENDIRI 3.1
1. Apakah Jadual Spesifikasi?
2. Bagaimanakah Jadual Spesifikasi meningkatkan kesahan sesuatu ujian?
3.2.4 Memilih Jenis Item Terbaik

Sebelum memutuskan jenis format ujian tertentu, guru hendaklah terlebih dahulu menetapkan
perkara berikut:
(a) Adakah ujian itu masuk akal?
(b) Apakah yang ingin dinilai oleh guru?
Penentuan apa yang guru ingin ukur dengan ujian harus mendahului penentuan bagaimana
mereka akan mengukurnya.
Ujian dan peperiksaan melibatkan penyiasatan terhadap pengetahuan, pemahaman dan

kemahiran pelajar serta penilaian hasil penyiasatan itu. Nampaknya format ujian yang
digunakan adalah salah satu faktor pendorong utama dalam tingkah laku pembelajaran
pelajar. Sebagai contoh, pelajar membuat persediaan berbeza untuk ujian aneka pilihan
daripada yang mereka lakukan untuk peperiksaan lisan. Format ujian manakah yang paling
sesuai dengan tujuan guru bergantung kepada objektif pembelajaran. Apabila bercakap
tentang objektif pembelajaran untuk latihan akademik, kemahiran profesional dan kemahiran
yang kompleks, selalunya sukar untuk memilih format ujian yang sesuai. Ramai yang memilih
gabungan format ujian yang berbeza untuk menyiasat dan menilai sama ada pelajar telah
mencapai semua objektif pembelajaran. Pemilihan ujian biasanya melibatkan tahap kompromi
kerana setiap format ujian mempunyai kebaikan dan keburukan. Jadual 3.3 menyenaraikan
beberapa jenis item dan tujuan masing-masing.

Jadual 3.3: Jenis Item dan Tujuan Masing-masing
Jenis barang Tujuan

Pelbagai pilihan • Menguji pengetahuan fakta
• Menilai sejumlah besar item •
Menjaring dengan cepat, tepat dan objektif
Esei • Calon dikehendaki menulis satu ujian lanjutan berdasarkan topik
tertentu
• Menilai kemahiran berfikir aras tinggi seperti menganalisis,
menilai dan mencipta dalam taksonomi Bloom
Peperiksaan lisan • Soalan tertumpu kepada pengetahuan,
pemahaman dan aplikasi
• Ujian dengan soalan tertutup dan soalan terbuka
3.2.5 Menyediakan Rubrik atau Skema Pemarkahan

Menyediakan rubrik atau skema pemarkahan lebih awal daripada tarikh ujian akan memberi guru masa
yang mencukupi untuk menyemak soalan mereka dan membuat perubahan pada jawapan apabila
perlu.
Guru harus membiasakan diri untuk menulis model jawapan yang mudah difahami oleh orang lain.
Jawapan model ini boleh digunakan oleh guru lain yang bertindak sebagai pemeriksa luar, jika perlu.
Selain itu, rubrik juga boleh menjadi alat yang berkesan untuk membantu guru atau pemeriksa luar.
Penyelarasan perlu dilakukan setelah skrip ujian dikumpul. Guru hendaklah cuba membaca beberapa
jawapan daripada skrip dan menyemak jawapan yang betul dalam skema pemarkahan. Guru
kadangkala mendapati bahawa pelajar telah mentafsir soalan ujian dengan cara yang berbeza daripada
apa yang dihasratkan.
Pelajar mungkin menghasilkan jawapan yang sangat baik yang mungkin sedikit di luar apa yang
ditanya. Pertimbangkan untuk memberi markah yang sewajarnya kepada pelajar ini.
Guru hendaklah membuat catatan dalam skema pemarkahan untuk sebarang kesilapan yang dibuat
sebelum ini tetapi dibawa melalui jawapan. Markah hendaklah ditolak jika selebihnya respons adalah
baik.

Skim pemarkahan boleh meningkatkan kecekapan penggredan ujian tetapi selalunya ia hanya memberikan
maklumat terhad untuk menggalakkan pembelajaran. Selain skema pemarkahan, rubrik boleh disediakan
untuk bertindak sebagai alat tambahan untuk membantu guru atau pemeriksa luar. Banyak batasan skema
pemarkahan boleh diatasi dengan mempunyai rubrik yang mengandungi huraian tahap prestasi yang
dipertimbangkan dengan teliti dan dinyatakan dengan jelas.
Rubrik ialah skema pemarkahan deskriptif yang dibangunkan oleh guru, dan kadangkala berunding dengan
pelajar, untuk membimbing pertimbangan berkenaan dengan produk atau proses tugas penilaian pelajar.
Dalam istilah yang lebih mudah, rubrik ialah senarai semak dua dimensi lanjutan tentang perkara yang
dijangkakan dalam kriteria penilaian yang dipadankan dengan huraian tentang seberapa baik kerja itu
membentangkan setiap kriteria. Ia amat berguna untuk menilai tugas penilaian seperti portfolio dan projek.
Rubrik umum boleh membantu pelajar membina konsep tentang maksud melaksanakan sesuatu kemahiran
dengan baik. Rubrik umum tidak „memberi jawapan‰ kepada soalan. Sebaliknya, ia mengandungi huraian
seperti „Penjelasan penaakulan adalah jelas dan disokong oleh perincian yang sesuai.‰ Penerangan
seperti ini membantu pelajar memberi tumpuan kepada sasaran pembelajaran mereka sepatutnya. Mereka
memberikan penjelasan kepada pelajar tentang cara mendekati projek. Rubrik akan dibincangkan dengan
lebih terperinci dalam Topik 6 modul ini.
3.2.6 Menyediakan Item Ujian

Walaupun jenis soalan yang berbeza (aneka pilihan, jawapan pendek, benar-salah, padanan dan esei)
dibina secara berbeza, prinsip berikut digunakan untuk membina soalan dan ujian secara umum:
(a) Gunakan arahan yang ringkas dan ringkas untuk setiap jenis soalan;
(b) Gunakan bahasa yang mudah dan jelas dalam soalan;
(c) Tulis item yang memerlukan pemahaman atau kebolehan khusus yang dibangunkan di dalamnya
sudah tentu, bukan hanya kecerdasan am atau kebijaksanaan ujian;
(d) Jangan berikan petunjuk atau cadangkan jawapan kepada satu soalan dalam kandungan
soalan lain;
(e) Elakkan menulis soalan secara negatif. Jika anda mesti menggunakan negatif, serlahkannya kerana ia
boleh mengelirukan pelajar untuk menjawab dengan salah;

(f) Nyatakan unit dan ketepatan jawapan;
(g) Cuba, seboleh-bolehnya, untuk membina soalan anda sendiri. Semak untuk memastikan soalan sesuai
dengan objektif dan keperluan pembelajaran dalam Jadual Spesifikasi jika anda perlu menggunakan
soalan daripada sumber lain; dan
(h) Jika sesuatu item disemak, semak semula kaitannya.
Garis panduan untuk menyediakan dan menulis aneka pilihan, jawapan pendek, benar-salah, padanan, esei,
portfolio dan tugasan projek akan dibincangkan masing-masing dalam Topik 4, 5, 6 dan 7.
3.3 MENILAI UJIAN GURU SENDIRI

Tidak kira jenis ujian yang digunakan, guru boleh menilai keberkesanannya dengan mengemukakan soalan
berikut:
(a) Adakah saya menguji apa yang saya fikir saya sedang menguji?
Jika anda ingin tahu sama ada pelajar boleh menggunakan konsep pada situasi baharu tetapi
kebanyakannya bertanya soalan yang memerlukan pelajar melabel bahagian atau mentakrifkan istilah,
itu bermakna anda telah menguji untuk mengingat semula dan bukannya aplikasi.
(b) Adakah Saya Menguji Apa yang Saya Ajar?

Sebagai contoh, soalan anda mungkin telah menguji pemahaman pelajar tentang ciri atau prosedur
permukaan. Sebaliknya, anda telah bersyarah tentang sebab atau perkaitan seperti bagaimana tulang-
tulang kaki berfungsi bersama semasa kita berjalan.
(c) Adakah Saya Menguji Apa yang Saya Tekankan dalam Kelas?
Pastikan anda telah bertanya kebanyakan soalan berkenaan dengan bahan yang anda rasa paling
penting, terutamanya jika anda telah menekankannya di dalam kelas. Elakkan soalan mengenai bahan
kabur yang berwajaran sama dengan soalan mengenai bahan penting.
(d) Adakah Bahan yang Saya Uji Benar-Benar Apa yang Saya Inginkan Pelajar Belajar?
Contohnya, jika anda mahu pelajar menggunakan kemahiran analitikal seperti kebolehan mengenal
corak atau membuat inferens tetapi hanya menggunakan soalan benar-salah yang memerlukan
ingatan bukan inferens, anda boleh cuba membina soalan benar-salah atau aneka pilihan yang lebih
kompleks .

Pelajar harus tahu apa yang diharapkan daripada mereka. Mereka seharusnya dapat mengenal
pasti ciri-ciri jawapan yang memuaskan dan memahami kepentingan relatif ciri-ciri tersebut. Ini
boleh dicapai dalam pelbagai cara. Contohnya, anda boleh memberikan maklum balas tentang
ujian, menerangkan jangkaan anda dalam kelas atau menyiarkan penyelesaian model pada blog
kelas. Guru digalakkan membuat nota pada skrip ujian.
Apabila skrip ujian dikembalikan kepada pelajar, nota akan membantu mereka memahami
kesilapan mereka dan membetulkannya.
SEMAK KENDIRI 3.2
1. Apakah beberapa langkah utama dalam perancangan ujian? Huraikan.
2. Terangkan beberapa kelebihan Jadual Spesifikasi.
3. Huraikan kebaikan menggunakan rubrik dan skema pemarkahan.
• Langkah pertama dalam perancangan ujian ialah menentukan tujuan ujian. Ujian boleh
digunakan untuk pelbagai tujuan.
• Langkah seterusnya ialah mempertimbangkan objektif pembelajaran dan kepentingan relatif

objektif pembelajaran. Guru perlu memilih pengetahuan dan kemahiran yang sesuai untuk
dinilai dan memasukkan lebih banyak soalan untuk objektif pembelajaran yang lebih penting.
• Objektif pembelajaran yang ingin ditekankan oleh guru akan menentukan bukan sahaja bahan
apa yang perlu dimasukkan dalam ujian tetapi juga format khusus ujian.
• Membuat rangka tindakan ujian atau Jadual Spesifikasi adalah langkah penting seterusnya
yang perlu dilakukan oleh guru.
• Jadual Spesifikasi menerangkan kandungan, tingkah laku pelajar, bilangan soalan dalam ujian
yang sepadan dengan bilangan jam yang ditumpukan kepada objektif pembelajaran di
dalam kelas.

• Jadual Spesifikasi membantu memastikan terdapat padanan antara apa yang diajar dengan apa
yang diuji. Pentaksiran bilik darjah didorong oleh pengajaran bilik darjah yang seterusnya
didorong oleh objektif pembelajaran.
• Format ujian yang digunakan adalah salah satu faktor pendorong utama dalam pembelajaran pelajar
tingkah laku.
• Ujian objektif ialah ujian bertulis yang terdiri daripada item atau soalan yang memerlukan
responden memilih daripada senarai jawapan yang mungkin.
• Menyediakan rubrik atau skema pemarkahan lebih awal daripada tarikh ujian akan memberi guru
masa yang mencukupi untuk menyemak soalan mereka dan membuat perubahan kepada
jawapan apabila perlu.
Objektif Pembelajaran Rubrik
Skim penandaan Jadual Spesifikasi
Tujuan ujian Item ujian

Topik ÿ Membina
Ujian Objektif
4 barang
HASIL PEMBELAJARAN
1. Tentukan ujian objektif;
2. Bezakan antara jenis ujian objektif yang berbeza;
3. Bincangkan kelebihan menggunakan pelbagai jenis ujian objektif; 4.
Mengenal pasti kelemahan menggunakan pelbagai jenis ujian objektif;
dan
5. Terangkan teknik untuk membina pelbagai jenis

item ujian objektif.
ÿ PENGENALAN
Dalam topik ini kita akan memberi tumpuan kepada menggunakan ujian objektif untuk
menilai pelbagai jenis tingkah laku dalam bilik darjah. Pertama, perbincangan akan
dihadkan kepada bentuk mudah item ujian objektif, iaitu item jawapan pendek, item
benar-salah dan item padanan. Tiga jenis ujian objektif diperiksa dan garis panduan
untuk pembinaan setiap jenis ujian dibincangkan. Kelebihan dan batasan setiap jenis
ujian objektif ini dijelaskan. Kedua, kita akan membincangkan item aneka pilihan, bentuk
item ujian objektif yang lebih kompleks. Perbincangan akan memberi tumpuan kepada
ciri dan kegunaan item aneka pilihan, kelebihan dan batasannya dan beberapa cadangan
untuk pembinaan item tersebut.

56 ÿ TOPIK 4 MEMBINA ITEM UJIAN OBJEKTIF
4.1 APA ITU UJIAN OBJEKTIF?

Apabila ujian objektif pertama kali digunakan pada tahun 1845 oleh George Fisher di
Amerika Syarikat, ia tidak diterima dengan baik oleh masyarakat. Walau bagaimanapun,
selama bertahun-tahun ia mendapat penerimaan dan digunakan secara meluas. Hari ini
ia mungkin merupakan format yang paling popular untuk menilai pelbagai jenis kebolehan
manusia, kecekapan dan sifat sosioemosi. Ujian objektif digunakan secara meluas di
sekolah, industri, perniagaan, organisasi profesional, universiti dan kolej. Boleh teka kenapa?
Apakah ujian objektif? Ujian objektif ialah ujian bertulis yang terdiri daripada item atau
soalan yang memerlukan responden menjawabnya dengan membekalkan perkataan,
frasa atau simbol atau dengan memilih daripada senarai jawapan yang mungkin. Item
ujian yang terdahulu sering dirujuk sebagai item ujian jenis bekalan manakala item ujian
yang kedua dirujuk sebagai item ujian jenis pemilihan. Perkataan objektif bermaksud
„tepat‰. Item atau soalan objektif adalah „tepat‰ kerana ia tidak boleh dipengaruhi oleh
keutamaan peribadi dan prasangka penanda. Dalam erti kata lain, ia bukan „subjektif‰
dan tidak terbuka kepada tafsiran yang berbeza-beza. Ini adalah salah satu sebab
mengapa ujian objektif popular dalam mengukur kebolehan manusia, kecekapan dan
banyak lagi sifat psikologi seperti personaliti, minat dan sikap. Antara item ujian objektif
biasa adalah seperti yang ditunjukkan dalam Rajah 4.1.
Rajah 4.1: Item ujian objektif biasa

TOPIK 4 MEMBINA ITEM UJIAN OBJEKTIF ÿ 57
4.2 SOALAN JAWAPAN PENDEK

Soalan jawapan pendek pada asasnya ialah item jenis bekalan. Ia wujud dalam dua format iaitu format
soalan langsung dan soalan penyelesaian. Rajah 4.2 menunjukkan contoh soalan jawapan pendek:
Rajah 4.2: Contoh soalan jawapan pendek
Anda boleh merujuk kepada Linn dan Gronlund (1995) untuk lebih banyak contoh.
Sekarang, mari kita lihat kelebihan dan batasan jenis soalan ini.
Soalan jawapan pendek biasanya digunakan untuk mengukur hasil pembelajaran yang mudah.
Ia digunakan hampir secara eksklusif untuk mengukur maklumat yang dihafal (kecuali untuk hasil
penyelesaian masalah yang diukur dalam Matematik dan Sains). Ini sebahagiannya telah menjadikan
soalan jawapan pendek sebagai salah satu yang paling mudah untuk dibina.
Satu lagi kelebihan soalan jawapan pendek ialah kemungkinan meneka yang sering berlaku dalam item
jenis bekalan dapat dikurangkan. Dalam kes ini, pelajar mesti memberikan jawapan yang betul apabila
mereka menjawab soalan jawapan pendek.
Mereka mesti sama ada mengingat maklumat yang diminta atau membuat pengiraan yang diperlukan untuk
mendapatkan jawapan. Mereka tidak boleh bergantung pada pengetahuan separa mereka untuk memilih
jawapan yang betul daripada senarai alternatif.
Banyak soalan jawapan pendek boleh ditetapkan untuk tempoh masa tertentu. Kertas ujian yang
mengandungi soalan jawapan pendek dengan itu mampu merangkumi kandungan kursus yang akan dinilai
yang agak luas. Liputan kandungan yang luas meningkatkan kesahan kandungan ujian.

Satu had utama soalan jawapan pendek ialah ia tidak boleh digunakan untuk mengukur hasil
pembelajaran yang kompleks seperti menyusun idea, mengemukakan hujah atau menilai maklumat.
Apa yang diperlukan pelajar ialah menyediakan perkataan, frasa, nombor atau simbol.
Pemarkahan jawapan kepada soalan jawapan pendek juga boleh menimbulkan masalah. Melainkan
soalan itu diutarakan dengan teliti, pelajar boleh memberikan jawapan dengan pelbagai tahap
ketepatan. Sebagai contoh, jawapan kepada soalan seperti „Bilakah Malaysia ditubuhkan?‰ boleh
sama ada „Pada 1963‰ atau „Pada 16 September 1963‰. Guru perlu memutuskan sama ada pelajar
yang memberikan jawapan separa mempunyai tahap pengetahuan yang sama dengan mereka yang
memberikan jawapan lengkap. Selain itu, jawapan pelajar juga boleh dicemari oleh kesilapan ejaan.
Jika ejaan diambil kira, markah ujian pelajar akan mencerminkan tahap pengetahuan mereka tentang
kandungan yang dinilai serta keupayaan mengeja mereka. Jika ejaan tidak dipertimbangkan dalam
pemarkahan, guru perlu memutuskan sama ada perkataan yang salah ejaan itu benar-benar mewakili
jawapan yang betul.
Walaupun pembinaan soalan jawapan pendek adalah lebih mudah berbanding jenis soalan lain, ia
mempunyai pelbagai kecacatan yang harus dielakkan untuk memastikan ia berfungsi seperti yang
diharapkan. Berikut adalah beberapa garis panduan untuk pembinaan soalan jawapan pendek:
(a) Katakan soalan supaya jawapan yang dimaksudkan adalah ringkas dan spesifik
Seboleh-bolehnya, soalan itu hendaklah diutarakan dengan cara yang hanya
satu jawapan betul.
Sebagai contoh:
Barang miskin: Haiwan yang memakan daging haiwan lain ialah

_____________.
(Jawapan yang mungkin: serigala, singa, lapar, ÿ)
Item yang lebih baik: Haiwan yang memakan daging haiwan lain dikelaskan sebagai
___________.
(Satu jawapan khusus: karnivor)

(b) Gunakan soalan langsung dan bukannya pernyataan yang tidak lengkap
Soalan langsung adalah lebih semula jadi dan biasanya lebih berstruktur.
Sebagai contoh:
Item buruk: Columbus menemui Amerika di ________.
Item yang lebih baik: Pada tahun berapa Columbus menemui Amerika? (1492)
Jawapan yang mungkin untuk item pertama: bot, abad ke-15, pencarian untuk India
(c) Jika masalah memerlukan jawapan berangka, nyatakan unit di mana jawapan itu hendak
dinyatakan
Sebagai contoh:
(d) Jangan masukkan terlalu banyak tempat kosong untuk item pelengkap
Kosong untuk jawapan hendaklah sama panjangnya. Untuk item pelengkap, letakkan tempat
kosong berhampiran hujung ayat.
Sebagai contoh:
SEMAK KENDIRI 4.1
1. Apakah beberapa kelebihan soalan jawapan pendek?
2. Huraikan beberapa batasan soalan jawapan pendek.

AKTIVITI 4.1
Cadangkan kelebihan dan kelemahan lain menggunakan soalan jawapan pendek.
forum.
4.3 SOALAN BETUL-SALAH

Dalam format yang paling asas, soalan benar-salah ialah soalan di mana pernyataan dibentangkan
dan pelajar menunjukkan dalam beberapa cara sama ada pernyataan itu benar atau salah. Dalam erti
kata lain, terdapat hanya dua kemungkinan respons untuk setiap item, dan pelajar memilih antaranya.
Soalan benar-salah ialah satu bentuk khusus bagi format aneka pilihan di mana terdapat hanya dua
alternatif yang mungkin. Soalan-soalan ini boleh digunakan apabila pereka bentuk ujian ingin mengukur
keupayaan pelajar untuk mengenal pasti sama ada pernyataan fakta adalah tepat atau tidak. Soalan
benar-salah boleh digunakan untuk menguji pengetahuan dan pertimbangan dalam banyak mata
pelajaran. Apabila dikumpulkan bersama, satu siri soalan benar-salah mengenai topik atau senario
tertentu boleh menguji pemahaman yang lebih kompleks tentang sesuatu isu. Mereka boleh
distrukturkan untuk memimpin pelajar melalui laluan logik (Brown, 1997) dan boleh mendedahkan
sebahagian daripada proses pemikiran yang digunakan oleh pelajar untuk menyelesaikan masalah
yang diberikan.
Sebagai contoh:
betul Salah
Paus adalah mamalia kerana ia melahirkan anaknya.
Soalan benar-salah boleh ditulis dengan cepat dan boleh merangkumi banyak kandungan. Soalan
palsu benar sangat sesuai untuk menguji ingatan atau pemahaman pelajar. Pelajar secara amnya
boleh menjawab banyak soalan, merangkumi banyak kandungan dalam masa yang agak singkat. Dari
perspektif guru, soalan-soalan ini boleh ditulis dengan cepat dan mudah untuk dijaringkan. Kerana
mereka boleh dijaringkan secara objektif, markah adalah lebih dipercayai daripada item yang sekurang-
kurangnya sebahagiannya bergantung pada pertimbangan guru. Secara amnya, ia lebih mudah untuk
dibina berbanding dengan soalan aneka pilihan kerana tidak ada keperluan untuk membangunkan
distraktor. Oleh itu, mereka kurang memakan masa berbanding dengan membina soalan aneka pilihan.

4.3.1 Had Soalan Betul-Salah

Walau bagaimanapun, soalan benar-salah mempunyai beberapa batasan:
(a) Meneka ÿ Seorang pelajar mempunyai peluang satu dalam dua untuk meneka jawapan yang
betul bagi sesuatu soalan. Markah pada item benar-salah cenderung tinggi kerana mudah
meneka jawapan yang betul apabila jawapannya tidak diketahui. Dengan hanya dua
pilihan (benar atau salah) pelajar boleh mengharapkan untuk meneka dengan betul pada
separuh daripada item yang jawapan yang betul tidak diketahui. Oleh itu, jika pelajar
mengetahui jawapan yang betul kepada 10 daripada 20 soalan dan meneka 10 yang lain,
pelajar boleh menjangkakan skor 15. Guru boleh menjangkakan markah antara kira-kira
50 peratus untuk pelajar yang tidak melakukan apa-apa selain meneka pada semua item
kepada 100 peratus untuk pelajar yang mengetahui bahan tersebut.
(b) Oleh kerana item ini dalam bentuk pernyataan, kadangkala terdapat kecenderungan untuk
mengambil petikan daripada teks, mengharapkan pelajar mengenali petikan yang betul
atau mencatat perubahan (kadang-kadang kecil) dalam perkataan. Mungkin juga terdapat
kecenderungan untuk memasukkan bahan remeh atau tidak penting daripada teks. Kedua-
dua amalan ini tidak digalakkan.
(c) Ia boleh menjadi sukar untuk menulis pernyataan yang jelas benar atau salah, terutamanya
untuk bahan yang kompleks
(d) Item benar-salah memberikan sedikit maklumat diagnostik. Guru selalunya boleh mendapatkan
maklumat berguna tentang kesilapan dan miskonsepsi pelajar dengan memeriksa jawapan
pelajar yang salah tetapi item benar-salah tidak memberikan maklumat diagnostik tersebut.
(e) Item benar-salah mungkin menghasilkan kesan cadangan negatif. Sesetengah pakar ujian
merasakan bahawa mendedahkan kenyataan palsu mungkin menggalakkan pembelajaran
maklumat palsu.
(f) Pernyataan palsu tidak memberikan bukti bahawa pelajar tahu perkara yang betul
jawab.

4.3.2 Cadangan Pembinaan Soalan Betul-Salah
Berikut adalah cadangan untuk pembinaan soalan benar-salah:
(a) Masukkan hanya satu idea utama dalam setiap soalan.
Sebagai contoh:
Item buruk: Kajian biologi membantu kita memahami organisma hidup dan meramalkan
cuaca.
Item yang lebih baik: Kajian biologi membantu kita memahami organisma hidup.
(b) Gunakan pernyataan negatif dengan berhati-hati tetapi elakkan negatif berganda. Negatif
berganda cenderung menyumbang kepada kekaburan pernyataan. Pernyataan dengan
perkataan seperti tiada, tidak dan tidak hendaklah dielakkan sejauh mungkin.
Sebagai contoh:
Item buruk: Tiada langkah dalam percubaan yang tidak diperlukan.
Item yang lebih baik: Semua langkah dalam percubaan adalah perlu.
(c) Elakkan pernyataan umum yang luas. Kebanyakan generalisasi luas adalah palsu melainkan
berkelayakan.
Sebagai contoh:
Item lemah: Soalan jawapan pendek adalah lebih baik daripada soalan esei dalam ujian.
Item yang lebih baik: Soalan jawapan pendek adalah lebih baik daripada soalan esei dalam
menguji maklumat fakta.
(d) Elakkan ayat kompleks yang panjang. Ayat sebegini juga menguji kefahaman bacaan selain
pencapaian yang hendak diukur.

Sebagai contoh:
Item buruk: Walaupun terdapat kesukaran teori dan eksperimen untuk menentukan nilai pH
yang tepat bagi sesuatu larutan, adalah mungkin untuk menentukan sama
ada larutan itu berasid oleh warna merah yang terbentuk pada kertas litmus
apabila dimasukkan ke dalam larutan.
Item yang lebih baik: Kertas litmus menjadi merah dalam larutan berasid.
(e) Cuba gunakan dalam kombinasi dengan bahan lain seperti graf, peta dan bahan bertulis. Gabungan
ini membolehkan ujian pembelajaran yang lebih maju.
(f) Elakkan mengeluarkan kenyataan terus daripada bacaan yang diberikan, nota atau bahan kursus lain
supaya ingat sahaja tidak akan membenarkan jawapan yang betul.
(g) Secara umum, elakkan penggunaan perkataan yang akan memberi isyarat tindak balas yang betul
kepada pelajar yang bijak dalam ujian. Mutlak seperti „tiada‰, „tidak pernah‰, „selalu‰, „semua‰
dan „mustahil‰ cenderung palsu manakala kelayakan seperti „biasa‰, „umum‰, „kadang-
kadang‰ dan „kerap‰ berkemungkinan benar .
(h) Situasi yang sama berlaku dengan penggunaan "can" dalam pernyataan benar-salah. Jika pelajar
mengetahui satu kes di mana sesuatu „boleh‰ dilakukan, ia adalah benar.
(i) Pernyataan dan istilah yang samar-samar atau samar-samar seperti "besar", "lama", "biasa",
"sesetengah" dan "biasanya" sebaiknya dielakkan demi kejelasan.
(j) Sesetengah istilah mempunyai lebih daripada satu makna dan boleh ditafsir secara berbeza oleh
individu.
(k) Pernyataan benar hendaklah lebih kurang sama panjangnya dengan pernyataan palsu (terdapat
kecenderungan untuk menambah butiran dalam pernyataan benar untuk menjadikannya lebih tepat).
(l) Katakan pernyataan itu dengan tepat sehingga ia boleh dinilai dengan jelas benar atau
salah.
(m) Kenyataan pendapat hendaklah dikaitkan dengan beberapa sumber.
(n) Elakkan petunjuk lisan (penentu khusus) yang menunjukkan jawapan.
(o) Uji idea penting dan bukannya maklumat remeh.
(p) Jangan mempersembahkan item dalam corak yang mudah dipelajari.

SEMAK KENDIRI 4.2
1. Apakah beberapa kelebihan soalan benar-salah?
2. Huraikan beberapa batasan soalan benar-salah.
AKTIVITI 4.2
Cadangkan kelebihan dan kelemahan lain menggunakan soalan benar-salah.
forum.
4.4 SOALAN PADANAN

Apakah soalan yang sepadan?
Soalan padanan digunakan dalam mengukur keupayaan pelajar untuk mengenal pasti
hubungan antara dua senarai istilah, frasa, pernyataan, definisi, tarikh, peristiwa, orang dan
sebagainya.
Contohnya:
Arahan: Lajur A mengandungi pernyataan yang menerangkan bandar-bandar Asia terpilih.
Untuk setiap huraian cari bandar yang sesuai dalam Lajur B. Setiap bandar dalam Lajur B
boleh digunakan sekali sahaja.
Lajur A Lajur B
1. Ibu kota purba Thailand A. Ayuthia 2. Bandar terbesar di
Sumatera B. Bandar Ho Chi Minh
3. Ibu negara Myanmar C. Karachi
4. Dahulu dikenali sebagai Saigon D. Manakala

Satu soalan padanan boleh menggantikan beberapa soalan benar-salah. Dalam

membangunkan soalan padanan, anda perlu mengenal pasti dua lajur bahan yang
disenaraikan secara menegak. Item dalam Lajur A (atau I) biasanya dipanggil premis dan
diberi nombor (1, 2, 3, ÿ) manakala item dalam Lajur B (atau II) dipanggil respons dan huruf
besar ditetapkan (A, B, C, .. ..) Mempunyai lebih banyak respons daripada premis atau
benarkan respons digunakan lebih daripada sekali.
Pelajar membaca premis (Lajur A) dan mencari jawapan yang betul daripada antara yang
terdapat dalam Lajur B. Pelajar kemudian mencetak huruf jawapan yang betul di tempat
kosong di sebelah premis dalam Lajur A. Alternatifnya ialah meminta pelajar melukis garisan
daripada respons yang betul kepada premis tetapi ini lebih memakan masa untuk
menjaringkan gol. Salah satu cara untuk mengurangkan kemungkinan meneka jawapan
yang betul adalah dengan menyenaraikan bilangan respons yang lebih besar (Lajur B)
daripada premis (Lajur A) seperti yang dilakukan dalam contoh. Satu lagi cara untuk
mengurangkan kemungkinan meneka adalah dengan membenarkan respons digunakan
lebih daripada sekali. Arahan kepada pelajar hendaklah sangat jelas tentang penggunaan respons.
Sesetengah pakar psikometrik mencadangkan tidak lebih daripada lima hingga lapan premis
(Lajur A) dalam satu set. Untuk setiap premis, pelajar perlu membaca keseluruhan senarai
respons (atau yang masih tidak digunakan) untuk mencari respons yang sepadan.
Atas sebab ini, elemen yang lebih pendek harus berada dalam Lajur B dan bukannya Lajur
A untuk meminimumkan jumlah bacaan yang diperlukan untuk setiap item (Jabatan
Pendidikan Alabama, 2001). Respons (Lajur B) hendaklah disenaraikan dalam susunan
logik, jika ada (contohnya, susunan kronologi, mengikut saiz). Jika tiada susunan yang jelas,
jawapan hendaklah disenaraikan mengikut abjad. Premis (Lajur A) tidak boleh disenaraikan
dalam susunan yang sama dengan respons. Penjagaan mesti diambil untuk memastikan
bahawa kunci perkaitan sebagai respons yang betul adalah betul dan item bernombor itu
tidak boleh dikaitkan dengan mana-mana pilihan lain.
4.4.1 Kelebihan Soalan Padanan

Sekarang, mari kita lihat kelebihan soalan padanan:
(a) Soalan memadankan amat baik untuk menilai pemahaman pelajar tentang perhubungan.
Mereka boleh menguji ingatan semula dengan memerlukan pelajar untuk memadankan
elemen berikut (McBeath, 1992):
(i) Definisi ÿ istilah;
(ii) Peristiwa bersejarah ÿ tarikh;

(iii) Pencapaian ÿ orang;
(iv) Pernyataan ÿ postulat; dan
(v) Huraian ÿ prinsip.
(b) Mereka juga boleh menilai keupayaan pelajar untuk menggunakan pengetahuan dengan menghendaki
pengambil ujian untuk memadankan perkara berikut:
(i) Contoh ÿ istilah;
(ii) Fungsi ÿ bahagian;

(iii) Klasifikasi ÿ struktur;
(iv) Aplikasi ÿ postulat; dan
(v) Masalah ÿ prinsip.
(c) Soalan padanan adalah benar-benar variasi daripada format aneka pilihan. Jika anda mendapati
bahawa anda sedang menulis soalan aneka pilihan yang berkongsi pilihan jawapan yang
sama, anda boleh mempertimbangkan untuk mengumpulkan soalan ke dalam item yang
sepadan.
(d) Soalan padanan umumnya mudah ditulis dan diberi markah apabila kandungan
yang diuji dan objektif sesuai untuk soalan padanan.
(e) Sangat cekap kerana sejumlah besar pengetahuan boleh dijadikan sampel dalam tempoh
masa yang singkat.
4.4.2 Batasan Soalan Padanan

Bagaimana dengan batasannya? Mari kita lihat perkara berikut:
(a) Soalan padanan adalah terhad kepada bahan yang boleh disenaraikan dalam
dua lajur dan mungkin tidak banyak bahan yang sesuai dengan format
sedemikian;
(b) Jika terdapat empat item dalam soalan padanan dan pelajar tahu jawapan
untuk tiga daripadanya, item keempat ialah pemberian melalui penyingkiran;

(c) Sukar untuk membezakan antara item berkesan dan tidak berkesan;
(d) Selalunya membawa kepada ujian fakta atau cebisan maklumat yang remeh; dan
(e) Sering dikritik kerana menggalakkan hafalan hafalan.
4.4.3 Cadangan Menulis Soalan Padanan

Yang Baik
Berikut ialah cadangan untuk menulis soalan padanan yang baik:
(a) Berikan arahan yang jelas. Mereka harus menerangkan berapa kali respons
boleh digunakan;
(b) Pastikan maklumat dalam setiap lajur sehomogen mungkin;
(c) Sertakan lebih banyak respons daripada premis atau benarkan respons digunakan lebih daripada sekali;
(d) Senaraikan item dengan lebih banyak perkataan dalam Lajur A;
(e) Jawapan yang betul tidak sepatutnya jelas kepada mereka yang tidak mengetahui kandungannya
sedang diajar;
(f) Seharusnya tidak ada kata kunci yang muncul dalam premis dan respons,
memberikan petunjuk kepada jawapan yang betul; dan
(g) Semua jawapan dan premis untuk item yang sepadan hendaklah dipaparkan pada
muka surat yang sama.
SEMAK KENDIRI 4.3
1. Apakah beberapa kelebihan padanan soalan?
2. Huraikan beberapa batasan soalan padanan.

AKTIVITI 4.3
1. Cadangkan kelebihan dan kelemahan lain menggunakan padanan

soalan.
2. Pilih lima soalan benar-salah dalam bidang subjek anda dan analisis setiap soalan
item menggunakan garis panduan yang dibincangkan.
3. Pilih lima soalan yang sepadan dalam bidang subjek anda dan analisis setiap satu
4. Cadangkan bagaimana anda akan menambah baik item yang lemah untuk setiap jenis
soalan yang telah anda kenal pasti.
Bincangkan jawapan anda dengan rakan kursus anda dalam forum dalam talian
myINSPIRE.
4.5 SOALAN Aneka PILIHAN

Soalan aneka pilihan atau MCQ digunakan secara meluas dalam banyak tetapan yang berbeza
kerana ia boleh digunakan untuk mengukur hasil kognitif tahap rendah serta hasil kognitif yang lebih
kompleks. Adalah mencabar untuk menulis item ujian yang boleh memanfaatkan pemikiran aras
tinggi. Penulisan item yang baik memerlukan penulis ujian yang terlatih.
Di atas semua, penulis ujian perlu mempunyai kepakaran dalam bidang subjek yang diuji supaya
mereka boleh mengukur kesukaran dan liputan kandungan item ujian.
MCQ adalah yang paling sukar untuk disediakan. Soalan-soalan ini mempunyai dua bahagian iaitu
batang yang mengandungi soalan dan empat atau lima pilihan yang mengandungi jawapan yang
betul. Jawapan yang betul dipanggil respons berkunci dan pilihan yang salah dipanggil distraktor.
Batang boleh dikemukakan sebagai soalan, arahan atau pernyataan manakala pilihan boleh berupa
perkataan, frasa, nombor, simbol dan sebagainya. Walaupun kelihatan kejam, peranan distraktor
adalah untuk menarik perhatian responden yang tidak pasti jawapan yang betul.

4.5.1 Bahagian Soalan Aneka pilihan

Soalan aneka pilihan tradisional (MCQ) atau item ialah soalan di mana pelajar memilih satu jawapan daripada
beberapa pilihan yang dibekalkan (diilustrasikan dalam Rajah 3.4).
Rajah 4.3: Contoh soalan aneka pilihan (MCQ)
Sekarang, mari kita lihat apakah MCQ terdiri daripada. Ia mempunyai batang dan juga pilihan.
(a) Batang
Batang hendaklah:
(i) Berbentuk soalan atau kenyataan yang perlu dilengkapkan;
(ii) Dinyatakan dengan jelas dan padat, mengelakkan tatabahasa yang buruk, kompleks
sintaks, kekaburan dan negatif berganda;
(iii) Umumnya mengemukakan soalan yang positif. (Jika negatif digunakan, ia sepatutnya
ditekankan dengan huruf condong atau garis bawah);
(iv) Umumnya minta satu jawapan sahaja (jawapan yang betul atau terbaik); dan
(v) Sertakan seberapa banyak perkataan yang biasa kepada semua alternatif yang mungkin.

(b) Pilihan (atau Alternatif)

Pilihan hendaklah:
(i) Mempunyai sama ada empat atau lima alternatif, yang kesemuanya harus saling
eksklusif dan tidak terlalu lama;
(ii) Ikut tatabahasa daripada batang dan selari dalam tatabahasa

bentuk;
(iii) Dinyatakan dengan cukup ringkas untuk menjelaskan perbezaan penting

antara mereka dan mestilah jelas; dan
(iv) Mengandungi jawapan yang dimaksudkan atau jawapan yang dikunci dan ia
sepatutnya kelihatan jelas betul kepada yang dimaklumkan tetapi ia semestinya
tidak betul tetapi boleh diterima oleh pengganggu.
SEMAK KENDIRI 4.4
1. Mengapakah MCQ merupakan satu bentuk ujian objektif yang popular?
2. Huraikan beberapa kelemahan penggunaan MCQ.
4.5.2 Pembinaan Soalan Aneka pilihan

Menulis ujian adalah satu profesion. Maksud kami ialah penulis ujian yang baik dilatih secara
profesional dalam mereka bentuk item ujian. Penulis ujian mempunyai pengetahuan tentang
peraturan membina item dan pada masa yang sama mereka mempunyai kreativiti untuk
membina item yang menarik perhatian pelajar. Item ujian perlu ringkas tetapi jelas maksudnya.
Seperti yang dinyatakan sebelum ini, MCQ adalah yang paling sukar untuk disediakan. Kita
perlu memberi tumpuan kepada menulis batang serta menyediakan pilihan atau alternatif.
Semua pilihan dalam item aneka pilihan perlu munasabah tetapi ia juga perlu mengasingkan
pelajar yang berbeza tahap keupayaan. Jadual 4.1 menunjukkan beberapa pertimbangan
yang perlu diambil kira semasa membina MCQ, khususnya batang.

Jadual 4.1: Pertimbangan Semasa Membina Batang MCQ
Pertimbangan Bila Contoh

Menulis Batang Item yang lemah Item yang Lebih Baik
(a) Kemukakan satu Perang Dunia Kedua Dalam tempoh masa yang
pernyataan yang pasti ialah: A. Akibat kegagalan Liga manakah Perang Dunia II
untuk dilengkapkan atau Bangsa-Bangsa. berlaku?
dijawab oleh salah satu B. Mengerikan. A. 1914ÿ1917
daripada beberapa pilihan B. 1929ÿ1934
yang diberikan. C. Berjuang di Eropah, Asia dan Afrika.
C. 1939ÿ1945
D. Berjuang dalam tempoh 1939ÿ1945. D. 1951ÿ1955
Nota: Dalam item yang lemah, tidak ada makna apa yang ditanyakan oleh
soalan daripada batang. Item yang lebih baik lebih jelas mengenal pasti
soalan dan menawarkan pelajar satu set pilihan homogen.
(b) Elakkan bahan yang Selama hampir satu abad, Sungai Rhine Manakah di antara Sungai
tidak perlu dan tidak berikut telah digunakan oleh orang Eropah akan
untukmenjadi keputusan
pelbagai tujuan. yang
relevan. Walau bagaimanapun, dalam beberapa tahun paling dramatik jika,
kebelakangan ini,kerana
peningkatan trafik sungai telah mengakibatkan peningkatan
pencemaran tahap
diesel dari kapal,
Sungai
pencemaran diesel di laluan air. Antara berikut, Rhine
yang ditutupakan
manakah kepada
menjadi hasil yang paling dramatik jika, disebabkan pencemaran, Majlis
semua penghantaran?
Menteri-menteri Komuniti Eropah memutuskan untuk menutup
A. Kenaikan Sungai
harga untuk
Rhine kepada semua penghantaran? produk Ruhr.
B. Kekurangan air untuk
industri Itali.
C. Mengurangkan
daya saing Industri
Aeroangkasa Perancis.
A. Penutupan pelabuhan Sungai

D. Penutupan pelabuhan
Rhine yang sibuk di Rotterdam,
Marseilles dan Genoa. Rhine sungai yang sibuk
di Rotterdam, Marseilles
B. Kenaikan harga produk Ruhr. dan Genoa.
C. Mengurangkan daya saing Industri

Aeroangkasa Perancis.
D. Kekurangan air untuk industri Itali.
Nota: Item yang lemah terlalu banyak perkataan dan mengandungi bahan yang tidak
diperlukan.
Sumber: McKenna dan Bull (1999). Mereka bentuk objektif yang berkesan
soalan. Universiti Loughborough.

(c) Gunakan bahasa yang Apabila tahap kesuburan Penurunan besar dalam kesuburan
jelas dan lurus ke menghampiri nadirnya, apakah kesan di negara membangun
hadapan dalam batang yang paling mungkin untuk warga negara berkemungkinan menghasilkan
item. Soalan yang membangun? A. penurunan dalam kadar
dibina menggunakan A. Pengurangan dalam buruh penyertaan tenaga buruh
perkataan yang kadar penyertaan paksa sebanyak daripada wanita.
kompleks mungkin perempuan. B. arah aliran menurun dalam
menjadi ujian kefahaman B. Arah aliran menurun dalam nisbah
nisbah tanggungan belia.
bacaan dan bukannya
tanggungan belia.
penilaian sama ada C. Pangkalan yang lebih luas C. asas yang lebih luas dalam
pelajar mengetahui
perkara tersebut. dalam piramid penduduk. piramid penduduk.
D. Kadar kematian bayi D. peningkatan kadar
meningkat. kematian bayi.
Nota: Dalam item yang ditambah baik, perkataan „nadir‰ digantikan dengan
„penurunan‰ dan „ramifikasi‰ digantikan dengan „menghasilkan‰ yang
merupakan perkataan yang lebih lurus ke hadapan.
(d) Gunakan negatif Antara berikut, yang manakah bukan Antara berikut, yang manakah
dengan berhati-hati. simptom osteoporosis? merupakan simptom osteoporosis?
Jika negatif mesti A. Ketumpatan tulang berkurangan. A. Rambut gugur.
digunakan, gunakan huruf
B. Kerap patah tulang. B. Sakit sendi.
besar, garis bawah atau
tebalkan.
C. Suhu badan meningkat. C. Suhu badan
D. Sakit pinggang. meningkat.
D. Ketumpatan tulang berkurangan.
Nota: Item yang lebih baik dinyatakan dalam positif untuk mengelakkan
penggunaan negatif „tidak‰.
(e) Letakkan seberapa Ahli teori pluralisme telah Ahli teori pluralisme telah
banyak soalan dalam menegaskan yang manakah antara berikut?menegaskan bahawa pengekalan
batang yang mungkin, A. Pengekalan demokrasi demokrasi memerlukan A. kelas
bukannya menduplikasi pertengahan yang besar.
memerlukan kelas pertengahan
bahan dalam setiap yang besar.
pilihan.
B. Pengekalan demokrasi B. pengasingan kuasa
memerlukan pusat kerajaan.
autonomi kuasa imbang. C. pusat autonomi kuasa
pengimbang.
C. Penyelenggaraan D. wujudnya kepelbagaian
demokrasi memerlukan kumpulan agama.
kewujudan kumpulan agama yang
berbilang.
D. Penyelenggaraan
demokrasi memerlukan
pengasingan kuasa kerajaan.

Nota: Dalam item yang lebih baik, frasa „penyelenggaraan demokrasi‰

disertakan dalam batang supaya tidak menduplikasi bahan dalam setiap
pilihan.
Sumber: McKenna dan Bull (1999). Mereka bentuk objektif yang berkesan
soalan. Universiti Loughborough.
(f) Elakkan memberikan Kawasan yang subur di padang Kawasan yang subur di padang
jawapan kerana pasir di mana paras air mencapai pasir di mana paras airnya
gramatis permukaan tanah dipanggil mencapai permukaan tanah
isyarat. an dipanggil a/an A. tasik.
A. fatamorgana.
B. oasis. B. fatamorgana.
C. lubang air. C. oasis.
D. polder. D. polder.
Nota: Item yang lemah menggunakan artikel „an‰ yang mengenal pasti
pilihan C sebagai respons yang betul. Menamatkan batang dengan „a/an‰
menambah baik item.
(g) Seboleh-bolehnya Manakah antara lelaki berikut
elakkan bertanya yang paling banyak menyumbang
pendapat. ke arah kekalahan Jerman Hitler
dalam Perang Dunia II?
AFD Roosevelt
B. George Patton C.
Josef Stalin D.
Winston Churchill
(h) Elakkan menggunakan SENTIASA dan JANGAN SEKALI-KALI dalam stem kerana pelajar yang bijak dalam ujian mungkin akan memerintah
kenyataan sejagat tersebut di luar pertimbangan.
AKTIVITI 4.4
1. Pilih sepuluh MCQ dalam bidang subjek anda dan analisis punca setiap MCQ
2. Cadangkan bagaimana anda akan menambah baik item yang lemah.
Bincangkan jawapan anda dengan rakan kursus anda dalam forum dalam talian myINSPIRE.

Sekarang, mari kita lihat Jadual 4.2 yang menunjukkan beberapa pertimbangan semasa
membina distraktor untuk MCQ.
Jadual 4.2: Pertimbangan Semasa Membina Pengganggu untuk MCQ
Pertimbangan Bila Contoh

Pengganggu Penulisan Item yang lemah Item yang Lebih Baik
(a) Untuk MCQ respons Apakah punca utama pencemaran Apakah punca utama pencemaran
tunggal, pastikan hanya sungai Malaysia? sungai Malaysia?
terdapat satu respons A. Pembersihan
yang betul. A. Pembakaran
tanah B. Pembakaran
terbuka B. Hakisan pantai
terbuka C. Pembuangan sisa
pepejal D. Hakisan pantai C. Lambakan sisa pepejal D.
Karbon dioksida
pelepasan
Nota: Dalam item yang lemah, kedua-dua pilihan A dan C boleh dianggap
betul.
(b) Gunakan hanya alternatif Siapakah Perdana Menteri Siapakah Perdana Menteri
yang munasabah dan Malaysia yang ketiga? Malaysia yang ketiga?
menarik sebagai pengalih A. Hussein Onn A. Hussein Onn
perhatian.
B. Ghafar Baba B. Abdullah Badawi
C. Mahathir Mohamad C. Mahathir Mohamad
D. Musa Hitam D. Abdul Razak Hussein
Nota: Dalam item yang lemah, B dan D bukanlah pengacau yang serius.
(c) Apabila menulis distraktor, jika boleh, elakkan pilihan „Semua di atas‰ dan „Tiada di atas‰. Jika anda
memasukkannya, pastikan ia muncul sebagai jawapan yang betul pada bila-bila masa.
Ia menggoda untuk menggunakan alternatif ini tetapi penggunaannya boleh menjadi cacat. Sebagai
permulaan, mereka sering muncul sebagai alternatif yang bukan tindak balas yang betul. Jika anda
menggunakannya, pastikan ia merupakan jawapan yang betul dari semasa ke semasa. Alternatif
„semua di atas‰ boleh dieksploitasi oleh pelajar bijak ujian yang akan mengenalinya sebagai pilihan
yang betul dengan mengenal pasti hanya dua alternatif yang betul. Begitu juga, pelajar yang boleh
mengenal pasti satu alternatif yang salah boleh juga menolak respons ini. Jelas sekali, peluang pelajar
untuk meneka jawapan yang betul bertambah baik apabila mereka menggunakan teknik ini. Walaupun
proses penghapusan yang serupa tidak boleh dilakukan dengan „tiada satu pun di atas‰, ia adalah kes
apabila pilihan ini digunakan sebagai jawapan yang betul, soalan itu hanya menguji keupayaan pelajar
untuk menolak jawapan yang salah tetapi ini tidak menjamin bahawa mereka tahu yang betul. (Gronlund,
1988).

(d) Pengganggu berdasarkan kesilapan pelajar biasa atau miskonsepsi adalah sangat berkesan.
Satu teknik untuk menyusun distraktor ialah meminta pelajar menjawab soalan jawapan pendek
terbuka, mungkin sebagai penilaian formatif. Kenal pasti jawapan yang salah yang paling kerap
muncul dan gunakannya sebagai pengacau untuk versi aneka pilihan soalan.
(e) Jangan cipta pengacau yang begitu hampir dengan jawapan yang betul sehingga boleh
mengelirukan pelajar yang benar-benar tahu jawapan kepada soalan itu. „Pengganggu harus
berbeza daripada kunci dengan cara yang ketara, bukan hanya dalam beberapa nuansa kecil
frasa atau penekanan.‰ (Isaacs, 1994)
(f) Sediakan bilangan gangguan yang mencukupi.
Anda mungkin akan memilih untuk menggunakan tiga, empat atau lima alternatif dalam MCQ. Sehingga baru-
baru ini, ia dianggap bahawa tiga atau empat pengacau diperlukan untuk item itu menjadi sesuai sukar. Walau
bagaimanapun kajian oleh Owen dan Freeman mencadangkan bahawa tiga pilihan adalah mencukupi (Brown,
1987). Jelas sekali semakin tinggi bilangan pengacau, semakin kecil kemungkinan untuk jawapan yang betul
dipilih melalui meneka (dengan syarat semua alternatif mempunyai kesukaran yang sama).
AKTIVITI 4.5
1. Adakah anda bersetuju bahawa guru tidak boleh menggunakan negatif dalam batang
MCQ? Wajarkan jawapan anda.
2. Adakah anda bersetuju bahawa guru-guru harus mengelak daripada menggunakan distraktor seperti
„Semua di atas‰ dan „Tiada satu pun di atas‰? Wajarkan jawapan anda.
3. Pilih sepuluh MCQ dalam bidang subjek anda dan analisis gangguan
setiap item menggunakan garis panduan yang dibincangkan. Cadangkan cara anda
memperbaiki perkara yang lemah.
forum.
4.5.3 Kelebihan dan Had MCQ

MCQ digunakan secara meluas untuk mengukur hasil pengetahuan dan pelbagai jenis hasil pembelajaran.
Mereka popular kerana sebab-sebab berikut:
(a) Hasil pembelajaran daripada mudah kepada kompleks boleh diukur;
(b) Tugas berstruktur tinggi dan jelas disediakan;

(c) Sampel pencapaian yang luas boleh diukur;
(d) Alternatif atau pilihan yang salah memberikan maklumat diagnostik;
(e) Skor kurang dipengaruhi oleh tekaan daripada item benar-salah;
(f) Markah lebih dipercayai daripada item yang dijaringkan secara subjektif (seperti esei);
(g) Pemarkahan adalah mudah, objektif dan boleh dipercayai;
(h) Analisis item boleh mendedahkan betapa sukarnya setiap item dan sejauh mana ia membezakan
antara pelajar yang kuat dan lemah dalam kelas;
(i) Prestasi boleh dibandingkan dari kelas ke kelas dan tahun ke tahun;
(j) Boleh meliputi banyak bahan dengan sangat cekap (kira-kira satu item seminit
masa ujian); dan
(k) Item boleh ditulis supaya pelajar mesti mendiskriminasi antara pilihan yang berbeza dalam tahap
ketepatan.
Walaupun terdapat banyak kelebihan menggunakan MCQ, terdapat juga banyak batasan dalam
menggunakan item tersebut, iaitu:
(a) Membina barang yang baik memakan masa;
(b) Selalunya sukar untuk mencari gangguan yang munasabah;
(c) MCQ tidak berkesan untuk mengukur kemahiran menyelesaikan masalah serta keupayaan untuk
menyusun dan menyatakan idea;
(d) Skor boleh dipengaruhi oleh kebolehan membaca;
(e) Terdapat kekurangan maklum balas tentang proses pemikiran individu. Sukar untuk menentukan
sebab pelajar individu memilih respons yang salah;
(f) Pelajar kadangkala boleh membaca lebih banyak soalan daripada yang dimaksudkan;
(g) Ia sering memberi tumpuan kepada menguji maklumat fakta dan gagal untuk menguji tahap pemikiran
kognitif yang lebih tinggi;
(h) Kadangkala terdapat lebih daripada satu jawapan „betul‰ yang boleh dipertahankan;
(i) Ia meletakkan tahap kebebasan yang tinggi pada keupayaan membaca pelajar dan keupayaan
menulis pembina;
(j) Tidak menyediakan ukuran kebolehan menulis; dan
(k) Boleh menggalakkan meneka.

Sekarang, mari kita lihat Jadual 4.3 yang meringkaskan peraturan prosedur untuk pembinaan MCQ.
Jadual 4.3: Peraturan Prosedur untuk Membina Soalan Aneka Pilihan (MCQ)
Beberapa Peraturan Prosedur untuk Pembinaan Soalan Aneka pilihan
• Uji maklumat penting atau penting. • Elakkan memberi petunjuk melalui penggunaan
binaan tatabahasa yang salah.
• Elakkan perkara helah. • Elakkan penggunaan jenaka apabila
• Pastikan perbendaharaan kata selaras membangunkan pilihan.

dengan tahap pemahaman pelajar. • • Mempersembahkan situasi praktikal atau dunia
Elakkan pengetahuan yang terlalu khusus sebenar kepada pelajar.
semasa membina item. • Elakkan perkara • Menggunakan bahan bergambar yang

berdasarkan pendapat. • Peka kepada memerlukan pelajar mengaplikasikan prinsip
budaya, agama dan konsep. • Elakkan buku teks, frasa
verbatim semasa membangunkan item. •
dan isu jantina. Gunakan carta, jadual atau rajah yang
• Pastikan pilihan atau alternatif bebas dan memerlukan tafsiran.

tidak bertindih.
• Elakkan gangguan yang boleh memberikan
petunjuk kepada kebijaksanaan ujian.
4.5.4 Membina MCQ untuk Mengukur Pemikiran

Aras Tinggi (HOT)
Walaupun bukan mudah untuk membina MCQ pemikiran aras tinggi (HOT), pelajar boleh mencuba teknik
berikut untuk menulis soalan HOT:
(a) Soalan Berasaskan Senario Salah

satu cara terbaik untuk mempromosi dan menilai kemahiran HOT ialah menggunakan soalan
berasaskan senario, terutamanya soalan yang meniru pengalaman kerja sebenar. Senario ialah
petikan peristiwa, secara amnya memberikan penerangan keseluruhan ringkas tentang masalah
yang anda perlukan untuk menyelesaikan atau memberi nasihat.
Contohnya:
Baca ulasan berikut yang dibuat oleh seorang guru tentang ujian dan kemudian jawab soalan.
„Pelajar pergi ke sekolah untuk belajar, bukan untuk mengambil ujian. Selain itu, ujian tidak boleh
digunakan untuk menunjukkan pembelajaran mutlak pelajar. Semua ujian yang boleh dilakukan
adalah untuk menilai pelajar mengikut urutan pencapaian dan kedudukan relatif ini dipengaruhi oleh

meneka, menggertak dan pendapat subjektif guru yang memberi markah.

Proses pengajaran dan pembelajaran akan memberi manfaat jika kita menghapuskan
ujian dan bergantung kepada penilaian kendiri pelajar.‰
Antara jenis ujian berikut, yang manakah paling utama diperkatakan oleh guru ini?
A. Ujian bakat
B. Ujian diagnostik
C. Ujian formatif
D. Ujian sumatif*
Diadaptasi
daripada: https://www.learningsolutionsmag.com/articles/804/writing
multiple-choice-questions-for-higher-level-thinking
(b) Mentafsir dan Menganalisis Visual

Anda juga boleh menilai kemahiran berfikir kritis dengan meminta pelajar menganalisis
atau mentafsir maklumat daripada visual, yang disediakan sebagai sebahagian daripada
batang soalan atau pilihan jawapan. Dalam kebanyakan kes, visual seperti alat bantu
kerja, rajah dan graf mensimulasikan tugas di tempat kerja.
Sebagai contoh:
Jadual 4.1: Perubahan dalam Berat P#1 dan P#2

Jadual 4.2: Perubahan Tahap Glukosa P#1 dan P#2
Dua pesakit lelaki berumur 60 tahun (P#1 dan P#2) menghidap diabetes Jenis 2. Masing-masing
mempunyai BMI 27. Rawatan utama bagi setiap pesakit adalah diet untuk mengurangkan tahap glukosa
darah.
Apakah sebab yang paling mungkin mengapa P#2 tidak menunjukkan penurunan paras glukosa
selepas tiga bulan?
A. P#1 mungkin telah melakukan lebih daripada P#2.
B. P#2 mungkin mempunyai bentuk diabetes yang lebih tahan.
C. P#2 mungkin menjalani kehidupan yang lebih tidak aktif daripada P#1.*
D. P#1 kehilangan lebih banyak berat badan pada diet pengurangan glukosa.
Diadaptasi
daripada: http://digitalcommons.hsc.unt.edu/cgi/viewcontent.cgi?article=100
9&context=test_item
(c) Pengganggu dan Sebab Konteks Utama dalam MCQ Kompleks Satu lagi
pendekatan untuk mengukur pemikiran kritis atau kreatif ialah meminta pelajar mensintesis apa yang
telah mereka pelajari ke dalam penjelasan. Jawapan yang mungkin termasuk jawapan dan pelbagai
sebab yang menyokong jawapan. Sudah tentu, hanya satu alasan yang logik dan betul, berdasarkan
pengetahuan dan kemahiran yang dinilai. Konteks juga disediakan apabila teknik ini digunakan.

Contohnya: Su
dan Ramya mahu menurunkan berat badan. Su mengamalkan diet rendah karbohidrat manakala
Ramya mengamalkan diet vegan. Selepas enam bulan, Su kehilangan 30 paun dan Ramya
kehilangan 15 paun.
Berhubung dengan penurunan berat badan, yang manakah daripada kesimpulan berikut disokong?
A. Diet rendah karbohidrat adalah lebih berkesan daripada diet vegan.*
B. Maklumat tambahan diperlukan sebelum membuat sebarang kesimpulan.
C. Diet rendah karbohidrat lebih mudah dikekalkan berbanding diet vegan.
D. Diet vegan mengandungi lebih banyak kalori daripada diet rendah karbohidrat.
Diadaptasi
daripada: http://digitalcommons.hsc.unt.edu/cgi/viewcontent.cgi?article=100
9&context=test_item
Nitko (2004) merujuk kepada jenis soalan ini sebagai item yang bergantung kepada konteks.
Konteks dipersembahkan dalam beberapa bentuk bahan pengenalan yang mungkin termasuk graf,
carta, lukisan, formula, cabutan daripada bahan bacaan, peta dan senarai perkataan. Dalam
membuat soalan jenis ini, adalah penting bagi pelajar untuk memikirkan dan menggunakan
maklumat dalam bahan pengenalan untuk menjawab soalan untuk menyelesaikan masalah atau
menyelesaikan tugasan penilaian. Contoh yang diberikan sebelum ini merujuk kepada item aneka
pilihan. Walau bagaimanapun, item bergantung konteks boleh digunakan dengan apa-apa jenis
format item seperti esei, item benar-salah dan padanan.
SEMAK KENDIRI 4.5
1. Apakah beberapa kelebihan MCQ?
2. Senaraikan beberapa had MCQ.
AKTIVITI 4.6
Cadangkan kelebihan dan kelemahan lain menggunakan MCQ.
forum.

• Ujian objektif ialah ujian bertulis yang terdiri daripada item atau soalan yang memerlukan
responden memilih jawapan daripada senarai jawapan yang mungkin.
• Item atau soalan objektif adalah „tepat‰ kerana ia tidak boleh dipengaruhi oleh
keutamaan peribadi dan prasangka penanda.
• Ujian objektif berbeza-beza bergantung kepada cara soalan dikemukakan. Empat jenis soalan
yang biasa digunakan dalam kebanyakan ujian objektif ialah soalan jawapan pendek, soalan
padanan, soalan benar-salah dan soalan aneka pilihan (MCQ).
• Dua bentuk soalan jawapan pendek ialah soalan langsung dan penyelesaian
soalan.
• Soalan benar-salah ialah soalan di mana pernyataan dikemukakan dan pelajar menunjukkan
dalam beberapa cara sama ada pernyataan itu benar atau salah.
• Soalan benar-salah boleh ditulis dengan cepat dan mudah untuk diberi markah. Kerana mereka
boleh dijaringkan secara objektif, markah adalah lebih dipercayai daripada item yang sekurang-
kurangnya sebahagiannya bergantung pada pertimbangan guru.
• Elakkan mengangkat kenyataan terus daripada bacaan yang diberikan, nota atau bahan kursus
lain supaya ingat sahaja tidak akan membenarkan jawapan yang betul.
• Soalan padanan digunakan untuk mengukur keupayaan pelajar untuk mengenal pasti hubungan
antara dua senarai istilah, frasa, pernyataan, definisi, tarikh, peristiwa, orang dan sebagainya.
• Untuk mengurangkan kemungkinan meneka jawapan yang betul dalam soalan padanan,
senaraikan bilangan respons yang lebih besar daripada premis dan benarkan respons
digunakan lebih daripada sekali.
• MCQ mempunyai dua bahagian: batang yang mengandungi soalan dan empat atau lima pilihan
yang mengandungi jawapan yang betul dipanggil respons berkunci dan pilihan yang salah
dipanggil distraktor.

• MCQ digunakan secara meluas kerana ia boleh digunakan untuk mengukur hasil
pembelajaran, daripada mudah kepada kompleks. Mereka sangat berstruktur dengan
tugas yang jelas disediakan dan dapat menguji sampel pencapaian yang luas.
• MCQ sukar dibina, cenderung mengukur hasil pembelajaran tahap rendah, meneka dan
tidak mengukur kebolehan menulis.
• Tidak mustahil untuk membina MCQ kemahiran berfikir aras tinggi (KBAT).
Alternatif Ujian objektif
Liputan kandungan Pilihan

Pengganggu Premis
Meneka Jawapan
Kemahiran berfikir aras tinggi (KBAT) Soalan jawapan pendek
Soalan yang sepadan Batang
Soalan aneka pilihan (MCQ) Soalan benar-salah

Topik ÿ Membina
Esei
5 Soalan
HASIL PEMBELAJARAN
1. Mengenal pasti sifat-sifat soalan esei;
2. Menerangkan tujuan menggunakan ujian esei; 3.
Huraikan kelebihan dan batasan soalan esei; 4. Mengenal pasti hasil
pembelajaran yang dinilai dengan sewajarnya menggunakan

soalan esei; dan
5. Bina soalan esei yang ditulis dengan baik yang menilai pembelajaran
hasil.
ÿ PENGENALAN
Dalam Topik 4, kami membincangkan secara terperinci penggunaan ujian objektif dalam menilai
pelajar. Dalam topik ini, kita akan mengkaji ujian esei. Ujian esei ialah teknik popular untuk
menilai pembelajaran dan digunakan secara meluas di semua peringkat pendidikan. Ia juga
digunakan secara meluas dalam menilai hasil pembelajaran dalam peperiksaan perniagaan dan profesional.
Soalan esei digunakan kerana ia mencabar pelajar untuk mencipta respons mereka sendiri
dan bukannya hanya memilih jawapan. Soalan esei berpotensi untuk mendedahkan
keupayaan pelajar untuk menaakul, mencipta, menganalisis dan mensintesis. Kemahiran
ini mungkin tidak dinilai dengan berkesan menggunakan ujian objektif.

84 ÿ TOPIK 5 MEMBINA SOALAN ESEI
5.1 APA ITU SOALAN ESEI?

Menurut Stalnaker (1951), soalan esei ialah „item ujian yang memerlukan respons yang dikarang
oleh pemeriksa biasanya dalam bentuk satu atau lebih ayat yang bersifat yang tiada satu pun
respons atau corak respons boleh disenaraikan sebagai betul, dan ketepatan dan kualiti yang
boleh dinilai secara subjektif hanya oleh seorang yang mahir atau berpengetahuan dalam
subjek‰. Walaupun definisi itu telah lama diberikan, ia masih merupakan definisi yang
komprehensif.
Menghuraikan definisi ini, Reiner, Bothell, Sudweeks dan Wood (2002), berpendapat bahawa
untuk melayakkan diri sebagai soalan esei ia harus memenuhi empat kriteria berikut:
(a) Pelajar perlu mengarang dan bukannya memilih jawapan atau jawapannya. Dalam soalan
esei, pelajar perlu membina jawapan mereka sendiri dan memutuskan bahan apa yang
perlu disertakan dalam respons mereka. Soalan ujian objektif (MCQ, benar-salah,
padanan) memerlukan pelajar memilih jawapan daripada senarai kemungkinan.
(b) Respons atau jawapan yang diberikan oleh pelajar terdiri daripada satu atau lebih ayat.
Pelajar tidak menjawab dengan jawapan „ya‰ atau „tidak‰ sebaliknya perlu memberikan
respons dalam bentuk ayat. Secara teori tidak ada had untuk panjang jawapan. Walau
bagaimanapun, dalam kebanyakan kes panjangnya ditentukan terlebih dahulu oleh
tuntutan soalan dan had masa yang diperuntukkan untuk soalan itu.
(c) Tiada satu pun jawapan atau jawapan yang betul. Dalam erti kata lain, soalan itu harus
disusun supaya ia tidak meminta satu jawapan yang betul. Sebagai contoh, soalan, „Siapa
yang membunuh JWW Birch?‰ menilai ingatan atau ingatan secara verbatim dan
bukannya keupayaan untuk berfikir. Oleh itu, ia tidak boleh layak sebagai soalan esei.
Anda boleh mengubah suai soalan itu kepada „Kenal pasti siapa yang membunuh JWW
Birch dan terangkan faktor-faktor yang membawa kepada pembunuhan itu.‰ Kini, ia
adalah soalan esei yang menilai keupayaan pelajar untuk berfikir dan memberi sebab
untuk pembunuhan itu disokong dengan bukti yang relevan.
(d) Ketepatan dan kualiti jawapan atau jawapan pelajar terhadap esei mesti dinilai secara
subjektif oleh pakar dalam perkara tersebut. Sifat soalan esei adalah sedemikian rupa
sehingga hanya pakar dalam perkara yang boleh menilai sejauh mana respons (atau
jawapan) kepada esei adalah lengkap, tepat dan relevan.
Soalan esei yang baik menggalakkan pelajar berfikir secara mendalam tentang jawapan
mereka yang hanya boleh dinilai oleh seseorang yang mempunyai pengalaman dan
kepakaran yang sesuai dalam bidang kandungan. Oleh itu, kepakaran kandungan adalah
penting untuk kedua-dua penulisan dan penggredan soalan esei. Sebagai contoh, soalan
„Senaraikan tiga sebab pembukaan Pulau Pinang oleh British pada tahun 1789‰
memerlukan pelajar mengingat semula senarai set item. Orang yang menanda atau menggred esei tidak

TOPIK 5 MEMBINA SOALAN ESEI ÿ 85
perlu menjadi pakar subjek untuk mengetahui sama ada pelajar telah menyenaraikan tiga sebab
dengan betul asalkan senarai tiga sebab tersedia sebagai kunci jawapan. Bagi soalan „Sejauh
manakah perdagangan menjadi sebab utama pembukaan Pulau Pinang oleh British pada tahun
1789?‰ pakar mata pelajaran diperlukan untuk menilai atau menanda jawapan kepada soalan
esei ini.
5.2 JENIS-JENIS KARANGAN
Secara umumnya, terdapat dua jenis esei yang digunakan di institusi pendidikan iaitu esei kerja kursus
dan esei peperiksaan.
(a) Esei Kerja Kursus

Esei kerja kursus boleh terdiri daripada yang berikut:
(i) Rangka Karangan

Ini adalah ringkasan pendek atau garis besar topik tertentu (mungkin, kira-kira 500 patah
perkataan). Ia menilai keupayaan untuk menyusun bahan, untuk membina hujah yang
koheren dan untuk memilih maklumat yang relevan daripada bidang pengajian yang luas.
(ii) Esei Standard

Ini adalah kertas kerja penuh untuk sebarang topik dari 1,000 hingga 2,500 patah perkataan.
Mereka menilai kebolehan untuk menerangkan dan menganalisis hubungan antara idea
dan peristiwa, untuk memberikan penjelasan yang koheren tentang topik, untuk memilih
dan menimbang bukti untuk menyokong hujah, untuk mendiagnosis dan mencadangkan
penyelesaian kepada masalah, untuk menyelesaikan jenis masalah yang biasa, untuk
menyatakan pertimbangan kritis dan membuat perbandingan.
(iii) Esei Lanjutan

Ini adalah kertas penuh dengan panjang antara 2,500 hingga 5,000 patah perkataan.
Mereka menilai keupayaan untuk menyelesaikan masalah yang kurang biasa dan
menganalisis atau menilai secara kritis bahan yang kurang biasa, oleh itu, memerlukan
penyediaan atau penyelidikan yang lebih meluas.
Esei kerja kursus bertujuan untuk menilai keupayaan pelajar untuk menyelidik topik dengan teliti
dan teliti, dan untuk mengendalikan jisim bahan. Ia menilai keupayaan mereka untuk menjawab
dengan panjang lebar apabila „diberikan tali yang cukup‰ pada topik yang dipilih. Kebimbangan
khusus ialah perkara yang pelajar sampaikan, cara dia memahaminya, cara eseinya disusun
dan nilai yang dia letakkan pada pelbagai aspek topik. Esei kerja kursus ialah respons bertulis
dan pelajar diharapkan, sebahagian besarnya, menggunakan perkataan mereka sendiri dan
menyampaikan idea mereka dengan jelas dan meyakinkan.

(b) Esei Peperiksaan

Ini adalah esei pendek yang ditulis sebagai sebahagian daripada peperiksaan rasmi. Pasti
anda mempunyai pengalaman dengan format penilaian ini! Sebagai contoh, dalam 2 hingga 3-
peperiksaan jam, pelajar mungkin dikehendaki menjawab kira-kira tiga soalan esei
yang memperuntukkan kira-kira 35 hingga 45 minit setiap soalan. Dalam amalan,
terdapat banyak variasi dalam bilangan soalan yang ditanya dan tempoh peperiksaan.
Dalam sesetengah situasi terdapat pilihan soalan manakala dalam situasi lain tiada
pilihan. Sebab untuk mengawal pilihan adalah untuk memastikan pelajar diperiksa
dalam julat yang setanding. Perbincangan seterusnya memfokuskan kepada esei
peperiksaan khususnya penggunaan soalan esei dalam peperiksaan yang lazimnya
adalah suasana „buku tertutup‰. Kami akan membincangkan lebih lanjut tentang esei
kerja kursus dalam Topik 5 di bawah Projek.
AKTIVITI 5.1
Pilih beberapa soalan esei yang telah digunakan dalam ujian atau peperiksaan.
Sejauh manakah soalan-soalan ini memenuhi kriteria soalan esei
seperti yang ditakrifkan oleh Stalnaker (1951) dan dihuraikan oleh Reiner, Bothell,
Sudweeks dan Wood (2002)?
Kongsi jawapan anda dengan rakan kursus anda dalam forum dalam talian
myINSPIRE.
5.3 MENGAPA SOALAN ESEI DIGUNAKAN?

Soalan esei digunakan untuk menilai pembelajaran kerana sebab-sebab berikut:
(a) Soalan esei menyediakan cara yang berkesan untuk menilai pembelajaran kompleks Ia
hasil . membolehkan penilaian keupayaan pelajar untuk mensintesis idea,
menyusun dan menyatakan idea, dan menilai nilai idea. Kebolehan ini tidak boleh
dinilai secara berkesan secara langsung dengan item ujian kertas dan pensel yang lain.
(b) Soalan esei membolehkan pelajar menunjukkan penaakulan mereka. Soalan esei bukan
sahaja membenarkan pelajar membentangkan jawapan kepada soalan tetapi juga
menjelaskan bagaimana mereka sampai pada kesimpulan mereka. Ini membolehkan guru
mendapatkan pandangan tentang cara pelajar melihat dan menyelesaikan masalah.
Dengan pandangan sedemikian, guru dapat mengesan masalah yang mungkin dihadapi
oleh pelajar dengan proses penaakulan mereka dan membantu mereka mengatasi masalah tersebut.

(c) Soalan esei memberikan pengalaman yang sahih. „Membina respons‰ lebih dekat dengan
kehidupan sebenar daripada memilih respons (seperti dalam kes ujian objektif).
Penyelesaian masalah dan membuat keputusan adalah kecekapan hidup penting yang
memerlukan keupayaan untuk membina penyelesaian atau keputusan daripada memilih
penyelesaian atau keputusan daripada satu set kemungkinan yang terhad. Dalam persekitaran
kerja, tidak mungkin majikan akan memberikan senarai „empat pilihan‰ untuk dipilih oleh pekerja
apabila diminta menyelesaikan masalah! Dalam kebanyakan kes, pekerja akan dikehendaki
membina respons. Oleh itu, item esei lebih dekat dengan kehidupan sebenar daripada soalan
ujian objektif kerana dalam kehidupan sebenar pelajar biasanya membina respons, bukan
memilihnya.
5.4 MEMUTUSKAN SAMA ADA UNTUK MENGGUNAKAN KARANGAN ATAU
SOALAN OBJEKTIF
Soalan esei harus berusaha untuk kemahiran berfikir aras tinggi.
Keputusan sama ada untuk menggunakan soalan esei atau soalan objektif dalam peperiksaan boleh
menjadi masalah bagi sesetengah pendidik. Dalam keadaan sedemikian seseorang itu perlu kembali
kepada objektif penilaian. Apakah hasil pembelajaran yang anda ingin capai?
Soalan esei biasanya sesuai untuk tujuan berikut:
(a) Untuk menilai pemahaman pelajar tentang kandungan subjek; dan
(b) Untuk menilai kemahiran berfikir yang memerlukan lebih daripada mengingat kembali maklumat
secara verbatim dengan mencabar pelajar untuk menaakul pengetahuan mereka.
Adalah mencabar untuk menulis item ujian untuk memanfaatkan pemikiran aras tinggi. Walau
bagaimanapun, pemahaman pelajar tentang kandungan subjek dan banyak lagi kemahiran berfikir aras
tinggi yang lain juga boleh dinilai melalui item objektif. Apabila ragu-ragu sama ada hendak menggunakan
soalan esei atau soalan objektif, ingatlah bahawa soalan esei digunakan untuk menilai keupayaan
pelajar untuk membina.
daripada memilih jawapan.
Untuk menentukan jenis ujian (esei atau objektif) yang hendak digunakan, adalah berguna untuk anda
memeriksa kata kerja yang paling menggambarkan keupayaan yang dikehendaki untuk dinilai. Kami
telah membincangkan kata kerja ini dalam Topik 2. Kata kerja ini menunjukkan apa yang pelajar dijangka
lakukan dan bagaimana mereka harus bertindak balas. Kata kerja ini berfungsi untuk menyalurkan dan
memfokuskan respons pelajar terhadap pelaksanaan tugasan tertentu. Beberapa kata kerja jelas
menunjukkan bahawa pelajar perlu membina daripada memilih jawapan mereka (contohnya, untuk menerangkan).
Kata kerja lain menunjukkan bahawa hasil pembelajaran yang dimaksudkan tertumpu pada keupayaan
pelajar untuk mengingat maklumat (contohnya, untuk menyenaraikan). Mungkin, ingatan paling baik
dinilai melalui item yang dijaringkan secara objektif. Kata kerja yang menguji pemahaman tentang subjek

kandungan atau bentuk lain pemikiran aras tinggi tetapi tidak menyatakan sama ada pelajar membina
atau memilih respons (contohnya, untuk mentafsir) boleh dinilai sama ada dengan soalan esei atau item
objektif.
AKTIVITI 5.2
Bandingkan, terangkan, susun, pakai, nyatakan, klasifikasikan, reka bentuk, gambarkan,

huraikan, namakan, lengkapkan, pilih, pertahankan, namakan.
Antara senarai kata kerja di atas yang manakah paling baik dinilai oleh soalan esei atau
ujian objektif atau kedua-duanya?
forum.
5.5 BATASAN SOALAN ESEI

Walaupun soalan esei popular kerana ia membolehkan penilaian hasil pembelajaran peringkat tinggi,
format penilaian pelajar dalam peperiksaan ini mempunyai beberapa batasan yang perlu diingat.
Batasannya ialah:
(a) Satu tujuan ujian adalah untuk menilai penguasaan pelajar terhadap perkara tersebut.
Dalam kebanyakan kes, adalah tidak mungkin untuk menilai penguasaan pelajar terhadap domain
subjek yang lengkap dengan hanya beberapa soalan. Oleh kerana masa yang diambil untuk
pelajar menjawab soalan esei dan untuk penanda untuk menandakan jawapan pelajar, bilangan
soalan esei yang boleh dimasukkan dalam ujian adalah terhad. Oleh itu, menggunakan soalan
esei akan mengehadkan sejauh mana ujian mewakili domain subjek, dengan itu mengurangkan
kesahan kandungan. Sebagai contoh, ujian 80 soalan aneka pilihan kemungkinan besar akan
merangkumi lebih banyak domain kandungan daripada ujian 3 atau 4 soalan esei.
.
(b) Soalan esei mempunyai had kebolehpercayaanSementara soalan esei membenarkan pelajar sedikit
fleksibiliti dalam merumuskan respons mereka, kebolehpercayaan pemarkahan atau penggredan
dipersoalkan. Penanda atau penggred yang berbeza mungkin berbeza dalam pemarkahan atau
penggredan bagi respons yang sama atau serupa (kebolehpercayaan antara penjaring) dan satu
penanda boleh berbeza dengan ketara dalam ketekalan pemarkahan atau penggredannya
merentas soalan bergantung pada banyak faktor (kebolehpercayaan intra-skor). Oleh itu, jawapan
esei dengan kualiti yang sama mungkin menerima markah yang berbeza. Ciri-ciri pelajar, panjang
dan kebolehbacaan respons dan keutamaan peribadi penanda atau penggred berkenaan dengan
kandungan dan struktur respons adalah beberapa faktor yang boleh membawa kepada
pemarkahan atau penggredan yang tidak boleh dipercayai.

(c) Soalan esei memerlukan lebih masa untuk menandakan respons pelajar. Guru perlu
meluangkan banyak masa untuk membaca dan menandakan jawapan pelajar
terhadap soalan esei. Sebaliknya, agak sedikit atau tiada masa yang diperlukan oleh
guru untuk menskor item ujian objektif seperti item aneka pilihan dan latihan padanan.
(d) Seperti yang dinyatakan sebelum ini, salah satu kekuatan soalan esei ialah ia
memberikan pelajar pengalaman autentik kerana pelajar dicabar untuk membina
dan bukannya memilih jawapan mereka. Sejauh manakah masa singkat yang
diberikan mempengaruhi tindak balas pelajar? Pelajar mempunyai masa yang agak
sedikit untuk membina respons mereka dan ia tidak membenarkan mereka memberi
perhatian yang sewajarnya kepada proses yang kompleks untuk menyusun, menulis,
dan menyemak respons mereka. Malah, dalam menjawab soalan esei, pelajar
menggunakan proses penulisan yang agak berbeza daripada proses biasa yang
menghasilkan penulisan yang cemerlang (seperti draf, menyemak, menyemak dan
menilai). Di samping itu, pelajar biasanya tidak mempunyai sumber untuk membantu
penulisan mereka semasa menjawab soalan esei (seperti kamus dan tesaurus). Had
ini mungkin mengimbangi apa jua kelebihan yang diperoleh daripada fakta bahawa
respons kepada soalan esei adalah lebih sahih daripada respons kepada item aneka pilihan.
5.6 BEBERAPA SALAH KONSEP MENGENAI KARANGAN

SOALAN
Selain batasan soalan esei, terdapat juga beberapa salah tanggapan tentang format
penilaian ini seperti:
(a) Mengikut Sifat Mereka Soalan Esei Menilai Pemikiran Aras Tinggi (HOT)
Sama ada item esei menilai HOT bergantung pada reka bentuk soalan dan cara
jawapan pelajar dijaringkan. Soalan esei tidak secara automatik menilai kemahiran
berfikir aras tinggi (KBAT). Adalah mungkin untuk menulis soalan esei yang hanya
menilai ingatan. Selain itu, jika seorang guru mereka bentuk soalan esei yang
bertujuan untuk menilai HOT tetapi kemudian menskor respons pelajar dalam cara
yang hanya memberi ganjaran kepada keupayaan mengingat, ini bermakna guru
tidak menilai HOT. Guru mesti terlatih untuk mereka bentuk dan menulis item KBAT.
(b) Soalan Esei Mudah Dibina

Soalan esei lebih mudah dibina daripada item aneka pilihan kerana guru tidak perlu
mencipta distraktor yang berkesan. Walau bagaimanapun, itu tidak bermakna soalan
esei yang baik mudah untuk dibina. Mereka mungkin lebih mudah untuk dibina
dalam erti kata yang relatif, tetapi mereka masih memerlukan banyak usaha dan masa.
Soalan esei yang dibina secara tergesa-gesa tanpa banyak berfikir dan ulasan
biasanya berfungsi dengan baik.

(c) Penggunaan Soalan Esei Menghapuskan Masalah Meneka

Salah satu kelemahan item ujian objektif ialah pelajar kadangkala mendapat jawapan
yang betul dengan meneka yang mana satu pilihan yang dibentangkan adalah betul.
Masalah ini tidak wujud dengan soalan esei kerana pelajar perlu menjana jawapan
daripada mengenal pastinya daripada satu set pilihan yang disediakan.
Walau bagaimanapun, penggunaan soalan esei memperkenalkan gertakan yang
merupakan satu lagi bentuk tekaan. Sesetengah pelajar adalah „pandai‰ menggunakan
pelbagai kaedah menggertak (seperti generalisasi yang samar-samar, padding dan
menjatuhkan nama) untuk menambah kredibiliti kepada jawapan yang lemah. Justeru,
penggunaan soalan esei mengubah sifat tekaan yang berlaku tetapi tidak menghilangkannya.
(d) Soalan Esei Memberi Manfaat kepada Semua Pelajar dengan Menekankan Kepentingan
Kemahiran Komunikasi Bertulis
Komunikasi bertulis adalah kecekapan hidup yang diperlukan untuk prestasi yang
berkesan dan berjaya dalam banyak kerjaya. Soalan esei mencabar pelajar untuk
mengatur dan menyatakan perkara dan penyelesaian masalah dengan perkataan mereka
sendiri, dengan itu memberi mereka peluang untuk mempraktikkan kemahiran komunikasi
bertulis yang akan membantu mereka dalam tanggungjawab vokasional masa depan.
Pada masa yang sama, tumpuan kepada kemahiran komunikasi bertulis juga merupakan
kelemahan yang serius bagi pelajar yang mempunyai kemahiran menulis marginal tetapi
mengetahui perkara yang dinilai. Bagi pelajar yang berpengetahuan dalam mata pelajaran
tetapi memperoleh markah rendah kerana ketidakupayaan mereka untuk menulis dengan
baik, kesahan markah ujian terjejas.
(e) Soalan Esei Menggalakkan Pelajar Bersedia Dengan Lebih Teliti

Sesetengah penyelidikan nampaknya menunjukkan bahawa pelajar lebih teliti dalam
persediaan mereka untuk soalan esei daripada dalam persediaan mereka untuk ujian
objektif seperti soalan aneka pilihan. Walau bagaimanapun, selepas kajian menyeluruh
terhadap literatur sedia ada dan penyelidikan mengenai perkara itu, Crook (1988)
menyimpulkan bahawa pelajar lebih bersedia berdasarkan jangkaan yang diberikan oleh
guru kepada mereka (seperti HOT, keluasan dan kedalaman kandungan) berbanding
dengan jenis ujian. item soalan yang mereka jangka akan diberikan.
SEMAK KENDIRI 5.1
1. Apakah beberapa batasan dalam penggunaan soalan esei?
2. Senaraikan beberapa miskonsepsi soalan esei.

AKTIVITI 5.3
1. Cadangkan kelemahan lain menggunakan soalan esei dalam

peperiksaan.
2. Bandingkan dua soalan esei berikut dan tentukan yang mana satu
menilai kemahiran berfikir aras tinggi. Bincangkan jawapan anda dengan
rakan kursus anda.
(a) Apakah kelebihan dan had utama solar

tenaga?
(b) Memandangkan kelebihan dan batasannya, sepatutnya kerajaan

membelanjakan wang membangunkan tenaga solar? Mewajarkan.
forum.
5.7 BEBERAPA GARIS PANDUAN UNTUK MEMBINA

SOALAN ESEI
Semasa membina soalan esei, sama ada untuk penilaian kerja kursus atau peperiksaan, perkara
yang paling penting ialah memastikan pelajar mempunyai idea yang jelas tentang apa yang
mereka dijangka lakukan selepas mereka membaca soalan atau masalah yang dikemukakan.
Berikut ialah garis panduan khusus yang boleh membantu anda menambah baik soalan esei sedia
ada atau mencipta soalan baharu:
(a) Tentukan Dengan Jelas Hasil Pembelajaran Yang Diinginkan untuk Ditaksir oleh
soalan
Mengetahui hasil pembelajaran yang dimaksudkan adalah penting untuk mereka bentuk
soalan esei. Dalam menentukan hasil pembelajaran yang dimaksudkan, guru menjelaskan
prestasi yang sepatutnya dapat ditunjukkan oleh pelajar hasil daripada apa yang telah
mereka pelajari. Hasil pembelajaran yang dimaksudkan biasanya bermula dengan kata
kerja yang menerangkan tingkah laku, tindakan atau hasil yang boleh diperhatikan yang
harus ditunjukkan oleh pelajar. Tumpuan adalah pada perkara yang pelajar sepatutnya boleh lakukan dan
bukan pada proses pembelajaran atau pengajaran. Menyemak senarai kata kerja boleh
membantu untuk menjelaskan keupayaan yang perlu ditunjukkan oleh pelajar dan untuk
mentakrifkan dengan jelas hasil pembelajaran yang ingin dinilai (rujuk Subtopik 5.8).

(b) Elakkan Menggunakan Soalan Esei untuk Hasil Pembelajaran yang Diniatkan yang Boleh
Ditaksir Lebih Baik dengan Jenis Penilaian Lain Beberapa jenis hasil pembelajaran boleh
dinilai dengan lebih cekap dan lebih dipercayai dengan ujian objektif berbanding dengan
soalan esei. Memandangkan soalan esei mencontohi julat kandungan perkara yang terhad,
memakan masa yang lebih lama untuk menskor dan melibatkan subjektiviti yang lebih besar
dalam pemarkahan, penggunaan soalan esei harus dikhaskan untuk hasil pembelajaran
yang tidak boleh dinilai dengan lebih baik melalui kaedah lain.
Sebagai contoh:
Hasil pembelajaran: Untuk dapat membezakan tabiat pembiakan burung dan amfibia
Soalan esei: Apakah perbezaan ciri bertelur antara burung dan amfibia?
Nota: Hasil pembelajaran ini boleh dinilai dengan lebih baik dengan menggunakan objektif
ujian.
Item Ujian Objektif:

Manakah antara perbezaan berikut antara burung dan amfibia yang betul?
burung amfibia
A Bertelur beberapa biji pada satu masa Bertelur banyak pada satu masa
B Bertelur Melahirkan
C Jangan mengeram telur Inkubasi telur
D Bertelur dalam sarang Bertelur di darat
(c) Kejelasan tentang Tugas dan Skop

Soalan esei mempunyai dua elemen pembolehubah, iaitu sejauh mana tugasan disusun
dan sejauh mana skop kandungan difokuskan.
Masih terdapat kekeliruan dalam kalangan pendidik sama ada lebih banyak struktur tugas
dan lebih fokus pada kandungan adalah lebih baik daripada kurang struktur dan kurang fokus.
Apabila tugasan lebih tersusun dan skop kandungan lebih fokus, dua masalah dikurangkan:
(i) Masalah tindak balas pelajar yang mengandungi idea yang tidak dimaksudkan untuk
dinilai; dan

(ii) Masalah subjektiviti yang melampau semasa menskor jawapan pelajar atau
maklum balas.
Walaupun lebih banyak struktur membantu mengelakkan masalah ini, berapa banyak dan jenis struktur
dan fokus yang perlu disediakan adalah bergantung kepada hasil pembelajaran yang dimaksudkan yang
akan dinilai oleh soalan esei. Proses menulis soalan esei yang berkesan melibatkan penentuan tugas dan
mengehadkan skop isi dalam usaha untuk mencipta soalan berkesan yang sejajar dengan hasil
pembelajaran yang ingin dinilai (diilustrasikan dalam Rajah 5.1).
Rajah 5.1: Penjajaran antara kandungan, aktiviti pembelajaran dan tugas penilaian
Sumber: Phillips, Ansary Ahmed & Kuldip Kaur (2005)
Penjajaran yang ditunjukkan dalam Rajah 5.1 adalah mutlak diperlukan untuk mendapatkan respons pelajar yang
boleh diterima sebagai bukti bahawa pelajar telah mencapai hasil pembelajaran yang diharapkan. Oleh itu, soalan
esei mesti ditulis dengan teliti dan bernas sedemikian rupa sehingga ia menimbulkan respons pelajar yang
memberikan guru bukti yang sah dan boleh dipercayai tentang pencapaian pelajar terhadap hasil pembelajaran
yang diharapkan. Kegagalan untuk menetapkan had yang mencukupi dan berkesan untuk jawapan pelajar kepada
soalan esei boleh menyebabkan pelajar menetapkan sempadan mereka sendiri untuk respons mereka. Ini
bermakna bahawa pelajar mungkin memberikan jawapan yang berada di luar tugasan yang dimaksudkan atau
menangani hanya sebahagian daripada tugasan yang dimaksudkan. Apabila ini berlaku, guru ditinggalkan dengan
maklumat yang tidak boleh dipercayai dan tidak sah tentang pencapaian pelajar terhadap hasil pembelajaran
yang dimaksudkan. Selain itu, tiada asas untuk menanda atau menggred jawapan pelajar. Oleh itu, adalah
menjadi tanggungjawab guru untuk menulis soalan esei dengan cara yang memberikan pelajar sempadan yang
jelas untuk jawapan atau respons mereka.

Sebagai contoh:
Meningkatkan Kejelasan Tugas dan Skop Soalan Esei
Soalan Esei Lemah: Nilaikan

kesan Revolusi Perindustrian terhadap England.
Kata kerja ialah „evaluate‰ iaitu tugas yang sepatutnya dilakukan oleh pelajar. Skop persoalan
ialah kesan Revolusi Perindustrian ke atas England. Sangat sedikit bimbingan yang diberikan
kepada pelajar tentang tugas menilai dan skop tugas. Seorang pelajar yang membaca soalan
mungkin bertanya:
(a) Kesan terhadap apakah di England? Ekonomi? Perdagangan Luar Negeri? Sekumpulan orang
tertentu? [Skopnya tidak jelas].
(b) Menilai berdasarkan kriteria apa? Kepentingan revolusi? Kualiti hidup di England? Kemajuan
dalam kemajuan teknologi? [Tugas tidak jelas].
(c) Apakah sebenarnya yang anda mahu saya lakukan dalam penilaian saya? [Tugasnya tidak
jelas]
Soalan Esei Penambahbaikan:

Nilaikan kesan Revolusi Perindustrian terhadap kualiti kehidupan keluarga di England. Terangkan
sama ada keluarga mampu menyediakan pendidikan anak-anak mereka.
Soalan yang dipertingkatkan mengehadkan tugas untuk pelajar dengan menyatakan unit
masyarakat tertentu di England yang terjejas oleh Revolusi Perindustrian (keluarga). Tugas itu
juga dihadkan dengan memberi pelajar kriteria untuk menilai kesan Revolusi Perindustrian (sama
ada keluarga mampu menyediakan pendidikan anak-anak mereka atau tidak). Pelajar lebih jelas
tentang apa yang perlu dilakukan untuk „menilai.‰ Mereka perlu menerangkan bagaimana
keluarga telah berubah dan menilai sama ada perubahan itu adalah peningkatan untuk anak-anak
mereka.
SEMAK KENDIRI 5.2
1. Bilakah anda akan membuat keputusan untuk menggunakan item objektif dan bukannya item
soalan esei untuk menilai pembelajaran?
2. Apakah perbezaan antara tugasan dan skop sesebuah esei

soalan?

(d) Soalan yang Adil

Salah satu cabaran yang dihadapi oleh guru semasa mengarang soalan esei ialah mereka
mungkin terdorong untuk menuntut kepakaran kandungan yang tidak munasabah di pihak
pelajar kerana pengalaman mereka yang luas dengan subjek tersebut. Oleh itu, guru perlu
memastikan bahawa pelajar mereka boleh „diharapkan mempunyai bahan yang mencukupi
untuk menjawab soalan.‰ (Stalnaker, 1952). Di samping itu, guru harus bertanya kepada diri
sendiri sama ada pelajar boleh dijangka secara munasabah untuk melaksanakan proses
pemikiran yang diperlukan dengan secukupnya dalam tugasan itu. Untuk penilaian menjadi
adil, guru perlu menyediakan pelajar mereka dengan pengajaran dan amalan yang mencukupi
dalam perkara mata pelajaran dan proses pemikiran yang akan dinilai.
Satu lagi elemen penting ialah mengelak daripada menggunakan soalan tidak tentu. Sesuatu
soalan adalah tidak tentu jika ia sangat tidak berstruktur sehingga pelajar boleh mentakrifkan
semula masalah dan menumpukan pada beberapa aspek yang mereka sudah biasa atau jika
pakar dalam subjek tidak bersetuju bahawa satu jawapan adalah lebih baik daripada yang lain.
Salah satu cara untuk mengelakkan soalan tidak tentu adalah dengan menjauhi perbendaharaan
kata yang samar-samar. Sebagai contoh, guru hendaklah mengelak daripada menggunakan
kata kerja „bincang‰ dalam soalan esei. Kata kerja ini terlalu luas dan kabur.
Selain itu, guru juga harus mengelak daripada memasukkan kosa kata yang terlalu maju untuk
pelajar.
(e) Nyatakan Anggaran Had Masa dan Markah Yang Diperuntukkan bagi setiap Soalan Menentukan
anggaran had masa membantu pelajar memperuntukkan masa mereka dalam menjawab
beberapa soalan esei. Tanpa garis panduan sedemikian, pelajar mungkin bingung tentang
berapa banyak masa yang perlu diluangkan untuk soalan. Apabila memutuskan garis panduan
untuk berapa banyak masa yang perlu dibelanjakan untuk soalan, ingatkan pelajar yang lebih
perlahan dan pelajar yang mempunyai ketidakupayaan tertentu. Di samping itu, pastikan
bahawa pelajar boleh dijangka secara realistik untuk memberikan jawapan yang mencukupi
dalam masa yang diberikan atau yang dicadangkan. Begitu juga, nyatakan markah yang
diperuntukkan untuk setiap soalan supaya pelajar boleh memutuskan berapa banyak yang
mereka perlu tulis untuk soalan itu.
(f) Gunakan Beberapa Soalan Esei Relatif Pendek Daripada Satu Esei Panjang
Soalan
Hanya bilangan soalan esei yang sangat terhad boleh dimasukkan ke dalam ujian kerana
masa yang diambil untuk pelajar menjawabnya dan masa yang diambil oleh guru untuk menilai
jawapan pelajar. Ini mewujudkan cabaran berkenaan dengan mereka bentuk soalan esei yang
sah. Soalan esei yang lebih pendek adalah lebih sesuai untuk menilai kedalaman pembelajaran
pelajar dalam sesuatu mata pelajaran manakala soalan esei yang lebih panjang lebih sesuai
untuk menilai keluasan pembelajaran pelajar dalam sesuatu mata pelajaran. Oleh itu, terdapat
pertukaran apabila memilih antara beberapa soalan esei pendek dan satu soalan esei panjang.
Fokus pada

menilai kedalaman pembelajaran pelajar mengehadkan penilaian keluasan pembelajaran

pelajar dalam subjek yang sama dan begitu juga sebaliknya. Apabila memilih antara
menggunakan beberapa soalan esei pendek atau satu soalan panjang, juga perlu diingat
bahawa esei pendek biasanya lebih mudah untuk ditanda daripada soalan esei panjang.
(g) Elakkan Penggunaan Soalan Pilihan Pelajar

tidak boleh dibenarkan memilih satu soalan esei daripada dua atau lebih soalan pilihan.
Penggunaan soalan pilihan hendaklah dielakkan atas sebab-sebab berikut:
(i) Pelajar boleh membuang masa membuat keputusan tentang sesuatu pilihan; dan
(ii) Sesetengah soalan mungkin lebih sukar yang boleh menjadikan penilaian perbandingan
kebolehan pelajar tidak adil.
Isu penggunaan soalan pilihan boleh dipertikaikan. Ia sering diamalkan terutamanya di

peringkat pengajian tinggi dan pelajar sering menuntut agar mereka diberi pilihan. Amalan
ini boleh diterima jika dapat dipastikan bahawa soalan mempunyai tahap kesukaran yang
setara dan tugasan serta skop yang diperlukan oleh soalan adalah setara.
(h) Membina Soalan Pemikiran Aras Tinggi

Pemikiran aras tinggi (HOT) ialah berfikir pada tahap yang lebih tinggi daripada menghafal
fakta. Sebarang soalan yang hanya menilai ingatan pelajar adalah apabila jawapan telah
dibincangkan di dalam bilik darjah sebelum ini.
Salah satu cara untuk menulis soalan esei HOT adalah untuk membentangkan pelajar
dengan situasi yang belum pernah mereka temui sebelum ini supaya mereka mesti
menaakul dengan pengetahuan mereka dan memberikan penilaian yang sahih tentang
pemikiran kompleks. Sebagai contoh, kemukakan sesuatu dalam bentuk teks pengenalan,
visual, senario, bahan sumber atau beberapa masalah untuk difikirkan oleh pelajar.
Kelebihan mengemukakan situasi masalah tertentu yang belum pernah dihadapi sebelum
ini ialah pelajar belajar untuk menggunakan pemikiran mereka dalam kehidupan sebenar.
konteks.
Guru tidak seharusnya menuntut kepakaran kandungan yang tidak munasabah di pihak
pelajar.

Memperbaik Soalan Esei melalui Pratonton dan Semakan
Langkah berikut boleh membantu anda menambah baik item esei sebelum dan
selepas anda mentadbirkannya kepada pelajar anda.
PREVIEW (sebelum mengedarkan soalan esei kepada pelajar)
• Ramal LearnersÊ Responses

Cuba jawab soalan dari perspektif pelajar biasa. Nilaikan sama ada pelajar
mempunyai pengetahuan kandungan dan kemahiran yang diperlukan untuk
menjawab soalan dengan secukupnya.
Kelemahan yang dikenal pasti dalam soalan esei hendaklah dipinda sebelum
mengedarkan peperiksaan.
• Tulis Jawapan Model

Sebelum mentadbir soalan, tulis jawapan model atau sekurang-kurangnya
garis besar perkara utama yang perlu disertakan dalam jawapan.
Menulis jawapan model membolehkan guru membuat refleksi tentang
kejelasan soalan esei. Tambahan pula, jawapan model berfungsi sebagai
asas untuk menggredkan respons pelajar. Setelah jawapan model telah
ditulis, bandingkan keselarasannya dengan soalan esei dan hasil pembelajaran
yang dimaksudkan. Buat perubahan mengikut keperluan supaya hasil
pembelajaran yang dihasratkan, soalan esei dan jawapan model adalah
sejajar antara satu sama lain.
• Minta Rakan Sekerja Yang Berpengetahuan Mengkaji Secara Kritis Soalan Esei,
Jawapan Model dan Hasil Pembelajaran yang Diniatkan untuk Semak
Penyelarasan Sebelum mentadbir soalan esei dalam ujian, minta orang yang
berpengetahuan dalam subjek untuk menyemak soalan esei secara kritis,
jawapan model dan hasil pembelajaran yang dimaksudkan untuk menentukan
sejauh mana ia sejajar antara satu sama lain.
SEMAKAN (selepas menerima jawapan pelajar)
• Semak Tindak Balas Pelajar terhadap Soalan Esei Selepas

pelajar menyelesaikan soalan esei, semak dengan teliti julat jawapan yang
diberikan dan cara pelajar mentafsir soalan tersebut. Membuat semakan
berdasarkan dapatan.
Menulis soalan esei yang baik adalah satu proses yang memerlukan masa
dan latihan. Mengkaji respons pelajar dengan teliti boleh membantu menilai
pemahaman pelajar terhadap soalan serta keberkesanan soalan dalam
menilai pembelajaran yang dimaksudkan.
hasil.

SEMAK KENDIRI 5.3
1. Mengapakah anda perlu menyatakan masa yang akan diperuntukkan bagi setiap soalan?
2. Mengapakah anda perlu mengelak soalan pilihan?
3. Apakah yang anda maksudkan dengan soalan harus „adil‰?
4. Apakah yang perlu anda lakukan sebelum dan selepas mentadbir ujian?
5. Apakah soalan esei HOT?
5.8 KATA KERJA YANG MENERANGKAN PELBAGAI JENIS

TUGASAN MENTAL
Menggunakan senarai yang dicadangkan oleh Moss and Holder (1988) dan Anderson dan Krathwohl
(2001), Reiner, Bothell, Sudweeks and Wood (2002) mencadangkan senarai kata kerja berikut yang
menerangkan tugas mental yang perlu dilakukan (rujuk Jadual 5.1). Takrifan menentukan proses pemikiran
yang mesti dilakukan oleh seseorang untuk menyelesaikan tugas mental. Ambil perhatian bahawa senarai
ini tidak lengkap dan contoh tempatan telah diperkenalkan untuk menggambarkan tugas mental yang
diperlukan untuk setiap soalan esei.
Jadual 5.1: Definisi Kata Kerja dan Contoh Tugas Mental yang Perlu Dilaksanakan
Kata kerja
Definisi dan Contoh
Menganalisis • Pecahkan bahan kepada bahagian-bahagian konstituennya dan tentukan bagaimana bahagian-
bahagian itu berkaitan antara satu sama lain dan dengan struktur atau tujuan keseluruhan.
• Contoh: Cerakinkan maksud baris „Dia ternampak seekor burung gagak mati, dalam longkang,
berhampiran pejabat pos‰ dalam sajak. Gagak Mati .
Mohon • Tentukan abstraksi (konsep, prinsip, peraturan, undang-undang, teori dan generalisasi) yang
relevan dalam situasi masalah. • Contoh: Mengaplikasikan prinsip penawaran dan
permintaan untuk menjelaskan mengapa indeks harga pengguna (IHP) di Malaysia telah
meningkat sejak tiga bulan lalu.
Atribut • Tentukan sudut pandangan, berat sebelah, nilai atau niat yang mendasari bahan yang
dibentangkan. • Contoh: Tentukan sudut pandangan pengarang dalam rencana
tentang perspektif politiknya.

Kelaskan • Tentukan kategori mana yang tergolong dalam sesuatu. • Contoh:
Kelaskan organisma kepada vertebrata dan invertebrata.
Bandingkan • Mengenal pasti dan menghuraikan titik persamaan. •
Contoh: Bandingkan peranan Dewan Rakyat dan Dewan Negara.
Karang • Membuat atau membentuk dengan menggabungkan benda, bahagian
atau unsur. • Contoh: Karang satu rancangan yang berkesan untuk menyelesaikan masalah
banjir di Kuala Lumpur.
Berbeza • Mengemukakan titik perbezaan. • Contoh:
Bezakan sumbangan Tun Hussein Onn dan Tun Abdul Razak Hussein terhadap kestabilan
politik Malaysia.
Buat • Letakkan elemen bersama-sama untuk membentuk keseluruhan yang koheren atau
berfungsi, menyusun semula elemen menjadi corak atau struktur baharu. • Contoh: Cipta
penyelesaian bagi masalah lalu lintas di Kuala Lumpur.
Kritikan • Mengesan konsistensi dan ketidakkonsistenan antara produk dan kriteria luaran yang
berkaitan; mengesan kesesuaian prosedur untuk masalah yang diberikan. • Contoh:
Berdasarkan pertimbangan anda, antara dua kaedah yang manakah merupakan cara
terbaik untuk menyelesaikan masalah kekurangan air?
Pertahankan
• Membangunkan dan mengemukakan hujah untuk menyokong cadangan, untuk mengekalkan
atau menyemak dasar, program atau mencadangkan tindakan. • Contoh: Mempertahankan
keputusan kerajaan menaikkan harga bahan api.
takrifkan • Memberi maksud perkataan atau konsep; letakkannya dalam kelas di mana ia berada;
membezakannya daripada item lain dalam kelas yang sama.
• Contoh: Takrifkan istilah „luluhawa kimia‰.
Huraikan • Berikan keterangan tentang; memberitahu atau menggambarkan dengan perkataan;

mewakili atau menggambarkan dengan gambar perkataan. • Contoh: Huraikan
sumbangan ZaÊba kepada perkembangan Bahasa Melayu.
Reka bentuk • Merangka prosedur untuk menyelesaikan beberapa tugas. •
Contoh: Reka satu eksperimen untuk membuktikan bahawa 21 peratus udara terdiri daripada
oksigen.
Membangunkan • Membawa ke keadaan yang lebih maju, berkesan atau boleh digunakan;
menghasilkan. • Contoh: Bina soalan esei dengan menambah baik soalan yang kurang
soalan esei yang berkesan.

Membezakan • Membezakan bahagian yang relevan daripada bahagian yang tidak berkaitan atau penting daripada
bahagian yang tidak penting dalam bahan yang dibentangkan.
• Contoh: Bezakan antara penawaran dan permintaan dalam menentukan harga.
Terangkan • Jelaskan sebab atau sebab sesuatu; membina model sebab-akibat sistem; beritahu „bagaimana‰
lakukan; memberitahu maksud.
• Contoh: Jelaskan punca Perang Dunia Pertama.
nilaikan • Membuat pertimbangan berdasarkan kriteria dan piawaian; menentukan kepentingan, nilai, kualiti
atau kaitan; berikan perkara yang baik dan yang buruk; mengenal pasti dan menghuraikan
kelebihan dan batasan. • Contoh: Nilaikan sumbangan cip mikro dalam telekomunikasi.
Menjana • Memperkenalkan hipotesis alternatif, contoh, penyelesaian dan cadangan

berdasarkan kriteria.
• Contoh: Hasilkan hipotesis untuk menjelaskan fenomena yang diperhatikan.
Kenal pasti • Mengiktiraf sebagai orang atau benda tertentu. • Contoh: Mengenal
pasti ciri iklim Mediterranean.
Gambarkan • Gunakan gambar perkataan, rajah, carta atau contoh konkrit untuk menjelaskan
satu titik.
• Contoh: Menggambarkan penggunaan lastik dalam peperangan amfibia Alexander.
Buat kesimpulan
• Membuat kesimpulan yang logik daripada maklumat yang dikemukakan. • Contoh:
Apakah yang anda boleh simpulkan daripada keputusan eksperimen?
Mentafsir • Berikan maksud; perubahan daripada satu bentuk perwakilan (seperti

sebagai berangka) kepada yang lain (seperti lisan).
• Contoh: Tafsirkan baris puitis, „Bunyi sarang labah-labah

menyentap adalah kebisingan hidup saya.‰
Mewajarkan • Tunjukkan alasan yang baik untuk; berikan bukti anda; kemukakan fakta untuk menyokong
pendirian anda.
• Contoh: Mewajarkan kemasukan Amerika ke dalam Perang Dunia II.
Senaraikan • Buat satu siri nama atau item lain.
• Contoh: Senaraikan fungsi utama jantung manusia.

Menjangkakan
• Tahu atau beritahu terlebih dahulu dengan ketepatan pengiraan, pengetahuan atau
inferens yang bijak daripada fakta atau pengalaman tentang apa yang akan berlaku.
• Contoh: Ramalkan hasil tindak balas kimia.
cadang • Tawaran untuk pertimbangan, penerimaan, atau tindakan; cadangkan.
• Contoh: Cadangkan penyelesaian bagi kejadian tanah runtuh di sepanjang Lebuhraya

Utara-Selatan.
Mengenali • Cari pengetahuan dalam ingatan jangka panjang yang konsisten dengan bahan yang
dibentangkan. • Contoh: Menyedari peristiwa penting yang berlaku dalam perjalanan
menuju kemerdekaan di Malaysia.
Ingat kembali
• Mendapat semula pengetahuan yang berkaitan daripada ingatan
jangka panjang. • Contoh: Mengimbas kembali tarikh peristiwa penting dalam sejarah Islam.
Merumuskan • Merumuskan; berikan perkara utama secara ringkas.
• Contoh: Ringkaskan cara manusia mengawet makanan.
Jejak • Ikuti kursus; ikut jejak; memberi penerangan tentang kemajuan. • Contoh: Mengesan
perkembangan televisyen dalam menyediakan pengajaran sekolah.
AKTIVITI 5.4
1. Pilih beberapa soalan esei dalam bidang subjek anda dan periksa
sama ada kata kerja yang digunakan adalah serupa dengan senarai dalam Jadual 5.1. Adakah awak
fikirkan tugasan yang diperlukan oleh kata kerja yang digunakan adalah sesuai?
2. Adakah anda fikir pelajar dapat membezakan antara tugasan

diperlukan dalam kata kerja yang disenaraikan?
3. Adakah guru dapat menerangkan kepada pelajar tugas-tugas yang diperlukan oleh ini
kata kerja?
Wajarkan semua jawapan anda kepada rakan kursus anda dalam forum dalam talian myINSPIRE.

SEMAK KENDIRI 5.4
1. Pilih beberapa soalan esei dalam bidang subjek anda dan periksa
sama ada kata kerja yang digunakan adalah serupa dengan senarai dalam Jadual 5.1. Adakah awak
fikirkan tugasan yang diperlukan oleh kata kerja yang digunakan adalah sesuai?
2. Adakah anda fikir pelajar dapat membezakan antara tugasan

diperlukan dalam kata kerja yang disenaraikan?
3. Adakah guru dapat menerangkan kepada pelajar tugas-tugas yang diperlukan oleh ini
kata kerja?
Berikut menunjukkan senarai semak untuk menulis soalan esei.
Senarai Semak untuk Menulis Soalan Esei
Bolehkah item itu dinilai dengan lebih baik dengan jenis penilaian yang berbeza?
Adakah soalan esei sejajar dengan hasil pembelajaran yang dihasratkan?
Adakah panjang soalan esei itu sesuai atau perlu dipecahkan kepada soalan esei pendek?
Adakah soalan esei mengandungi tugasan yang jelas dan skop yang ditetapkan?
Adakah soalan itu tersusun dan tersusun dengan jelas?
Adakah pelajar tahu masa yang disyorkan untuk setiap soalan?
Adakah anda telah menulis jawapan model atau rangka jawapan?
Adakah anda mempunyai seseorang yang berpengetahuan dalam subjek untuk menyemak
soalan?

5.9 PEMARKAHAN SOALAN ESEI

Penandaan atau penggredan esei adalah aktiviti yang terkenal tidak boleh dipercayai. Jika kita
membaca esei pada dua masa yang berasingan, kemungkinan besar kita akan memberikan esei
gred yang berbeza setiap kali. Jika dua atau lebih guru membaca esei, gred mungkin berbeza,
selalunya begitu mendadak. Kita semua suka berfikir bahawa kita adalah pengecualian tetapi kajian
demi kajian terhadap guru yang berniat baik dan teliti menunjukkan bahawa penggredan esei tidak
boleh dipercayai (Ebel, 1972; Hills, 1976; McKeachie, 1986; White, 1985). Menghapuskan masalah
itu tidak mungkin tetapi kami boleh mengambil langkah untuk meningkatkan kebolehpercayaan
penggredan. Menggunakan panduan pemarkahan atau skema pemarkahan membantu mengawal
peralihan piawaian yang tidak dapat dielakkan berlaku semasa kita membaca koleksi esei dan kertas kerja.
Dua bentuk panduan pemarkahan yang paling biasa digunakan ialah kaedah analitik dan holistik.
(a) Kaedah Analitik

Pemarkahan analitik ialah sistem yang paling kerap digunakan dalam peperiksaan awam
berskala besar (seperti SPM dan STPM) serta oleh guru di dalam bilik darjah. Ciri asasnya
ialah skema pemarkahan dan markah yang diperuntukkan (seperti yang ditunjukkan dalam
Rajah 5.2). Skema pemarkahan terdiri daripada senarai elemen utama yang guru percaya
pelajar harus memasukkan dalam jawapan yang ideal. Dalam contoh, markah diperuntukkan
untuk menerangkan setiap lima faktor (tiga markah untuk setiap faktor) dan satu markah
diberikan untuk memberikan contoh yang berkaitan. Markah juga diperuntukkan untuk
„pendahuluan‰ dan „kesimpulan‰ yang merupakan elemen penting dalam sesebuah esei.

Contohnya:
Jelaskan lima faktor yang menentukan lokasi sesebuah kilang pembuatan.
Skim penandaan (maksimum 25 mata)
1. Pengenalan mata
• Menetapkan organisasi esei 2
2. Tapak atau tanah
• Penerangan (bagaimana tapak mempengaruhi 3
lokasi) • Contoh 1
3. Buruh
• Penerangan (peranan pekerja) • 3
Contoh 1
4. Modal (pinjaman daripada bank)

• Penerangan (mendapat pinjaman) • 3
Contoh 1
5. Sistem pengangkutan
• Penerangan (akses ke pelabuhan, penduduk) • 3
Contoh 1
6. Kemahiran keusahawanan
• Penerangan (jenis kemahiran) • 3
Contoh 1
7. Kesimpulan (interaksi lima faktor) 3
JUMLAH 25
Rajah 5.2: Contoh skema pemarkahan menggunakan kaedah analisis
Penanda membaca dan membandingkan jawapan pelajar dengan jawapan model.

Jika semua elemen yang diperlukan hadir, pelajar menerima bilangan mata
maksimum. Kredit separa diberikan berdasarkan elemen yang disertakan dalam
jawapan. Untuk mencapai markah keseluruhan peperiksaan, pengajar menambah
mata yang diperoleh pada soalan berasingan.

Kenal pasti terlebih dahulu apa yang akan bernilai mata dan berapa banyak mata yang tersedia untuk
setiap soalan. Pastikan pelajar menyedari perkara ini supaya mereka tidak memberi lebih (atau kurang)
daripada yang diperlukan dan mereka tahu dengan tepat apa yang anda cari. Jika pelajar menghasilkan
contoh yang tidak dijangka tetapi betul, berikan mereka mata dengan segera dan tambahkan titik itu
pada kunci jawapan anda supaya pelajar seterusnya juga akan mendapat mata.
(b) Kaedah Holistik (Pemarkahan Global atau Impresionistik)

Pendekatan holistik untuk menskor soalan esei melibatkan membaca keseluruhan respons dan
memberikannya kepada kategori yang dikenal pasti oleh skor atau gred. Kaedah ini melibatkan
mempertimbangkan jawapan pelajar secara keseluruhan dan menilai jumlah kualiti jawapan berbanding
dengan respons pelajar lain atau kualiti keseluruhan jawapan berdasarkan kriteria tertentu yang telah
anda bangunkan.
Fikirkan ia sebagai mengisih ke dalam tong sampah. Anda membaca jawapan kepada soalan tertentu
dan menyerahkannya ke tong sampah yang sesuai. Jawapan terbaik masuk ke tong „teladan‰, yang
baik masuk ke tong „baik‰ dan jawapan yang lemah masuk ke tong „miskin‰. Kemudian mata ditulis
pada setiap kertas yang sesuai dengan tong sampah itu. Ia berdasarkan kesan keseluruhan, bukan titik
demi titik menggunakan rubrik atau skema pemarkahan, tetapi berdasarkan pendekatan holistik (seperti
ditunjukkan dalam Jadual 5.2). Anda tidak boleh lebih halus daripada lima bahagian, paling banyak
enam bahagian.
Anda perlu membaca semula segala-galanya untuk memastikan bahawa semua kertas dalam lima
longgokan adalah lebih kurang sama. Dan semua yang berada di longgokan tengah adalah lebih kurang
sama dan kurang baik daripada yang di longgokan atas dan seterusnya.
Anda boleh membangunkan penerangan tentang jenis respons yang akan menggambarkan setiap
kategori sebelum anda memulakan dan mencuba versi draf ini menggunakan beberapa kertas sebenar.
Selepas membaca dan mengkategorikan semua kertas kerja, adalah idea yang baik untuk menyemak
semula kertas dalam kategori untuk melihat sama ada ia cukup serupa dalam kualiti untuk menerima
mata atau gred yang sama. Mungkin lebih cepat untuk membaca esei secara holistik dan hanya
memberikan markah atau gred keseluruhan tetapi pelajar tidak menerima banyak maklum balas tentang
kekuatan dan kelemahan mereka. Sesetengah pengajar yang menggunakan pemarkahan holistik juga
menulis ulasan ringkas pada setiap kertas untuk menunjukkan satu atau dua kekuatan dan/atau
kelemahan supaya pelajar akan mempunyai idea yang lebih baik tentang sebab respons mereka
menerima skor sedemikian.

Jadual 5.2: Contoh Skema Pemarkahan Menggunakan Kaedah Holistik
Tahap
Persembahan Umum Penaakulan, Hujah
Pencapaian
Teladan (10 • Menjawab soalan. • Menyatakan • Menunjukkan tepat dan

mata) yang berkaitan pemahaman soalan yang lengkap. •
Menggunakan beberapa hujah dan
hujah. •
Mengemukakan hujah mengikut

menyokong hujah dengan contoh dan
susunan yang logik. •
data yang menyokong kesimpulan.
Menggunakan gaya dan tatabahasa
yang boleh diterima (tiada kesilapan).
Baik • Gabungan di atas • Sama seperti di atas tetapi kurang teliti

(8 mata) sifat tetapi kurang diwakili walaupun masih tepat. • Menggunakan
secara konsisten (1ÿ2 ralat).
hanya satu hujah dan contoh yang
menyokong kesimpulan.
Mencukupi • Tidak menangani • Menunjukkan pemahaman

(6 mata) soalan secara eksplisit, walaupun yang minimum tentang soalan, masih
melakukannya secara tangensial. tepat.
• Nyatakan hujah yang agak • Menggunakan subset kecil idea yang

relevan. • Mengemukakan mungkin untuk menyokong hujah.
beberapa hujah dalam susunan

yang logik. • Menggunakan gaya
dan tatabahasa yang mencukupi

(lebih daripada 2 kesalahan).
miskin • Tidak menjawab soalan. • Tidak menunjukkan

(4 mata) pemahaman soalan, tidak tepat.
• Menyatakan tiada hujah
yang relevan. • Tidak memberikan bukti untuk
menyokong jawapan kepada soalan.
• Tidak tersusun dengan jelas atau
logik. • Gagal menggunakan
gaya dan tatabahasa yang boleh

diterima.
Tiada jawapan
(0 mata)

SEMAK KENDIRI 5.5
Bandingkan dan bezakan kaedah analisis dan kaedah holistik bagi

pemarkahan karangan.
AKTIVITI 5.5
Kaedah manakah yang diamalkan secara meluas di institusi anda? kenapa?
Kongsi jawapan anda dengan rakan kursus anda dalam forum dalam talian myINSPIRE.
Akhir sekali sebelum kita mengakhiri topik, mari kita lihat beberapa cadangan untuk menanda atau
menskor esei:
(a) Gred kertas secara tanpa nama. Ini akan membantu mengawal pengaruh kita
jangkaan mengenai pelajar yang dinilai.
(b) Baca dan skor jawapan untuk satu soalan sebelum pergi ke soalan seterusnya. Dalam erti kata
lain, skor semua jawapan pelajar kepada Soalan 1 sebelum melihat Soalan 2. Ini membantu
untuk mengekalkan satu kerangka rujukan dan satu set kriteria dalam fikiran sepanjang semua
kertas, yang juga akan menghasilkan penggredan yang lebih konsisten. Ia juga menghalang
tanggapan yang kita bentuk semasa membaca satu soalan daripada dibawa ke pembacaan
jawapan pelajar seterusnya. Jika pelajar tidak melakukan kerja yang baik pada soalan pertama,
sebagai contoh, kami mungkin membenarkan tanggapan ini mempengaruhi penilaian kami
terhadap jawapan kedua pelajar. Walau bagaimanapun, jika kertas pelajar lain datang di antara,
kita kurang berkemungkinan dipengaruhi oleh tanggapan asal.
(c) Jika boleh, cuba gred semua jawapan kepada satu soalan tertentu tanpa gangguan. Piawaian
kami mungkin berbeza dari pagi ke malam atau dari satu hari ke hari berikutnya.
(d) Kocok kertas selepas setiap item dijaringkan dalam semua kertas.
Menukar susunan mengurangkan kesan konteks dan kemungkinan skor pelajar adalah hasil
daripada lokasi kertas berhubung dengan kertas lain. Contohnya, jika kerja „B‰ RakeshÊs
sentiasa diikuti oleh kerja „A‰ JamalÊs, maka ia mungkin kelihatan lebih seperti kerja „C‰ dan
grednya akan lebih rendah berbanding jika kertasnya berada di tempat lain dalam timbunan.

(e) Tentukan terlebih dahulu bagaimana anda akan mengendalikan faktor luar dan konsisten
dalam menggunakan peraturan. Pelajar harus dimaklumkan tentang cara anda menangani
perkara seperti perkataan yang salah eja, kekemasan, tulisan tangan, tatabahasa dan
seterusnya.
(f) Berwaspada terhadap gertakan. Sesetengah pelajar yang tidak mengetahui jawapannya
boleh menulis esei yang koheren tersusun dengan baik yang mungkin mengandungi
bahan yang tidak berkaitan dengan soalan. Tentukan cara untuk menangani maklumat
yang tidak relevan atau tidak tepat yang terkandung dalam jawapan pelajar. Kita tidak
sepatutnya memberi kredit untuk bahan yang tidak berkaitan. Ia tidak adil kepada pelajar
lain yang mungkin juga lebih suka menulis mengenai topik lain tetapi sebaliknya menulis
pada soalan yang diperlukan.
(g) Tulis ulasan tentang skrip ujian pelajar. Komen guru menjadikan ujian esei sebagai
pengalaman pembelajaran yang baik untuk pelajar. Ia juga berfungsi untuk menyegarkan
ingatan anda tentang penilaian anda sekiranya pelajar mempersoalkan gred yang
diterimanya.
(h) Berhati-hati dengan susunan kertas yang ditanda kerana ia boleh memberi kesan kepada
gred yang diberikan. Penanda mungkin menjadi lebih kritikal (atau lebih lembut) selepas
membaca beberapa kertas, oleh itu kertas awal menerima markah yang lebih rendah (atau
lebih tinggi) daripada kertas dengan kualiti serupa yang dijaringkan kemudian.
(i) Apabila pelajar diarahkan untuk mengambil pendirian dalam isu kontroversi, penanda mesti
berhati-hati untuk memastikan bahawa bukti dan cara ia dipersembahkan dinilai, BUKAN
kedudukan yang diambil oleh pelajar. Jika pelajar mengambil kedudukan yang bertentangan
dengan penanda, penanda mesti menyedari kecenderungannya sendiri dalam menandakan
karangan kerana kedudukan pelajar berbeza daripada penanda.
• Esei ialah item ujian yang memerlukan respons yang dikarang oleh pemeriksa biasanya dalam
bentuk satu atau lebih ayat yang tidak ada satu pun respons atau corak respons boleh
disenaraikan sebagai betul, dan ketepatan dan kualitinya boleh dinilai secara subjektif hanya
oleh orang yang mahir atau berpengetahuan dalam perkara itu.
• Terdapat dua jenis karangan berdasarkan fungsinya iaitu kerja kursus

esei dan esei peperiksaan.
• Soalan esei menyediakan cara yang berkesan untuk menilai pembelajaran yang kompleks
hasil.

• Soalan esei memberikan pengalaman autentik kerana membina respons

lebih dekat dengan kehidupan sebenar daripada memilih respons.
• Tidak mungkin dengan menggunakan beberapa soalan esei sahaja untuk menilai penguasaan
pelajar terhadap domain subjek yang lengkap.
• Soalan esei mempunyai dua elemen pembolehubah, iaitu sejauh mana tugasan distrukturkan dan
sejauh mana skop kandungan difokuskan.
• Sama ada item esei menilai pemikiran aras tinggi (HOT) bergantung pada reka bentuk soalan dan
cara jawapan pelajar dijaringkan.
• Menentukan anggaran had masa membantu pelajar memperuntukkan masa mereka dalam
menjawab beberapa soalan esei semasa ujian.
• Elakkan menggunakan soalan esei untuk hasil pembelajaran yang diharapkan yang boleh menjadi lebih baik
dinilai dengan jenis penilaian lain.
• Penandaan analitikal merupakan sistem yang paling kerap digunakan dalam peperiksaan awam
berskala besar dan juga oleh guru di dalam bilik darjah. Ciri asasnya ialah skema pemarkahan
dan markah yang diperuntukkan untuk elemen dalam jawapan.
• Pendekatan holistik untuk menskor soalan esei melibatkan membaca keseluruhan respons dan
memberikannya kepada kategori yang dikenal pasti oleh skor atau gred.
Kaedah analisis Kebolehpercayaan dalam penjaring
Hasil pembelajaran yang kompleks Skema penandaan
Tindak balas yang dibina Tugas mental
Soalan esei Jawapan model
Penggredan Rubrik
Kaedah holistik Tugas dan skop
Kebolehpercayaan antara penjaring Mengambil masa

Topik Sahih ÿ
Penilaian
6
HASIL PEMBELAJARAN
1. Tentukan penilaian autentik;
2. Bincangkan penilaian autentik di dalam bilik darjah;

3. Membezakan kelebihan dan kritikan penilaian autentik;
dan
4. Bandingkan penilaian autentik dan tradisional.
ÿ PENGENALAN
Ramai guru menggunakan alat penilaian tradisional seperti ujian aneka pilihan dan esei untuk
menilai pelajar mereka. Sejauh manakah ujian aneka pilihan atau ujian esei ini benar-benar
menilai pemahaman dan pencapaian pelajar? Alat penilaian tradisional ini memainkan peranan
dalam penilaian hasil pelajar. Namun begitu, penilaian tidak semestinya melibatkan ujian
kertas dan pensel. Ia juga boleh menjadi projek, pemerhatian atau tugas selagi ia dapat
menunjukkan pelajar telah mempelajari bahan tersebut. Adakah alat penilaian alternatif ini
lebih berkesan daripada yang tradisional?
Sesetengah guru bilik darjah menggunakan strategi ujian yang tidak menumpukan sepenuhnya
kepada mengingat fakta. Sebaliknya, mereka meminta pelajar untuk menunjukkan kemahiran
dan konsep yang telah mereka pelajari. Guru mungkin ingin meminta pelajar menggunakan
kemahiran mereka pada tugasan dan projek tulen atau meminta pelajar menunjukkan
pengetahuan mereka dengan cara yang lebih sesuai untuk kehidupan di luar bilik darjah. Pelajar mesti

TOPIK 6 PENTAKSIRAN SAHIH ÿ 111
kemudian dilatih untuk melaksanakan tugas bermakna yang meniru cabaran dunia sebenar.
Dalam erti kata lain, guru-guru ini cuba menilai kebolehan pelajar dalam konteks „dunia sebenar‰.
Untuk melakukan ini, pelajar diminta untuk melaksanakan tugas seperti menerangkan peristiwa
sejarah atau menyelesaikan masalah matematik daripada memilih jawapan daripada senarai sedia.
Strategi meminta pelajar melaksanakan tugas dunia sebenar yang menunjukkan aplikasi bermakna
pengetahuan dan kemahiran penting dipanggil penilaian autentik. Penilaian autentik adalah untuk
meminta pelajar menunjukkan pengetahuan mereka dengan cara yang lebih sesuai untuk kehidupan
di luar bilik darjah.
6.1 APA ITU PENILAIAN SAH?

Menurut Wiggins (1998), guru menjadi paling berkesan apabila mereka mencari maklum balas
daripada pelajar dan rakan sebaya mereka dan menggunakan maklum balas itu untuk menyesuaikan
pendekatan untuk mereka bentuk dan pengajaran. Pembangunan kurikulum yang berkesan
mencerminkan proses reka bentuk tiga peringkat yang dipanggil reka bentuk mundur yang
melambatkan perancangan aktiviti bilik darjah sehingga matlamat telah dijelaskan dan penilaian
direka bentuk. Proses ini membantu mengelakkan masalah liputan buku teks dan pengajaran
berorientasikan aktiviti yang tidak jelas keutamaan dan tujuannya.
Peningkatan prestasi pelajar dan sekolah dicapai melalui semakan keputusan yang kerap diikuti
dengan pelarasan yang disasarkan kepada kurikulum dan pengajaran.
Penilaian autentik, berbeza dengan penilaian yang lebih tradisional, menggalakkan penyepaduan
pengajaran, pembelajaran dan penilaian. Dalam model pentaksiran tradisional, pengajaran dan
pembelajaran sering dipisahkan daripada pentaksiran di mana ujian ditadbirkan selepas pengetahuan
atau kemahiran diperoleh.
Penilaian autentik biasanya merangkumi tugasan untuk pelajar lakukan dan rubrik yang mana
prestasi tugasan mereka akan dinilai. Oleh itu, melaksanakan eksperimen sains, menulis cerita dan
laporan, menyelesaikan masalah matematik yang mempunyai aplikasi dunia sebenar boleh
dianggap sebagai penilaian yang sahih.
Data pencapaian berguna boleh diperoleh melalui penilaian autentik.
Guru boleh mengajar pelajar bagaimana untuk melakukan matematik, membuat sejarah dan
melakukan sains, bukan hanya mengetahui mereka. Seterusnya, untuk menilai apa yang telah
dipelajari oleh pelajar, guru boleh meminta pelajar melaksanakan tugasan yang meniru cabaran
yang dihadapi dengan menggunakan prinsip matematik, menjalankan penyiasatan sejarah atau saintifik.

112 ÿ TOPIK 6 PENTAKSIRAN SAHIH
Pentaksiran bilik darjah tradisional yang direka dengan baik seperti ujian dan kuiz boleh
menentukan dengan berkesan sama ada pelajar telah memperoleh pengetahuan atau tidak.
Sebaliknya, penilaian autentik memerlukan pelajar untuk menunjukkan pemahaman dengan
melaksanakan tugas yang lebih kompleks biasanya mewakili aplikasi yang lebih bermakna.
Tugasan ini memerlukan pelajar menganalisis, mensintesis dan menggunakan apa yang
telah mereka pelajari dengan cara yang besar dan pelajar mencipta makna baharu dalam
proses itu juga. Ringkasnya, penilaian autentik membantu menjawab soalan „Sejauh
manakah anda boleh menggunakan apa yang anda tahu?‰ manakala ujian tradisional
membantu menjawab soalan „Adakah anda tahu?‰
Penilaian bilik darjah biasa atau tradisional seperti ujian aneka pilihan dan ujian jawapan
pendek adalah sama pentingnya dengan penilaian autentik. Penilaian autentik melengkapi
penilaian tradisional. Pentaksiran autentik telah mendapat penerimaan dalam kalangan guru
awal kanak-kanak dan sekolah rendah di mana penilaian tradisional mungkin tidak sesuai.
Contoh strategi penilaian autentik (Brady, 2012) termasuk:
(a) Mempamerkan kemahiran olahraga;
(b) Membina muzikal pendek, tarian atau drama;
(c) Menerbitkan risalah kelas;
(d) Seni kreatif: lakonan, persembahan lisan, persembahan;
(e) Perancangan: peta minda atau konsep, carta alir;
(f) Alat ICT: halaman web, video, foto, gambaran bingkai beku;
(g) Mencipta: membina model, penulisan kreatif;
(h) Menilai: maklum balas guru-pembelajar, maklum balas rakan sebaya, pengajaran rakan sebaya; dan
(i) Tugas tidak berstruktur: tugas menyelesaikan masalah, soalan terbuka, formal
dan pemerhatian tidak formal.
6.1.1 Jenis-jenis Pentaksiran Tulen

Penilaian autentik kadangkala dirujuk sebagai penilaian prestasi, penilaian alternatif atau
penilaian langsung.
(a) Penilaian Prestasi

Penilaian autentik kadangkala dipanggil penilaian prestasi atau penilaian berasaskan
prestasi kerana pelajar diminta untuk melaksanakan tugasan yang bermakna. Penilaian
prestasi adalah „suatu ujian di mana pengambil ujian sebenarnya menunjukkan
kemahiran yang ingin diukur oleh ujian dengan melakukan sebenar

tugas dunia yang memerlukan kemahiran tersebut, bukannya dengan menjawab soalan
yang bertanyakan bagaimana untuk melakukannya‰ (Ark, 2013). Pembelajaran
berasaskan projek (PBL) dan tugasan portfolio adalah contoh penilaian prestasi. Dengan
penilaian prestasi, guru memerhati pelajar semasa mereka membuat persembahan di
dalam bilik darjah dan menilai tahap kecekapan yang ditunjukkan.
Tugasan tulen berakar umbi dalam kurikulum dan guru boleh membangunkan tugasan
berdasarkan perkara yang telah berfungsi untuk mereka. Melalui proses ini, lebih banyak
tugasan berasaskan bukti seperti portfolio menjadi lebih sahih dan lebih bermakna kepada
pelajar.
(b) Penilaian Alternatif

Penilaian autentik adalah alternatif kepada penilaian tradisional, oleh itu istilah yang
digunakan. Pelajar mengambil bahagian secara aktif dalam menilai diri sendiri dan satu
sama lain melalui penggunaan senarai semak dan rubrik dalam penilaian kendiri dan rakan sebaya.
Penilaian alternatif mengukur prestasi dengan cara selain daripada ujian kertas dan pensel
atau jawapan pendek tradisional. Sebagai contoh, guru sains Lembah Klang mungkin
meminta pelajar mengenal pasti bahan pencemar yang berbeza di Sungai Klang dan
melaporkan maklumat yang dikumpul dan dianalisis kepada majlis alam sekitar tempatan.
(c) Penilaian Langsung

Penilaian autentik memberikan lebih banyak bukti langsung tentang aplikasi pengetahuan
dan kemahiran yang bermakna. Jika pelajar berjaya dalam ujian aneka pilihan, kita
mungkin membuat kesimpulan secara tidak langsung bahawa pelajar boleh menggunakan
pengetahuan tersebut dalam konteks dunia sebenar. Walau bagaimanapun, kami akan
lebih selesa membuat inferens daripada demonstrasi langsung aplikasi seperti dalam
contoh pencemar sungai yang dinyatakan sebelum ini. Kami tidak hanya mahu pelajar
mengetahui kandungan disiplin apabila mereka meninggalkan sekolah. Kami mahu mereka
menggunakan pengetahuan dan kemahiran lain yang telah mereka pelajari juga. Bukti
langsung pembelajaran pelajar adalah nyata, boleh dilihat dan boleh diukur. Ia adalah bukti
yang lebih menarik untuk mengetahui dengan tepat apa yang pelajar telah atau belum
pelajari. Guru boleh melihat secara langsung kerja atau persembahan pelajar untuk
menentukan perkara yang telah mereka pelajari.
6.1.2 Ciri-ciri Pentaksiran Tulen

Reeves et al. (2002) banyak yang ingin diperkatakan tentang ciri-ciri pembelajaran autentik.
Senarai sepuluh ciri mereka meringkaskan ciri penilaian autentik seperti yang dijelaskan dalam
perkara berikut:
(a) Aktiviti tulen mempunyai perkaitan dunia sebenar: Penilaian bertujuan untuk memberi tumpuan
kepada kesan kerja seseorang dalam konteks sebenar atau realistik.

(b) Aktiviti tulen memerlukan pelajar untuk mentakrifkan tugasan dan sub-tugas yang
diperlukan untuk menyelesaikan aktiviti: Masalah yang wujud dalam aktiviti terbuka
kepada pelbagai tafsiran dan bukannya diselesaikan dengan mudah dengan
menggunakan algoritma sedia ada.
(c) Aktiviti tulen terdiri daripada tugas yang kompleks untuk disiasat oleh pelajar dalam
tempoh masa yang berterusan: Aktiviti diselesaikan dalam hari, minggu dan bulan
berbanding minit atau jam. Mereka memerlukan pelaburan masa dan sumber intelek
yang besar.
(d) Aktiviti autentik memberi peluang kepada pelajar untuk memeriksa tugasan dari perspektif
yang berbeza, menggunakan pelbagai sumber: Penggunaan pelbagai sumber dan
bukannya bilangan rujukan yang telah dipilih yang terhad memerlukan pelajar untuk
mengesan relevan daripada maklumat yang tidak relevan.
(e) Aktiviti tulen memberi peluang untuk bekerjasama: Kerjasama adalah penting kepada
tugas, baik dalam kursus dan dunia sebenar, dan bukannya boleh dicapai oleh pelajar
individu.
(f) Aktiviti autentik memberi peluang untuk membuat refleksi: Aktiviti perlu membolehkan
pelajar membuat pilihan dan merenung pembelajaran mereka, baik secara individu
mahupun sosial.
(g) Aktiviti tulen boleh disepadukan dan diaplikasikan merentasi bidang mata pelajaran yang
berbeza dan mendahului hasil khusus domain: Aktiviti menggalakkan perspektif antara
disiplin dan membolehkan pelajar memainkan peranan yang pelbagai, dengan itu
membina kepakaran yang mantap dan bukannya pengetahuan terhad kepada satu
bidang atau domain yang jelas. .
(h) Aktiviti tulen disepadukan dengan lancar dengan penilaian: Penilaian aktiviti disepadukan
dengan lancar dengan tugas utama dalam cara yang mencerminkan penilaian dunia
sebenar dan bukannya penilaian buatan berasingan yang dialih keluar daripada sifat
tugasan.
(i) Aktiviti tulen mencipta produk yang digilap berharga dengan hak mereka sendiri dan
bukannya sebagai persediaan untuk sesuatu yang lain.
(j) Aktiviti tulen membolehkan penyelesaian bersaing dan kepelbagaian hasil: Aktiviti
membenarkan julat dan kepelbagaian hasil terbuka kepada pelbagai penyelesaian
yang bersifat asal dan bukannya satu tindak balas betul yang diperoleh melalui
penggunaan peraturan dan prosedur.

SEMAK KENDIRI 6.1
Apakah nama lain yang digunakan untuk merujuk kepada penilaian autentik? kenapa?
AKTIVITI 6.1
Sejauh manakah penilaian autentik telah digunakan sebagai penilaian

strategi di sekolah Malaysia?
forum.
6.2 BAGAIMANA UNTUK MENCIPTA

PENILAIAN SAHIH?
Penilaian autentik mungkin kelihatan menggembirakan pada mulanya tetapi ia tidak semestinya berlaku.
Sebagai permulaan, ambil langkah kecil seperti mengumpul data satu hari seminggu, menganalisisnya
dan menggunakan hasilnya untuk mengumpulkan pelajar pada minggu berikutnya. Ikuti langkah berguna
ini untuk membuat penilaian sahih anda sendiri:
(a) Kenal pasti standard yang anda mahu pelajar capai melalui penilaian ini. Piawaian, seperti matlamat,
adalah pernyataan tentang perkara yang perlu diketahui dan boleh dicapai oleh pelajar. Piawaian
mesti boleh diperhatikan dan boleh diukur.
Guru boleh memerhati sesuatu persembahan tetapi tidak memahami. Oleh itu pernyataan seperti
„Pelajar akan memahami cara menambah nombor dua digit‰ tidak boleh diperhatikan manakala
pernyataan seperti „Pelajar akan menambah nombor dua digit dengan betul‰ boleh diperhatikan
dan boleh diukur.
(b) Pilih tugasan yang relevan untuk standard atau set standard supaya pelajar dapat menunjukkan
bagaimana mereka telah atau tidak memenuhi standard tersebut. Dalam langkah ini, guru
mungkin ingin mencari cara di mana pelajar boleh menunjukkan bagaimana mereka mampu
memenuhi standard sepenuhnya. Untuk standard seperti „Fahami cara menambah nombor dua
digit‰, tugasnya mungkin meminta pelajar menerangkan situasi, cerita atau masalah dalam
kehidupan sebenar. Guru boleh mendapatkan strategi daripada pelajar, meminta mereka untuk
menunjukkan dan menerangkan alasan mereka kepada rakan sekelas mereka. Itu mungkin
dalam bentuk persembahan multimedia yang dibangunkan oleh pelajar (secara individu atau
secara kolaboratif), menggunakan Sepuluh Bingkai dengan beberapa kaunter.

(c) Tentukan ciri-ciri prestasi yang baik untuk tugas. Ini akan memberikan maklumat berguna
mengenai sejauh mana pelajar telah memenuhi piawaian.
Untuk langkah ini, guru mengenal pasti kriteria untuk melaksanakan tugasan ini dengan baik.
Mereka mungkin menulis beberapa ciri untuk menyelesaikan tugas dengan jayanya.
(d) Cipta satu rubrik atau set garis panduan untuk diikuti oleh pelajar supaya mereka dapat menilai
kerja mereka semasa mereka melaksanakan tugasan yang diberikan.
SEMAK KENDIRI 6.2
Bagaimanakah guru menggunakan penilaian autentik di dalam bilik darjah?
AKTIVITI 6.2
Berikan contoh tugasan tulen untuk bidang subjek anda.
forum.
6.2.1 Kelebihan Pentaksiran Tulen

Menurut Wiggins (1998), walaupun ujian aneka pilihan yang diseragamkan boleh menjadi penunjuk
yang sah bagi prestasi akademik, mereka sering mengelirukan pelajar untuk mempercayai bahawa
pembelajaran adalah menjejalkan dan mengelirukan guru untuk mempercayai bahawa ujian adalah
selepas fakta, direka dan tidak relevan. Langkah ke arah tugas dan hasil yang lebih tulen
meningkatkan pengajaran dan pembelajaran. Lebih ramai pendidik menggemari penggunaan
pentaksiran yang lebih tulen sebagai kaedah mengukur hasil pembelajaran yang tidak mudah diukur
dengan ujian piawai.
Penilaian autentik membantu pelajar melihat diri mereka sebagai peserta aktif yang menjalankan
tugas yang berkaitan dan bukannya penerima pasif fakta yang tidak jelas. Ia membantu guru dengan
menggalakkan mereka untuk merenung tentang kaitan apa yang mereka ajar dan memberikan hasil
yang berguna untuk menambah baik pengajaran.
Penilaian autentik memberi tumpuan kepada proses pembelajaran, amalan pengajaran yang mantap
dan kemahiran berfikir aras tinggi serta kecekapan yang diperlukan untuk berjaya dalam dunia
sebenar. Akibatnya, mereka menawarkan kelebihan yang besar untuk pelajar yang telah terdedah
kepada mereka berbanding mereka yang tidak.

Penilaian autentik mempunyai banyak faedah, faedah utama ialah ia memastikan kejayaan
pelajar. Penilaian autentik memberi tumpuan kepada kemajuan dan bukannya mengenal
pasti kelemahan.
Faedah penting lain penilaian autentik termasuk:
(a) Ia mempunyai kelebihan untuk menyediakan ibu bapa dan ahli komuniti produk yang
boleh diperhatikan secara langsung dan bukti yang boleh difahami mengenai prestasi
pelajar mereka. Kualiti kerja pelajar lebih dapat dilihat oleh orang awam berbanding
dengan pergantungan pada angka statistik abstrak;
(b) Menggunakan tugasan yang mencerminkan aktiviti bilik darjah biasa atau pembelajaran kehidupan
sebenar. Tugas-tugas tersebut adalah cara untuk menambah baik pengajaran, membolehkan guru
merancang kurikulum yang komprehensif dan berorientasikan perkembangan berdasarkan
pengetahuan mereka tentang setiap kanak-kanak;
(c) Memberi tumpuan kepada kemahiran berfikir aras tinggi seperti mengaplikasi,
menganalisis, menilai dan mencipta dalam taksonomi Bloom;
(d) Membenamkan penilaian dalam konteks bilik darjah;
(e) Memerlukan prestasi aktif untuk menunjukkan pemahaman. Pelajar kinestetik lebih suka
terlibat dalam aktiviti. Mereka perlu mengaplikasi maklumat dan menjadikannya
sendiri dengan membina sesuatu atau mempraktikkan teknik atau kemahiran;
(f) Menggalakkan pelbagai strategi penilaian; dan
(g) Melibatkan guru dan pelajar secara kolaboratif dalam menentukan

penilaian.
6.2.2 Kritikan Terhadap Pentaksiran Tulen
Penilaian autentik menyediakan penyelesaian tetapi ia juga menimbulkan masalah. Kritikan

terhadap pentaksiran autentik secara amnya melibatkan pembangunan pentaksiran yang
tidak formal dan kesukaran dalam memastikan kesahan dan kebolehpercayaan ujian
memandangkan sifat subjektif rubrik pemarkahan manusia berbanding dengan komputer
yang menskor item ujian aneka pilihan. Ramai guru mengelak daripada penilaian autentik
kerana metodologi ini memerlukan masa yang intensif untuk mengurus, menilai, memantau
dan menyelaras. Guru sukar untuk menyediakan skema pemarkahan yang konsisten.
Kaedah penggredan subjektif boleh membawa kepada berat sebelah. Guru juga mendapati
kaedah ini tidak praktikal untuk kumpulan besar pelajar.

Rubrik adalah komponen penting dalam penilaian autentik. Ia adalah alat yang hebat untuk memastikan
penilaian yang lebih tulen terhadap kerja pelajar. Walau bagaimanapun, membuat rubrik memakan
masa pada peringkat awal tetapi bernilai pelaburan.
Kohn (2006) memerhatikan bahawa rubrik yang digunakan untuk menyeragamkan cara kita berfikir
tentang tugasan pelajar mempunyai banyak kesalahan. Pelajar yang mungkin sudah terbiasa dengan
rubrik di bilik darjah lain kini kelihatan tidak dapat berfungsi melainkan
setiap item yang diperlukan dinyatakan untuk mereka. Walau bagaimanapun, ini tidak bermakna rubrik
tersebut rosak. Selagi rubrik hanyalah salah satu daripada beberapa sumber dan tidak mendorong
arahan, ia boleh dibayangkan memainkan peranan yang membina.
Berdasarkan nilai penilaian autentik kepada hasil pelajar, kelebihan penilaian autentik mengatasi
kebimbangan ini. Sebagai contoh, sebaik sahaja garis panduan penilaian dan rubrik penggredan
dibuat, ia boleh disimpan dalam fail dan digunakan tahun demi tahun.
Tiada perkara baharu tentang metodologi penilaian autentik ini. Ia bukanlah sejenis ciptaan radikal
yang baru-baru ini direka oleh penentang ujian tradisional untuk mencabar industri ujian. Sebaliknya
ia adalah kaedah yang terbukti untuk menilai ciri-ciri manusia dan telah digunakan selama beberapa
dekad (Linquist, 1951).
SEMAK KENDIRI 6.3
1. Apakah beberapa kritikan terhadap penilaian autentik?
2. Apakah faedah penilaian autentik?
6.3 PERBEZAAN ANTARA TRADISIONAL

PENILAIAN DAN SAHIH
PENILAIAN
Penilaian adalah sahih apabila kita mengkaji secara langsung prestasi pelajar mengenai tugas
intelektual yang layak. Penilaian tradisional, sebaliknya, bergantung pada „item‰‰ tidak langsung
atau proksi (yang cekap, pengganti ringkas) yang mana kami fikir kesimpulan yang sah boleh dibuat
tentang prestasi pelajar pada cabaran yang dihargai tersebut (Wiggins, 1990).

Jadual 6.1 meringkaskan perbezaan utama antara yang tulen dan tradisional
penilaian.
Jadual 6.1: Perbezaan Utama antara Pentaksiran Tulen dan Tradisional
Atribut Penilaian Tulen Penilaian Tradisional
Penaakulan dan • Sekolah mesti membantu pelajar • Sekolah mesti mengajar

amalan menjadi mahir dalam ilmu dan kemahiran ini.
melaksanakan tugas yang akan
mereka hadapi apabila mereka • Untuk menentukan sama ada
meninggalkan sekolah.
pengajaran berjaya, sekolah mesti
• Untuk menentukan sama ada menguji pelajar untuk melihat
pengajaran berjaya, sekolah sama ada mereka telah memperoleh
kemudiannya mesti meminta pengetahuan dan kemahiran.
pelajar melaksanakan tugas
bermakna yang meniru cabaran
dunia sebenar untuk melihat sama
ada pelajar mampu melakukannya.
Penilaian dan • Pentaksiran memacu • Kurikulum memacu

kurikulum kurikulum. Maksudnya, penilaian. Badan ilmu
guru terlebih dahulu menentukan ditentukan terlebih dahulu.
tugasan yang akan dilakukan Ilmu itu menjadi kurikulum
oleh pelajar untuk menunjukkan yang ingin disampaikan.
penguasaan mereka, dan
kemudian satu kurikulum • Selepas itu, penilaian
dibangunkan yang akan
dibangunkan dan ditadbir
membolehkan pelajar untuk menentukan sama ada
melaksanakan tugas tersebut
pemerolehan kurikulum telah
dengan baik, yang termasuk berlaku.
pemerolehan pengetahuan dan kemahiran penting. ini
telah dirujuk sebagai
perancangan ke belakang.
Memilih • Pelajar dikehendaki • Pelajar biasanya diberi beberapa

respons menunjukkan pemahaman pilihan dan diminta memilih
untuk melaksanakan tugas dengan melaksanakan tugas jawapan yang betul.
yang lebih kompleks biasanya
mewakili aplikasi yang lebih
bermakna.

Dicipta untuk • Pelajar diminta untuk • Ujian menawarkan cara yang direka-
kehidupan sebenar
menunjukkan kecekapan dengan reka (Contoh: pilih satu daripada
melakukan sesuatu. empat pilihan dalam MCQ) penilaian
untuk meningkatkan bilangan kali
anda boleh diminta untuk
menunjukkan kecekapan dalam
tempoh masa yang singkat.
Mengingat • Penilaian autentik memerlukan • Ujian tradisional cenderung untuk

atau mengiktiraf pelajar menjadi pelaksana mendedahkan hanya sama
pengetahuan yang berkesan bagi pengetahuan ada pelajar boleh mengenali dan
kepada pembinaan atau yang diperoleh. mengingati apa yang dipelajari di
aplikasi ilmu luar konteks. Pelajar sering
• Guru menggunakan ini
diminta mengingat atau mengenal
metodologi sering meminta
pelajar menganalisis, fakta.
mensintesis dan menggunakan

apa yang telah mereka pelajari
dengan cara yang besar dan
pelajar mencipta makna baharu
dalam proses itu juga.
Berstruktur guru kepada • Penilaian autentik • Apa yang seseorang pelajar boleh dan akan
berstruktur pelajar membenarkan lebih banyak demonstrasi telah disusun
pilihan dan pembinaan pelajar dengan teliti oleh orang yang
dalam menentukan apa yang membangunkan ujian.
dikemukakan sebagai bukti
kecekapan. • Perhatian pelajar akan
• Walaupun pelajar tidak boleh memilih boleh difahami tertumpu pada,
topik atau format mereka sendiri, dan terhad kepada, apa yang ada
biasanya terdapat pelbagai laluan dalam ujian.
yang boleh diterima ke arah
membina produk atau prestasi.

Bukti tidak langsung • Tawaran penilaian tulen • Bukti adalah tidak langsung
kepada bukti langsung lebih banyak bukti langsung terutamanya untuk tuntutan aplikasi
aplikasi dan pembinaan yang bermakna dalam situasi dunia
pengetahuan. • Contoh: Meminta sebenar yang kompleks.
pelajar menulis kritikan harus memberikan

lebih banyak bukti langsung tentang Contoh: Dalam MCQ , pelajar secara
kemahiran itu daripada bertanya pelajar berkesan tidak boleh mengkritik
satu siri soalan aneka pilihan dan
hujah yang dikemukakan oleh
analitikal tentang petikan. orang lain (kemahiran penting yang
sering diperlukan dalam dunia
nyata).
Kebolehpercayaan • Penilaian autentik mencapai • Ujian tradisional

dan kesahan kesahan dan menyeragamkan item objektif dan,
kebolehpercayaan dengan oleh itu, jawapan yang betul untuk
menekankan dan menyeragamkan setiap masalah.
kriteria yang sesuai untuk • Kesahan pada kebanyakan ujian
pemarkahan produk tersebut. aneka pilihan ditentukan hanya
• Kesahan ujian harus dengan memadankan item
bergantung sebahagiannya dengan kandungan kurikulum.
sama ada ujian itu menyerupai ujian
keupayaan dunia sebenar.
Sumber: Diadaptasi daripada Authentic Assessment Toolbox oleh Jon Mueller di http://
jfmueller.faculty.noctrl.edu/toolbox/
6.4 ALAT PENILAIAN

Alat penilaian yang biasa digunakan ialah rubrik, skala penilaian dan senarai semak. Rubrik,
senarai semak dan skala penarafan ialah alat penilaian autentik yang menyatakan kriteria
khusus dan membolehkan guru dan pelajar mengumpul maklumat dan membuat pertimbangan
tentang perkara yang pelajar tahu dan boleh lakukan berhubung dengan hasil.
Kualiti maklumat yang diperoleh melalui penggunaan senarai semak, skala penarafan dan
rubrik sangat bergantung kepada kualiti deskriptor yang dipilih untuk penilaian. Faedah
mereka juga bergantung kepada penglibatan langsung pelajar dalam penilaian dan
pemahaman tentang maklum balas yang diberikan.
Tujuan senarai semak, skala penilaian dan rubrik adalah untuk:
(a) Menyediakan alat untuk merekod pemerhatian yang sistematik;
(b) Menyediakan alat untuk penilaian kendiri;

(c) Menyediakan sampel kriteria untuk pelajar sebelum mengumpul dan menilai data tentang kerja
mereka merekodkan perkembangan kemahiran, strategi, sikap dan tingkah laku tertentu yang
diperlukan untuk menunjukkan pembelajaran; dan
(d) Menjelaskan keperluan pengajaran pelajar dengan membentangkan rekod pencapaian semasa.
6.4.1 Rubrik Pemarkahan

Penilaian sahih lazimnya adalah ukuran rujukan kriteria. Iaitu, penilaian yang direka untuk mengukur
prestasi pelajar terhadap satu set tetap kriteria yang telah ditetapkan. Kriteria atau standard
pembelajaran adalah ringkas, huraian bertulis tentang perkara yang pelajar dijangka tahu dan boleh
lakukan pada peringkat tertentu pembelajaran mereka. Untuk mengukur prestasi pelajar terhadap
set kriteria yang telah ditetapkan, rubrik atau skala pemarkahan yang mengandungi kriteria penting
untuk tugasan dan tahap prestasi yang sesuai untuk setiap kriteria dicipta. Rubrik biasanya digunakan
dalam pemarkahan atau penggredan tugasan bertulis atau pembentangan lisan.
Walau bagaimanapun, ia boleh digunakan untuk menjaringkan sebarang bentuk prestasi pelajar.
Rubrik pemarkahan telah menjadi kaedah biasa untuk menilai pelajar. Rubrik pemarkahan ialah
skema pemarkahan deskriptif yang dibangunkan oleh guru atau penilai lain untuk membimbing
analisis produk atau proses usaha pelajar (Brookhart, 1999). Sebagai alat pemarkahan, rubrik ialah
satu cara untuk menerangkan kriteria penilaian berdasarkan hasil yang diharapkan dan prestasi
pelajar. Setiap rubrik terdiri daripada satu set kriteria pemarkahan dan nilai mata yang dikaitkan
dengan kriteria ini.
Dalam kebanyakan rubrik kriteria dikelompokkan ke dalam kategori supaya guru dan pelajar boleh
mendiskriminasikan antara kategori mengikut tahap prestasi.
Rubrik telah diperkenalkan ke dalam bilik darjah hari ini untuk memberi pelajar pemahaman yang
lebih baik tentang perkara yang dinilai, kriteria gred yang berdasarkan serta piawaian produk yang
jelas dan menarik sedang ditangani.
Fokus rubrik dan panduan pemarkahan adalah untuk memantau dan menyesuaikan kemajuan dan
bukannya hanya menilai hasil akhir.
Sebagai panduan untuk perancangan, rubrik dan panduan pemarkahan memberi pelajar sasaran
kecekapan yang jelas. Dengan penilaian ini di tangan, mereka tahu rupa kualiti sebelum mereka
mula bekerja. Apabila pelajar menggunakan penilaian sedemikian secara kerap untuk menilai kerja
mereka sendiri, mereka mula menerima lebih banyak tanggungjawab untuk produk akhir.
Rubrik dan panduan pemarkahan menawarkan beberapa kelebihan untuk penilaian:

Prestasi LearnersÊ dipertingkatkan dengan menunjukkan dengan jelas cara kerja mereka dinilai dan apa
yang diharapkan;
(a) Pelajar menjadi hakim yang lebih baik terhadap kualiti kerja mereka sendiri;
(b) Pelajar mempunyai maklum balas yang lebih bermaklumat tentang kekuatan mereka dan bidang yang
memerlukan penambahbaikan;
(c) Pelajar menyedari tentang kriteria untuk digunakan dalam memberikan maklum balas rakan sebaya;
(d) Kriteria ditentukan dalam istilah khusus;
(e) Penilaian lebih objektif dan konsisten;
(f) Jumlah masa yang dihabiskan untuk menilai kerja pelajar dikurangkan;
(g) Keberkesanan pengajaran diperiksa menggunakan pelbagai kaedah; dan
(h) Kemajuan diukur dan didokumenkan terhadap penanda aras.
Rubrik berikut ditunjukkan dalam Jadual 6.2 merangkumi bahagian penyelidikan sesuatu projek.
Jadual 6.2: Contoh Rubrik Kajian
Kriteria 1 2 3 Wt. skor
Sebilangan 1ÿ4 5ÿ9 10ÿ12 x1

sumber
Bersejarah Banyak Tiada x3

ketepatan Sedikit ketidaktepatan.ketidaktepatan yang jelas.
ketidaktepatan sejarah.
Sumber Tidak dapat Boleh Boleh dengan x1

maklumat mengetahui memberitahu mudah
dari sumber dengan susah mengetahui
mana maklumat payah dari mana sumber mana
itu datang. maklumat itu datang. maklumat itu
diambil.
Bibliografi Bibliografi mengandungi Bibliografi Semua x1

maklumat yang mengandungi maklumat
sangat sedikit. kebanyakan berkaitan disertakan.
maklumat yang
berkaitan.
Jumlah
Sumber: Diadaptasi daripada Rubrik Penyelidikan

http://jfmueller.faculty.noctrl.edu/toolbox/rubrics.htm

Satu rubrik mengandungi dua komponen iaitu kriteria dan tahap prestasi. Setiap rubrik mempunyai
sekurang-kurangnya dua kriteria dan sekurang-kurangnya dua tahap prestasi. Kriteria, yang merupakan
ciri prestasi yang baik pada tugasan dalam contoh ini, disenaraikan di lajur sebelah kiri dalam rubrik
(bilangan sumber, ketepatan sejarah, sumber maklumat dan bibliografi).
Rubrik juga mengandungi mekanisme untuk memberikan markah kepada setiap projek. Dalam lajur
kedua terakhir, pemberat (Wt.) diberikan untuk setiap kriteria. Pelajar boleh menerima 1, 2 atau 3 mata
untuk bilangan kriteria sumber. Walau bagaimanapun, kriteria ketepatan sejarah yang dianggap lebih
penting pada pendapat guru, ditimbang tiga kali ganda (ÿ3) lebih berat. Ini bermakna, pelajar boleh
menerima 3, 6 atau 9 mata (iaitu 1 ÿ 3, 2 ÿ 3 atau 3 ÿ 3) untuk tahap ketepatan dalam projek mereka.
Dalam contoh, „banyak ketidaktepatan sejarah‰, „boleh memberitahu dengan susah payah dari mana
maklumat itu datang‰ dan „semua maklumat berkaitan disertakan‰ adalah deskriptor.
Deskriptor membantu guru menjadi lebih tepat dan dapat membezakan antara kerja pelajar secara
konsisten. Walau bagaimanapun, bukan mudah untuk menulis deskriptor yang baik untuk setiap tahap
dan setiap kriteria.
6.4.2 Skala Penilaian

Skala penilaian membolehkan guru menunjukkan tahap atau kekerapan tingkah laku, kemahiran dan
strategi yang ditunjukkan oleh pelajar. Skala penilaian menyatakan kriteria dan menyediakan tiga atau
empat pilihan respons untuk menerangkan kualiti atau kekerapan kerja pelajar.
Guru boleh menggunakan skala penilaian untuk merekod pemerhatian dan pelajar boleh
menggunakannya sebagai alat penilaian kendiri. Mengajar pelajar menggunakan perkataan deskriptif
seperti selalu, biasanya, kadangkala dan tidak pernah, membantu mereka menentukan kekuatan dan keperluan tertentu.
Skala penilaian juga menyediakan pelajar dengan maklumat untuk menetapkan matlamat dan
meningkatkan prestasi.
Skala penilaian menyenaraikan pernyataan prestasi dalam satu lajur dan julat pencapaian dalam
perkataan deskriptif, dengan atau tanpa nombor, dalam lajur lain.

Kata keterangan lebih penting daripada nombor yang sepadan. Lebih tepat dan deskriptif
perkataan untuk setiap titik skala, lebih dipercayai alat itu.
Skala penilaian yang berkesan menggunakan deskriptor dengan ukuran yang difahami dengan
jelas seperti kekerapan. Skala yang bergantung pada deskriptor subjektif untuk kualiti seperti
adil, baik atau cemerlang, adalah kurang berkesan kerana kata adjektif tunggal tidak mengandungi
maklumat yang mencukupi tentang kriteria yang ditunjukkan pada setiap titik pada skala ini.
Sebagai contoh, pernyataan prestasi yang menerangkan tingkah laku atau kualiti sebagai 1 =
lemah hingga 5 = cemerlang adalah lebih baik daripada 1 = terendah hingga 5 = tertinggi atau
hanya 1 hingga 5. Julat nombor hendaklah sama untuk semua baris dalam bahagian (seperti
semua daripada 1 hingga 5).
Julat nombor hendaklah sentiasa meningkat atau sentiasa berkurangan. Sebagai contoh, jika
nombor terakhir adalah pencapaian tertinggi dalam satu bahagian, nombor terakhir juga harus
menjadi pencapaian tertinggi dalam semua bahagian lain juga.
Rajah 6.1 ialah contoh skala penarafan yang digunakan untuk penilaian kemahiran interpersonal.
Rajah 6.1: Penilaian kemahiran interpersonal ÿ Skala

penilaian Sumber: http://www.northernc.on.ca/leid/docs/ja_developchecklists.pdf

6.4.3 Senarai semak
Senarai semak biasanya menawarkan format „ya‰ atau „tidak‰ berhubung dengan pelajar yang
menunjukkan kriteria tertentu. Senarai semak penilaian mengambil setiap objektif pencapaian dan
mengubahnya menjadi satu atau lebih penyataan „pembelajar boleh lakukan‰. Senarai semak
boleh digunakan untuk merekod pemerhatian individu, kumpulan atau keseluruhan kelas.
Berikut adalah beberapa ciri senarai semak. Senarai semak hendaklah:
(a) Mempunyai kriteria kejayaan berdasarkan hasil yang diharapkan;
(b) Cukup pendek untuk praktikal (contohnya, satu helaian kertas);
(c) Serlahkan tugas kritikal;
(d) Mempunyai mata tanda keluar yang menghalang pelajar daripada meneruskan tanpa kelulusan,
jika perlu;
(e) Ditulis dengan perkataan yang jelas dan terperinci untuk meminimumkan risiko
salah tafsir; dan
(f) Mempunyai ruang untuk memasukkan maklumat lain seperti nama pelajar,
tarikh, kursus, pemeriksa dan keputusan keseluruhan.
Jadual 6.4 menunjukkan contoh senarai semak.
Jadual 6.4: Contoh Senarai Semak
nama:
Tarikh:
Kelas
Pencapaian
barang Ya tidak Komen
Objektif
Berkomunikasi Boleh memahami nombor 1ÿ100

tentang nombor melalui mendengar
Boleh sebut nombor 1ÿ100
Boleh mengira 1ÿ100
Boleh menulis nombor 1ÿ100
Boleh memahami nombor 1ÿ100

apabila ditulis dalam perkataan
Boleh menulis nombor 1ÿ100 dalam

perkataan

SEMAK KENDIRI 6.4
1. Tentukan penilaian autentik.
2. Bandingkan penilaian autentik dan tradisional.
3. Apakah persamaan dan perbezaan antara rubrik, senarai semak dan skala penilaian?
AKTIVITI 6.3
1. Adakah penilaian tulen merupakan pengganti yang baik untuk tradisional

penilaian? Mewajarkan.
2. Berikan satu contoh penilaian autentik bagi subjek yang anda ada
mengajar.
• Strategi meminta pelajar melaksanakan tugas dunia sebenar yang menunjukkan aplikasi bermakna
pengetahuan dan kemahiran penting dipanggil autentik.
penilaian.
• Penilaian autentik kadangkala dipanggil penilaian prestasi, penilaian alternatif atau penilaian langsung.
Penilaian alternatif Dicipta untuk kehidupan sebenar
Reka bentuk ke belakang Bukti langsung
Senarai semak Penilaian langsung

Topik ÿ Projek dan

Portfolio
7 Penilaian
HASIL PEMBELAJARAN
1. Huraikan ciri-ciri kerja projek;
2. Menerangkan tatacara menggunakan projek sebagai teknik penilaian; 3.
Jelaskan peranan penilaian portfolio sebagai penilaian alternatif
strategi;
4. Huraikan ciri-ciri portfolio; dan 5. Terangkan
bagaimana portfolio dibangunkan.
ÿ PENGENALAN
Selain ujian objektif dan esei, terdapat jenis penilaian lain yang secara kolektif boleh
dikategorikan sebagai penilaian berasaskan prestasi. Menurut definisi yang disediakan
oleh Piawaian (AERA et al., dipetik dalam Reynold, Livingston & Willson, 2006), penilaian
prestasi memerlukan pengambil ujian untuk menyelesaikan tugas dalam konteks atau
persekitaran yang hampir menyerupai situasi kehidupan sebenar. Sebagai contoh, untuk
menilai kemahiran komunikasi lisan, penilaian mungkin memerlukan peserta ujian untuk
mengambil bahagian dalam sesi dialog kumpulan. Begitu juga, untuk menilai keupayaan
pengajaran guru pelatih, pelatih mungkin dikehendaki menjalankan pengajaran dengan
sekumpulan pelajar. Penekanan penilaian berasaskan prestasi adalah dengan melakukan,
bukan sekadar mengetahui, pada proses dan juga produk. Dalam konteks ini, ujian esei
yang digunakan untuk menilai kemahiran menulis dalam pembelajaran bahasa boleh
dianggap sebagai satu jenis penilaian prestasi. Memandangkan soalan esei telah dibincangkan lebih awal, kam

TOPIK 7 PENILAIAN PROJEK DAN PORTFOLIO ÿ 129
akan memberi tumpuan kepada jenis penilaian lain dalam topik ini, iaitu projek dan portfolio.
Penilaian projek yang memerlukan pelajar melaksanakan tugas praktikal untuk mengatur atau
mencipta sesuatu dengan pantas menjadi amalan biasa dalam pentaksiran berasaskan sekolah.
Portfolio, yang dianggap sebagai bentuk khusus penilaian prestasi yang berguna dalam menilai
pembelajaran pelajar dari semasa ke semasa melibatkan pengumpulan sistematik kerja pelajar
yang dihasilkan dalam tempoh masa tertentu mengikut set garis panduan tertentu (Reynold,
Livingston & Willson, 2006 ).
7.1 PENILAIAN PROJEK

Kebanyakan daripada kita telah melakukan beberapa bentuk kerja projek di sekolah atau universiti
dan mengetahui apa itu projek. Walau bagaimanapun, apabila diminta untuk mentakrifkannya,
seseorang akan melihat pelbagai tafsiran projek dan tujuannya. Projek boleh mewakili pelbagai
tugas yang boleh dilakukan di rumah atau di dalam bilik darjah, oleh ibu bapa atau kumpulan
pelajar, dengan cepat atau dari semasa ke semasa.
Secara teknikal terdapat perbezaan antara projek dan pembelajaran berasaskan projek (PBL).
Walaupun PBL turut menampilkan projek, tumpuan lebih kepada proses pembelajaran dan interaksi
pelajar-rakan-kandungan berbanding produk akhir itu sendiri. PBL hampir menyerupai kerja yang
dilakukan di dunia nyata. Senario atau simulasi adalah nyata manakala projek biasanya berdasarkan
peristiwa yang telah diselesaikan.
AKTIVITI 7.1
Pergi ke laman web ini http://www.friedtechnology.com/stuff
Lihat carta yang disediakan oleh Amy Mayer untuk perbezaan antara
projek dan pembelajaran berasaskan projek. Bincangkan penemuan anda dengan anda
rakan kursus dalam forum dalam talian myINSPIRE.
Projek adalah satu aktiviti di mana kekangan masa telah banyak dibuang dan boleh dilaksanakan
secara individu atau kumpulan dan biasanya melibatkan elemen penting kerja yang dilakukan di
rumah atau di luar sekolah (Firth & Mackintosh, 1987).
Kerja projek berakar umbi dalam pendekatan konstruktivisme yang berkembang daripada kerja ahli
psikologi dan pendidik seperti Lev Vygotsky, Jerome Bruner, Jean Piaget dan John Dewey.
Konstruktivisme memandang pembelajaran sebagai hasil pembinaan mental di mana pelajar belajar
dengan membina idea atau konsep baharu berdasarkan pengetahuan semasa dan sebelumnya.

130 ÿ TOPIK 7 PENILAIAN PROJEK DAN PORTFOLIO
Kebanyakan projek mempunyai ciri pentakrifan tertentu (Katz & Chard, 1989) seperti
sebagai:
(a) Berpusatkan pelajar;
(b) Permulaan, pertengahan dan akhir yang pasti;
(c) Kandungan bermakna kepada pelajar dan boleh diperhatikan secara langsung dalam mereka
persekitaran;
(d) Masalah dunia sebenar;
(e) Penyiasatan tangan pertama;
(f) Kepekaan terhadap budaya tempatan dan bersesuaian dengan budaya;
(g) Matlamat khusus berkaitan kurikulum;
(h) Produk ketara yang boleh dikongsi dengan khalayak yang dimaksudkan;
(i) Hubungan antara sekolah, kemahiran hidup dan kerja;
(j) Peluang untuk pemikiran reflektif dan penilaian kendiri pelajar; dan
(k) Pelbagai jenis dan penilaian autentik (portfolio, jurnal, rubrik dan
lain).
Dalam kerja projek, keseluruhan proses kerja adalah sama pentingnya dengan hasil akhir atau produk.
Proses kerja merujuk kepada pelajar memilih bidang pengetahuan, membatasinya dan merumuskan
masalah atau mengemukakan soalan. Ia juga melibatkan pelajar menyiasat dan menerangkan apa
yang diperlukan untuk menyelesaikan masalah tertentu atau menjawab soalan khusus melalui kerja
lanjut, pengumpulan bahan dan pengetahuan.
Kerja projek dirancang supaya dapat dilaksanakan dalam masa yang ada.
Sebaik-baiknya, tugasan itu hendaklah diambil daripada bidang pengetahuan dalam kurikulum semasa.
Kerja projek ialah pengalaman pembelajaran bersepadu yang menggalakkan pelajar untuk melepaskan
diri daripada pembahagian pengetahuan dan sebaliknya melibatkan penggunaan pelbagai aspek
pengetahuan. Sebagai contoh, membuat sesuatu objek bukan sahaja memerlukan kemahiran
kraftangan tetapi juga pengetahuan tentang bahan, kaedah kerja dan kegunaan objek tersebut.
Sokongan teknologi juga akan meningkatkan pembelajaran pelajar. Kemahiran berfikir adalah penting
untuk kerja projek.
Begitu juga, menulis laporan projek memerlukan kemahiran menulis yang dipelajari dalam bilik darjah
bahasa dan mengaplikasikannya semasa menganalisis dan membuat kesimpulan untuk projek sains.
Secara umumnya, terdapat dua jenis projek iaitu projek berasaskan penyelidikan dan projek berasaskan
produk.

(a) Projek berasaskan penyelidikan lebih bersifat teori dan mungkin terdiri daripada
mengemukakan soalan, merumuskan masalah atau menubuhkan beberapa hipotesis.
Untuk menjawab soalan, menyelesaikan masalah atau mengesahkan andaian,
maklumat mesti dicari, dinilai dan digunakan. Maklumat ini boleh sama ada hasil
daripada penyiasatan pelajar sendiri atau diperoleh daripada sumber awam tanpa
menjadi pembiakan tulen. Kerja projek sedemikian biasanya dibentangkan sebagai
laporan penyelidikan.
(b) Projek berasaskan produk ialah penghasilan objek konkrit, perkhidmatan, persembahan
tarian, filem, pameran, drama, program komputer dan sebagainya.
Dalam kerja projek, pelajar melibatkan diri secara aktif sebagai penyelesai masalah,
pembuat keputusan, penyiasat, pendokumentasi dan penyelidik. Kerja projek memberi
peluang kepada pelajar untuk meneroka pendekatan yang berbeza untuk menyelesaikan
masalah. Dalam kerja projek, seorang guru mengikuti, membincangkan dan menilai kerja
dalam semua fasa yang berbeza. Guru adalah penyelia pelajar. Jika kerja melibatkan
kumpulan, input daripada pelajar yang berbeza harus datang dari dalam matlamat program
masing-masing. Paling penting, pelajar harus mencari projek yang menyeronokkan,
bermotivasi dan mencabar kerana mereka memainkan peranan aktif dalam keseluruhan
proses. Pemilihan projek boleh ditentukan oleh guru atau pilihan boleh diserahkan kepada
pelajar, mungkin dengan kelulusan guru (Katz, 1994). Apa yang penting ialah pelajar
mengambil pemilikan projek mereka.
Terdapat banyak jenis projek yang berkesan. Berikut adalah beberapa idea projek:
(a) Tinjauan bangunan bersejarah dalam komuniti pelajar;
(b) Kajian aktiviti ekonomi penduduk dalam masyarakat setempat;
(c) Kajian sistem pengangkutan di daerah;
(d) Mencipta semula peristiwa bersejarah;
(e) Membangunkan surat berita, blog atau laman web mengenai isu khusus yang berkaitan dengan
sekolah atau komuniti (seperti keselamatan sekolah, kitar semula dan bagaimana perniagaan
boleh menjimatkan tenaga dan mengurangkan sisa);
(f) Menyusun sejarah lisan kawasan setempat dengan menemu bual penatua masyarakat;
(g) Menghasilkan laman web sebagai "jelajah maya" sejarah masyarakat;
(h) Buat dokumen pada CD pelajar yang lulus dari sekolah rendah atau menengah tempatan;

(i) Buat panduan hidupan liar atau botani untuk kawasan hidupan liar tempatan;
(j) Buat pameran tentang produk tempatan, sejarah tempatan atau personaliti tempatan
menggunakan pita audio, pita video dan gambar; dan
(k) Menyiasat pencemaran sungai, tasik dan kolam tempatan.
Kemungkinan untuk projek tidak berkesudahan. Bahan utama untuk sebarang idea projek ialah ia
didorong oleh pelajar, mencabar dan bermakna. Adalah penting untuk menyedari bahawa arahan
berasaskan projek melengkapkan kurikulum berstruktur. Arahan berasaskan projek membina dan
meningkatkan apa yang dipelajari oleh pelajar melalui pengajaran yang sistematik. Guru tidak
membiarkan pelajar menjadi pembuat keputusan tunggal tentang projek yang hendak diusahakan,
begitu juga guru tidak duduk diam dan menunggu pelajar memikirkan cara untuk melakukan proses
yang boleh menjadi sangat mencabar (Bryson, 1994). Di sinilah keupayaan guru untuk memudahkan
dan bertindak sebagai jurulatih memainkan peranan penting dalam kejayaan sesuatu projek. Guru
akan bercadang idea dengan pelajar untuk menjana kemungkinan projek, membincangkan
kemungkinan dan pilihan, membantu pelajar membentuk soalan panduan dan bersedia untuk
membantu pelajar sepanjang proses pelaksanaan seperti menetapkan garis panduan, tarikh akhir,
pemilihan sumber dan sebagainya. (Bryson, 1994; Rankin, 1993).
SEMAK KENDIRI 7.1
Nyatakan perbezaan antara projek berasaskan penyelidikan dan projek berasaskan

produk.
AKTIVITI 7.2
Berikan contoh dua jenis projek dalam bidang subjek anda.
forum.
7.1.1 Menilai Pelajar dengan Projek

Kerja berorientasikan projek menjadi semakin biasa dalam kehidupan kerja. Kecekapan projek,
keupayaan untuk bekerjasama dengan orang lain, mengambil inisiatif peribadi dan mempunyai
kemahiran keusahawanan sering diperlukan oleh majikan. Kecekapan ini boleh dibangunkan
semasa kerja projek dan dengan itu menyediakan pelajar untuk

kehidupan kerja. Kerja projek menjadikan persekolahan lebih seperti dunia sebenar. Dalam kehidupan
sebenar, kami jarang meluangkan masa beberapa jam mendengar pihak berkuasa yang lebih tahu daripada
kami memberitahu kami dengan tepat apa yang perlu dilakukan dan cara melakukannya. Kami bertanya
soalan kepada orang yang kami belajar. Kami cuba mengaitkan apa yang orang itu beritahu kami dengan
apa yang kami sudah tahu. Kami membawa pengalaman kami dan perkara yang telah kami ketahui yang
berkaitan dengan isu atau tugas dan katakan atau lakukan sesuatu mengenainya.
Anda boleh melihat ini dengan kelas pelajar muda. Apabila guru bercerita, kanak-kanak tadika kecil
mengangkat tangan mereka untuk berkongsi pengalaman mereka tentang sesuatu yang berkaitan dengan
cerita tersebut. Mereka mahu dapat menerapkan kecenderungan semula jadi mereka untuk proses
pembelajaran. Beginilah kehidupan selalunya! Dengan memberikan kerja projek, kami membuka bidang
dalam persekolahan di mana pelajar boleh bercakap tentang perkara yang sudah mereka ketahui.
Kerja projek ialah pengalaman pembelajaran yang membolehkan perkembangan pengetahuan, kemahiran
dan sikap tertentu yang menyediakan pelajar untuk pembelajaran sepanjang hayat dan cabaran yang akan
datang (rujuk Jadual 7.1). Objektif ini mungkin tidak dapat dicapai dengan strategi pengajaran semasa.
Jadual 7.1: Pengetahuan, Kemahiran dan Sikap yang Dicapai dengan Projek
Domain Hasil pembelajaran
Aplikasi ilmu Pelajar akan dapat membuat perkaitan merentasi bidang pengetahuan
(Menggunakan kemahiran yang berbeza dan menjana, mengembangkan dan menilai idea dan
berfikir secara kreatif dan kritis) maklumat untuk menggunakan kemahiran ini untuk tugas projek. •
Dapat memilih bidang pengetahuan dan mengehadkan tugas atau
masalah.
• Dapat memilih bahan, kaedah serta alatan yang berkaitan.
• Bertanggungjawab untuk merangka pelan projek dan jika perlu,

untuk menyemaknya.
Komunikasi Pelajar akan memperoleh kemahiran untuk berkomunikasi secara berkesan
(Meningkatkan dengan menyampaikan idea mereka dengan jelas dan koheren kepada
kemahiran komunikasi lisan khalayak tertentu dalam bentuk bertulis dan lisan.
dan bertulis)
• Dapat berbincang dengan guru pembimbing mereka bagaimana
kerja mereka berkembang. • Dapat menyediakan laporan bertulis
projek yang menerangkan kemajuan kerja dari idea awal hingga
produk akhir.
• Dapat menghasilkan produk akhir yang bermaksud penyelesaian

bebas kepada tugas atau masalah yang dipilih.

Kerjasama Pelajar akan memperoleh kemahiran kolaboratif melalui bekerja dalam satu
(Memupuk kemahiran pasukan untuk mencapai matlamat bersama.
pembelajaran kolaboratif)
Pembelajaran berdikari Pelajar akan dapat belajar sendiri, merenung pembelajaran mereka dan
(Membangunkan inkuiri terarah mengambil tindakan yang sesuai untuk menambah baik. • Boleh
kendiri dan kemahiran
menggunakan buku log untuk mendokumentasikan kemajuan kerja mereka
pembelajaran sepanjang hayat)
dan kerap melaporkan proses tersebut. • Dapat menilai sama ada
secara bertulis atau lisan hasil kerja mereka

proses dan hasil.
Sumber: Blank & Harwell (1997)
Kerja projek membantu pelajar dengan:
(a) Membangunkan kemahiran yang diperlukan untuk merancang, menstruktur dan mengambil
tanggungjawab untuk kerja yang lebih besar dan menyediakan pengalaman untuk bekerja dalam
„bentuk projek‰;
(b) Mendalami pengetahuan dalam sesuatu mata pelajaran atau antara mata pelajaran;
(c) Memberi peluang kepada pelajar untuk meneroka perkaitan dan kesalinghubungan topik dalam mata
pelajaran dan antara mata pelajaran; dan
(d) Menggalakkan pelajar untuk mensintesis pengetahuan daripada pelbagai bidang pembelajaran
sambil mengaplikasikannya secara kritis dan kreatif dalam situasi kehidupan sebenar.
Oleh itu, adalah penting bahawa pelajar ditugaskan untuk menjalankan projek tulen kami di mana
pelajar merancang, melaksana dan melaporkan projek yang mempunyai aplikasi dunia sebenar
di luar bilik darjah (Blank & Harwell, 1997).
SEMAK KENDIRI 7.2
Apakah pengetahuan, kemahiran dan sikap yang dinilai apabila pelajar berada
diberi projek untuk diusahakan?
AKTIVITI 7.3
Sejauh manakah kerja projek telah digunakan sebagai strategi pentaksiran di sekolah-
sekolah Malaysia?
forum.

7.1.2 Merekabentuk Projek Berkesan

Terdapat banyak jenis projek dan tidak ada satu cara yang betul untuk mereka bentuk dan
melaksanakan projek. Walau bagaimanapun, terdapat beberapa soalan dan isu untuk
dipertimbangkan semasa mereka bentuk projek yang berkesan. Adalah sangat penting bagi
setiap orang yang terlibat untuk jelas tentang matlamat projek. Anda akan terkejut bahawa
ramai guru tidak pasti mengapa mereka menggunakan projek untuk menilai pelajar mereka.
Guru harus membangunkan garis besar untuk menerangkan elemen penting dan jangkaan projek untuk setiap
Walaupun garis besar boleh mengambil pelbagai bentuk, ia harus mengandungi elemen berikut
(Bottoms & Webb, 1998):
(a) Situasi atau Masalah Garis

besar hendaklah mengandungi satu atau dua ayat yang menerangkan isu atau masalah
yang cuba ditangani oleh projek. Contohnya, tahap pencemaran sungai, masalah
pengangkutan di pusat bandar, harga barangan keperluan yang semakin meningkat,
kadar jenayah di kawasan setinggan, belia yang berlegar-legar di kompleks membeli-
belah dan pelajar di kafe Internet pada waktu persekolahan.
(b) Penerangan dan Tujuan Projek

Ini merujuk kepada penjelasan ringkas tentang tujuan akhir projek dan cara ia menangani
situasi atau masalah. Sebagai contoh, pelajar akan menyelidik, menjalankan tinjauan
dan membuat cadangan tentang cara mengurangkan pencemaran sungai. Keputusan
akan dibentangkan dalam surat berita, brosur maklumat, pameran atau laman web.
(c) Spesifikasi Prestasi

Senarai kriteria atau standard kualiti yang mesti dipenuhi oleh projek.
(d) Peraturan
Garis panduan untuk melaksanakan projek termasuk garis masa dan matlamat jangka
pendek seperti temu duga diselesaikan pada tarikh tertentu dan menyatakan tarikh siap
projek.
(e) Senarai Peserta Projek dengan Peranan yang Diberikan

Kenal pasti peranan ahli pasukan dan ahli komuniti jika mereka terlibat.
(f) Penilaian
Bagaimana prestasi pelajar akan dinilai. Dalam kerja projek, proses pembelajaran
sedang dinilai serta produk akhir.

Sebelum mereka bentuk projek, kenal pasti matlamat dan objektif pembelajaran. Apakah kemahiran
atau konsep khusus yang akan dipelajari oleh pelajar? Herman, Aschbacher dan Winters (1992) telah
mengenal pasti lima soalan yang perlu dipertimbangkan semasa menentukan matlamat pembelajaran:
(a) Apakah kemahiran kognitif penting yang saya mahu pelajar saya kembangkan ?
(Sebagai contoh, untuk menggunakan algebra untuk menyelesaikan masalah harian, untuk menulis secara persuasif);
(b) Apakah kemahiran sosial dan afektif yang saya mahu pelajar saya kembangkan ? (Untuk
contoh, untuk membangunkan kemahiran kerja berpasukan);
(c) Apakah kemahiran metakognitif yang saya mahu pelajar saya kembangkan? (Sebagai contoh,
untuk merenung proses penyelidikan, untuk menilai keberkesanannya, untuk menentukan
kaedah penambahbaikan);
(d) Apakah jenis masalah yang saya mahu pelajar saya dapat selesaikan? (Sebagai contoh, untuk
mengetahui cara menjalankan penyelidikan, untuk menggunakan kaedah saintifik); dan
(e) Apakah konsep dan prinsip yang saya mahu pelajar saya boleh gunakan? (Contohnya, untuk
menggunakan prinsip asas biologi dan geografi dalam kehidupan mereka, untuk memahami
sebab-akibat dalam perhubungan)
Steinberg (1998) menyediakan senarai semak untuk reka bentuk projek yang berkesan (rujuk Jadual
7.2). Senarai semak boleh digunakan sepanjang proses untuk membantu kedua-dua guru dan pelajar
merancang dan membangunkan projek serta menilai sama ada projek itu berjaya mencapai matlamat
pengajaran.
Jadual 7.2: Enam AÊs Senarai Semak Projek Berkesan
Enam AÊs Senarai Semak Soalan
Keaslian • Adakah projek berpunca daripada masalah atau persoalan yang bermakna
kepada pelajar?
• Adakah projek itu serupa dengan projek yang dijalankan oleh orang dewasa dalam komuniti atau
tempat kerja? • Adakah projek memberi peluang kepada pelajar untuk menghasilkan sesuatu
yang mempunyai nilai atau makna kepada pelajar di luar persekitaran sekolah?
Ketegasan
• Adakah projek membolehkan pelajar memperoleh dan menggunakan pengetahuan
akademik pusat kepada satu atau lebih bidang disiplin?
• Adakah projek mencabar pelajar untuk menggunakan kaedah inkuiri daripada satu atau lebih
disiplin (contohnya, berfikir seperti saintis)?
• Adakah pelajar membangunkan kemahiran berfikir aras tinggi (contohnya, mencari bukti atau
menggunakan perspektif yang berbeza)?

• Adakah pelajar menyelesaikan masalah yang berasaskan kehidupan sebenar dan/atau kerja
Pembelajaran gunaan (contohnya, mereka bentuk projek atau menganjurkan acara)? • Adakah pelajar perlu
memperoleh dan menggunakan kemahiran yang diharapkan dalam persekitaran kerja berprestasi
tinggi (contohnya, kerja berpasukan, penyelesaian masalah, komunikasi atau teknologi)?
• Adakah projek memerlukan pelajar untuk membangunkan organisasi dan

kemahiran mengurus diri?
• Adakah pelajar menghabiskan banyak masa melakukan kerja lapangan, di luar sekolah?
Penerokaan aktif
• Adakah projek memerlukan pelajar melibatkan diri dalam kerja penyiasatan sebenar,
menggunakan pelbagai kaedah, media dan sumber?
• Adakah pelajar diharapkan untuk menerangkan apa yang telah dipelajari melalui persembahan
atau persembahan?
• Adakah pelajar bertemu dan memerhati orang dewasa yang mempunyai pengalaman dan
Hubungan dewasa kepakaran yang relevan?
• Adakah pelajar dapat bekerja rapat dengan sekurang-kurangnya seorang
dewasa? • Adakah orang dewasa dan pelajar bekerjasama dalam reka bentuk dan penilaian
projek?
Amalan
• Adakah pelajar membuat refleksi secara kerap tentang pembelajarannya, menggunakan jelas
pentaksiran kriteria projek yang telah dia bantu untuk tetapkan?
• Adakah orang dewasa dari luar komuniti membantu pelajar mengembangkan rasa standard
dunia sebenar daripada jenis kerja ini? • Adakah kerja pelajar dinilai secara berkala melalui
pelbagai kaedah
termasuk portfolio dan pameran?
Sumber: Adaptation of Steinberg (1998). Pembelajaran sebenar, kerja sebenar: Reformasi sekolah dari sebagai
tinggi
sekolah ke tempat kerja
Selain yang disebutkan, adalah penting untuk memastikan perkara berikut:
(a) Adakah pelajar mempunyai akses mudah kepada sumber yang mereka perlukan? Ini amat
penting jika pelajar menggunakan teknologi tertentu atau kepakaran subjek-materi daripada
komuniti;
(b) Adakah pelajar tahu cara menggunakan sumber? Pelajar yang mempunyai pengalaman
minimum dengan komputer, sebagai contoh, mungkin memerlukan bantuan tambahan
dalam menggunakannya;

(c) Adakah pelajar mempunyai mentor atau jurulatih untuk menyokong mereka dalam kerja mereka? Ini
boleh menjadi mentor di sekolah atau di luar sekolah; dan
(d) Adakah pelajar jelas tentang peranan dan tanggungjawab setiap orang dalam
kumpulan?
SEMAK KENDIRI 7.3
1. Apakah beberapa faktor yang perlu anda pertimbangkan semasa mereka bentuk kerja projek
untuk pelajar dalam bidang subjek anda?
2. Berikan contoh projek yang telah anda sertakan atau boleh sertakan dalam
pengajaran dan penilaian bidang mata pelajaran anda.
7.1.3 Kemungkinan Masalah dengan Kerja Projek

Guru yang berhasrat untuk menggunakan projek sebagai alat pengajaran dan penilaian harus mengetahui
bidang masalah tertentu. Mereka harus sespesifik mungkin dalam menentukan hasil supaya kedua-dua
pelajar dan guru memahami dengan tepat apa yang perlu dipelajari. Thomas (1998) mengenal pasti bidang
masalah berikut semasa menjalankan arahan berasaskan projek:
(a) Menjajarkan matlamat projek dengan matlamat kurikulum boleh menjadi sukar. Lebih memburukkan
keadaan, ibu bapa tidak sentiasa menyokong projek apabila mereka tidak dapat melihat bagaimana
ia berkaitan dengan penilaian pembelajaran keseluruhan;
(b) Projek selalunya boleh mengambil masa lebih lama daripada jangkaan dan guru memerlukan banyak
masa untuk menyediakan projek tulen yang baik;
(c) Pelajar tidak jelas tentang apa yang diperlukan. Terdapat keperluan untuk struktur, garis panduan dan
panduan yang mencukupi tentang cara melaksanakan projek;
(d) Pembangunan kakitangan yang intensif diperlukan. Ini kerana guru secara tradisinya tidak bersedia
untuk mengintegrasikan kandungan ke dalam aktiviti dunia sebenar;
(e) Sumber yang diperlukan untuk kerja projek mungkin tidak tersedia dan mungkin kekurangan sokongan
pentadbiran; dan
(f) Sesetengah guru mungkin tidak biasa dengan cara mereka harus menilai projek.

7.1.4 Kerja Kumpulan dalam Projek

Bekerja dalam kumpulan telah menjadi sebahagian daripada pembelajaran yang diterima kerana faedah yang
diiktiraf secara meluas daripada kerja kumpulan kolaboratif untuk pembelajaran pelajar. Apabila kumpulan
berfungsi dengan baik, pelajar belajar lebih banyak dan menghasilkan hasil pembelajaran yang lebih berkualiti.
Apakah beberapa faedah kerja berkumpulan dalam projek? Mari kita baca yang berikut:
(a) Pembelajaran Rakan Sebaya Dapat Meningkatkan Kualiti Keseluruhan Pembelajaran Pelajar
Kerja kumpulan meningkatkan pemahaman pelajar. Pelajar belajar daripada satu sama lain dan
mendapat manfaat daripada aktiviti yang memerlukan mereka untuk menyatakan dan menguji
pengetahuan mereka. Kerja kumpulan memberi peluang kepada pelajar untuk menjelaskan dan
memperhalusi pemahaman mereka tentang konsep melalui perbincangan dan latihan dengan rakan
sebaya. Ramai, tetapi tidak semua, pelajar mengiktiraf nilai pembangunan peribadi mereka dalam kerja
kumpulan dan dinilai sebagai ahli kumpulan.
Bekerja dengan kumpulan dan untuk faedah kumpulan juga memotivasikan beberapa pelajar. Penilaian
kumpulan membantu sesetengah pelajar mengembangkan rasa tanggungjawab: „Saya merasakan
bahawa kerana seseorang bekerja dalam kumpulan, ia tidak mungkin untuk berlengah atau
menangguhkan sesuatu. Saya perlu terus bekerja jika tidak saya akan mengecewakan orang lain‰.
(b) Kerja Kumpulan Boleh Membantu Membangunkan Kemahiran Generik Khusus yang Diminta oleh Majikan
Sebagai tindak balas langsung kepada objektif menyediakan graduan dengan kapasiti untuk berfungsi
dengan jayanya sebagai ahli pasukan di tempat kerja, terdapat trend dalam beberapa tahun
kebelakangan ini untuk menggabungkan kemahiran generik bersama-sama. pengetahuan khusus mata
pelajaran tradisional dalam hasil pembelajaran yang diharapkan dalam pendidikan tinggi. Kerja
kumpulan boleh memudahkan pembangunan kemahiran yang merangkumi:
(i) Kemahiran kerja berpasukan (kemahiran bekerja dalam dinamik pasukan; kepimpinan
kemahiran);
(ii) Kemahiran analisis dan kognitif (menganalisis keperluan tugasan; menyoal; mentafsir bahan secara
kritis; menilai kerja orang lain);

(iii) Kemahiran kolaboratif (pengurusan dan penyelesaian konflik; menerima kritikan

intelektual; fleksibiliti; rundingan dan kompromi); dan
(iv) Kemahiran mengurus organisasi dan masa: „Melakukan kerja berkumpulan telah
mengubah cara saya bekerja. Saya tidak dapat melakukannya sepanjang malam sebelumnya.
Saya harus lebih teratur dan cekap‰.
(c) Kerja Kumpulan Boleh Mengurangkan Beban Kerja yang Terlibat dalam Menilai, Menggred dan
Memberi Maklum Balas kepada Pelajar
Kerja kumpulan dan penilaian kumpulan khususnya, kadangkala dilaksanakan dengan
harapan untuk memperkemas tugasan penilaian dan penggredan. Secara ringkasnya, jika
pelajar menghantar tugasan kumpulan bilangan kerja yang akan dinilai boleh dikurangkan
dengan ketara. Prospek ini mungkin menarik terutamanya untuk kakitangan yang mengajar
kelas besar.
SEMAK KENDIRI 7.4
1. Apakah beberapa masalah projek dalam pelaksanaan projek

bekerja dan bagaimana anda akan menyelesaikannya?
2. Apakah faedah kerja berkumpulan dalam projek?
7.1.5 Menilai Kerja Projek

Menilai prestasi pelajar dalam kerja projek agak berbeza daripada peperiksaan menggunakan ujian
objektif dan soalan esei. Ada kemungkinan bahawa pelajar mungkin mengerjakan projek yang
berbeza, contohnya, sesetengah mungkin bekerja dalam kumpulan manakala yang lain mungkin
bekerja secara individu. Ini menjadikan tugas menilai kemajuan pelajar lebih kompleks berbanding
ujian kertas dan pensel di mana setiap orang dinilai menggunakan satu skema pemarkahan.

Jadual 7.3 boleh memberi anda beberapa idea tentang cara menilai dan memberi markah untuk kerja
projek.
Jadual 7.3: Skim Pemarkahan Umum untuk Projek
Markah Kriteria
90ÿ100% • Kerja yang luar biasa dan terbilang daripada standard profesional. • Kemahiran
teknikal dan ekspresif yang cemerlang. • Kerja menunjukkan kreativiti dan
imaginasi yang luar biasa. • Karya yang mempamerkan bakat dan keaslian
yang hebat.
80ÿ89% • Kerja yang cemerlang dan maju dengan standard profesional.

• Kemahiran teknikal dan ekspresif yang sangat baik. •
Karya yang menunjukkan tahap kreativiti dan imaginasi yang tinggi. • Karya
yang mempamerkan bakat dan keaslian.
70ÿ79% • Kerja yang sangat baik yang menghampiri standard profesional.

• Kemahiran teknikal dan ekspresif yang sangat
baik. • Kerja menunjukkan kreativiti dan imaginasi yang baik. •
Karya yang memaparkan keaslian.
60ÿ69% • Standard kerja yang baik. •

Kemahiran teknikal dan ekspresif yang baik.
• Karya yang memaparkan kreativiti dan imaginasi. •
Karya yang memaparkan beberapa keaslian.
50ÿ59% • Standard kerja yang munasabah.
• Kemahiran teknikal dan ekspresif yang mencukupi.

• Kerja yang mempamerkan kecekapan dalam kriteria yang dinilai tetapi mungkin
kurang kreativiti atau keaslian.
40ÿ49% • Standard kerja yang terhad tetapi mencukupi. •

Kemahiran teknikal dan ekspresif yang terhad. •
Kerja yang memaparkan beberapa kelemahan dalam kriteria yang dinilai dan kurang
kreativiti atau keaslian.

30ÿ39% • Kerja terhad yang gagal memenuhi piawaian yang diperlukan.

• Kemahiran teknikal dan ekspresif yang lemah. •
Kerja yang memaparkan kelemahan ketara dalam kriteria yang dinilai.
20ÿ29% • Kerja yang lemah. Kemahiran teknikal atau ekspresif yang tidak memuaskan.
• Kerja yang memaparkan kelemahan penting atau asas dalam kriteria
dinilai.
10ÿ19% • Kerja yang sangat buruk atau kerja yang sangat sedikit percubaan telah dibuat.
• Kurang kemahiran teknikal atau ekspresif. • Kerja
yang memaparkan kelemahan asas dalam kriteria yang dinilai.
1 hingga 9%
• Kerja atau kerja yang sangat teruk di mana tiada percubaan serius telah dibuat.
Sumber: Chard (1992)
Apabila menilai kerja projek, anda perlu jelas tentang perkara yang perlu dinilai. Adakah produk,
proses atau kedua-duanya? Menurut Bonthron dan Gordon (1999), dari permulaan anda harus jelas:
(a) Sama ada anda akan menilai produk kerja kumpulan atau kedua-dua produk dan proses.
(b) Jika anda berhasrat untuk menilai proses tersebut, apakah bahagian yang anda akan peruntukkan
untuk proses dan apakah kriteria untuk digunakan dan bagaimana anda akan menilai proses
tersebut?
(c) Apakah kriteria yang anda rancangkan untuk digunakan untuk menilai kerja projek dan bagaimana
markah diedarkan?
Sesetengah pendidik percaya terdapat keperluan untuk menilai proses dalam kumpulan serta produk
atau hasil. Apakah sebenarnya yang dimaksudkan dengan „proses‰? Kedua-dua guru dan pelajar
mesti mempunyai pemahaman yang jelas tentang maksud proses tersebut.
Contohnya, jika anda ingin menilai „'tahap interaksi‰ di kalangan pelajar dalam kumpulan, mereka
harus tahu maksud interaksi „tinggi‰ atau „rendah‰. Perlukah guru melibatkan dirinya dalam kerja
setiap kumpulan atau bergantung kepada penilaian diri atau rakan sebaya? Jelas sekali, terlibat
dalam banyak kumpulan adalah mustahil untuk guru secara fizikal. Akibatnya, sesetengah pendidik
mungkin berkata, „Saya tidak kisah apa yang mereka lakukan dalam kumpulan mereka. Apa yang
saya minati ialah produk akhir dan cara mereka mencapai keputusan adalah perniagaan mereka‰.
Walau bagaimanapun, untuk memberikan penilaian yang lebih seimbang, terdapat minat yang
semakin meningkat dalam kedua-dua proses dan produk kerja kumpulan dan isu yang timbul ialah
„Apakah bahagian penilaian yang harus difokuskan pada produk dan bahagian manakah yang harus
difokuskan pada proses?‰

Kriteria penilaian kerja kumpulan boleh ditentukan oleh guru sahaja atau kedua-duanya oleh guru dan
pelajar melalui perundingan antara kedua-dua pihak. Ahli kumpulan boleh dirujuk tentang perkara yang
perlu dinilai dalam sesuatu projek melalui perundingan dengan guru. Jelas sekali, anda perlu jelas
tentang hasil pembelajaran projek yang dimaksudkan dalam bidang subjek anda. Ia adalah titik permulaan
yang berguna untuk menentukan kriteria penilaian projek. Setelah hasil pembelajaran yang lebih luas ini
difahami, anda boleh menetapkan kriteria untuk menandakan projek. Secara amnya, adalah lebih mudah
untuk mewujudkan kriteria untuk mengukur „produk‰ kerja projek dan lebih sukar untuk mengukur
„proses‰ yang terlibat dalam kerja projek. Walau bagaimanapun, adalah dicadangkan bahawa penilaian
produk dan proses dilakukan secara berasingan dan bukannya cuba melakukan kedua-duanya secara
serentak. Kami akan membincangkan bagaimana proses dalam kerja projek boleh dinilai kemudian.
Satu lagi perkara penting yang perlu diberi perhatian ialah kita perlu jelas siapa yang mendapat markah ÿ
individu atau kumpulan secara keseluruhan? Kebanyakan projek melibatkan lebih daripada seorang
pelajar dan faedah kerja berkumpulan telah dibincangkan lebih awal. Masalah utama menilai projek yang
melibatkan kerja berkumpulan ialah bagaimana memperuntukkan markah secara adil di kalangan ahli
kumpulan. Soalan-soalan berikut adalah yang disebut oleh pelajar: „Saya ingin guru saya memberitahu
saya jumlah kerja dan usaha yang akan saya perolehi membolehkan saya memperoleh markah tertentu‰,
„Adakah semua pelajar memperoleh markah yang sama walaupun tidak semua pelajar dimasukkan ke
dalam usaha yang sama?‰ dan „Adakah markah diberi berdasarkan sumbangan individu ahli pasukan?
‰
Ini adalah soalan yang menyusahkan guru terutamanya apabila perkara biasa untuk mencari pemuat
percuma atau pasangan tidur dalam projek berkumpulan. Berikut adalah beberapa cadangan bagaimana
kerja kumpulan boleh dinilai:
(a) Kaedah 1: Tanda Kumpulan Dikongsi

Semua ahli kumpulan menerima markah yang sama untuk kerja yang dihantar tanpa mengira
sumbangan individu. Ia adalah kaedah mudah yang menggalakkan kerja kumpulan di mana ahli
kumpulan tenggelam atau berenang bersama-sama. Walau bagaimanapun, ia mungkin dianggap
tidak adil oleh pelajar yang lebih baik yang mungkin mengadu bahawa mereka kurang bernasib
baik oleh pelajar yang lemah dan kemungkinan „pasangan tidur‰ adalah sangat tinggi.
(b) Kaedah 2: Kongsi Markah Para pelajar

dalam kumpulan memutuskan bagaimana jumlah markah harus dikongsi antara mereka. Sebagai
contoh, markah 40 diberikan oleh guru untuk projek yang dihantar. Terdapat 5 ahli dalam kumpulan
dan oleh itu jumlah markah yang mungkin ialah 5 x 40 = 200. Pelajar kemudiannya berkongsi 200
markah berdasarkan sumbangan setiap 4 pelajar, yang mungkin 35, 45, 42, 38 dan 40 Ini adalah
kaedah yang berkesan jika ahli kumpulan bersikap adil, jujur dan tidak mempunyai perasaan
buruk terhadap satu sama lain. Walau bagaimanapun, terdapat kemungkinan markah diagihkan
secara sama rata bagi mengelakkan perasaan kurang enak di kalangan ahli kumpulan.

(c) Kaedah 3: Markah Individu

Setiap pelajar dalam kumpulan menghantar laporan individu berdasarkan tugasan yang
diperuntukkan atau pada keseluruhan projek.
(i) Tugasan yang

Diperuntukkan Sejak awal, projek dibahagikan kepada bahagian atau tugasan yang
berbeza dan setiap pelajar dalam kumpulan menyelesaikan tugasan yang diperuntukkan
yang menyumbang kepada produk kumpulan akhir dan mendapat markah untuk tugasan tersebut.
Kaedah ini adalah cara yang agak objektif untuk memastikan penyertaan individu dan
boleh memotivasikan pelajar untuk bekerja keras dalam tugas atau bahagian mereka.
Masalahnya ialah memecahkan projek kepada tugas-tugas yang betul-betul sama dalam
saiz atau kerumitan. Selain itu, kaedah ini mungkin tidak menggalakkan kerjasama
kumpulan dan sesetengah ahli mungkin memperlahankan kemajuan.
(ii) Laporan Individu

Setiap pelajar menulis dan menyerahkan laporan individu berdasarkan keseluruhan
projek. Kaedah ini memastikan usaha individu dan mungkin dianggap adil oleh pelajar.
Walau bagaimanapun, adalah sukar untuk menentukan bagaimana laporan individu
harus berbeza dan pelajar mungkin secara tidak sengaja memplagiat.
(d) Kaedah 4: Markah Individu (Peperiksaan)

Soalan peperiksaan secara khusus menyasarkan projek kumpulan dan hanya boleh dijawab
oleh pelajar yang telah terlibat secara menyeluruh dalam projek tersebut. Kaedah ini boleh
memotivasikan pelajar untuk belajar lebih banyak daripada projek kumpulan termasuk belajar
daripada ahli kumpulan yang lain. Walau bagaimanapun, ia mungkin tidak berkesan kerana
pelajar mungkin dapat menjawab soalan dengan membaca laporan kumpulan. Dalam konteks
Malaysia, peperiksaan kebangsaan mungkin tidak boleh memasukkan soalan sedemikian
kerana ia melibatkan ratusan ribu pelajar.
(e) Kaedah 5: Gabungan Purata Kumpulan dan Markah Individu

Markah kumpulan diberikan kepada setiap ahli dengan mekanisme untuk melaraskan
sumbangan individu. Kaedah ini mungkin dianggap lebih adil daripada tanda kumpulan kongsi.
Tetapi ini bermakna cabaran tambahan untuk guru apabila cuba mewujudkan sumbangan
individu.
AKTIVITI 7.4
Antara lima kaedah menilai kerja kumpulan yang manakah akan anda gunakan
menilai kerja projek dalam bidang subjek anda? Berikan alasan untuk pilihan anda
dalam forum dalam talian myINSPIRE.

7.1.6 Proses Menilai dalam Projek

Penilaian produk akhir kumpulan jarang sekali satu-satunya penilaian yang berlaku dalam
projek kumpulan. Proses kerja kumpulan semakin diiktiraf sebagai elemen penting dalam
penilaian kerja kumpulan. Dan apabila kerja berkumpulan ditandakan semata-mata
berdasarkan produk, dan bukan proses, mungkin terdapat perbezaan dalam penggredan
individu yang dianggap tidak adil dan tidak boleh diterima.
Mari kita lihat aspek lain dalam menilai projek.
(a) Rakan Sebaya atau Penilaian Kendiri Peranan

Pelajar menilai diri mereka sendiri serta ahli kumpulan lain berdasarkan kriteria tertentu
seperti tanggungjawab, menyumbang idea dan menyelesaikan tugasan. Ini boleh
dilakukan melalui pelbagai bentuk penggredan (rujuk Rajah 7.1) atau meminta pelajar
menulis esei ringkas tentang kekuatan dan kelemahan kumpulan atau ahli.
(b) Jurnal Individu

Pelajar menyimpan jurnal peristiwa yang berlaku dalam setiap mesyuarat kumpulan. Ini
termasuk siapa yang menghadiri mesyuarat, apa yang dibincangkan dan rancangan
untuk mesyuarat akan datang. Ini boleh dikumpul dan dibaca secara berkala oleh
pengajar yang mengulas tentang kemajuan. Pengajar boleh memberikan bimbingan
untuk kumpulan tanpa mengarahkan mereka.
(c) Minit Mesyuarat Kumpulan Sama

seperti jurnal ialah minit mesyuarat kumpulan yang dibaca secara berkala oleh pengajar.
Ini termasuk siapa yang hadir, tugas diselesaikan, tugas yang dirancang dan
penyumbang kepada pelbagai tugas. Ini memberikan pengajar kaedah memantau
sumbangan individu dalam kumpulan.
(d) Gred Caruman Kumpulan dan Individu

Pengajar boleh membahagikan gred projek kepada peratusan sumbangan individu dan
kumpulan. Ini amat berfaedah jika penilaian rakan sebaya dan kendiri digunakan (rujuk
Rajah 7.1).
Mempunyai buku log berpotensi memberikan banyak maklumat untuk membentuk asas
penilaian sambil menyimpan minit membantu ahli memberi tumpuan kepada proses yang
merupakan pengalaman pembelajaran itu sendiri. Teknik ini mungkin dianggap sebagai cara
yang adil untuk menangani pemuat percuma dan penyumbang cemerlang. Walau
bagaimanapun, menyemak log boleh memakan masa untuk guru atau pengajar dan pelajar
mungkin memerlukan banyak latihan dan pengalaman untuk menyimpan rekod. Di samping
itu, penekanan pada bukti terpakai mungkin tidak boleh dipercayai.


Rajah 7.1: Senarai semak untuk menilai proses yang terlibat dalam kerja
projek Sumber: Dibangunkan oleh Maggie Sutherland untuk Akademi Bioteknologi di Andrew P.
Hill High School © 2003 East Side Union High School District, San Jose, California

Penilaian Kendiri dalam Kerja Projek

Penilaian kendiri ialah satu proses di mana pelajar belajar tentang diri mereka sendiri, contohnya, apa yang
telah mereka pelajari tentang projek, bagaimana mereka telah belajar dan bagaimana mereka bertindak balas
dalam situasi tertentu semasa menjalankan projek. Penglibatan pelajar dalam proses penilaian adalah bahagian
penting dalam penilaian seimbang. Apabila pelajar menjadi rakan kongsi dalam proses pembelajaran mereka
mendapat rasa yang lebih baik tentang diri mereka sebagai pembaca, penulis dan pemikir. Sesetengah guru
mungkin tidak selesa dengan penilaian kendiri kerana secara tradisinya, guru bertanggungjawab ke atas semua
bentuk penilaian di dalam bilik darjah dan di sini kami meminta pelajar menilai diri mereka sendiri.
Penilaian kendiri boleh mengambil pelbagai bentuk:
(a) Perbincangan yang melibatkan seluruh kelas atau kumpulan kecil;
(b) Log pantulan;
(c) Senarai semak atau inventori penilaian kendiri; dan
(d) Temu bual guru-pembelajar.
Jenis penilaian kendiri ini berkongsi tema yang sama, yang memerlukan pelajar menyemak kerja mereka untuk
menentukan perkara yang telah mereka pelajari dan kawasan kekeliruan yang mungkin masih wujud. Walaupun
setiap kaedah mungkin berbeza sedikit, semuanya merangkumi masa yang cukup untuk pelajar
mempertimbangkan dengan teliti dan menilai kemajuan mereka sendiri.
Oleh kerana pembelajaran projek adalah didorong oleh pelajar, penilaian harus didorong oleh pelajar juga.
Pelajar boleh menyimpan jurnal dan log untuk menilai kemajuan mereka secara berterusan. Esei atau log
refleksi akhir boleh membolehkan pelajar dan guru memahami proses pemikiran, sebab di sebalik keputusan,
keupayaan untuk membuat kesimpulan dan menyampaikan apa yang telah mereka pelajari.
Menurut Edwards (2000), berikut adalah beberapa soalan yang seseorang pelajar boleh bertanya kepada
dirinya sendiri semasa menjalankan penilaian kendiri:
(a) Apakah kejayaan projek tersebut?
(b) Apakah yang boleh saya lakukan untuk menambah baik projek itu?
(c) Sejauh manakah saya mencapai matlamat pembelajaran saya? Apakah yang paling sukar untuk mencapai
matlamat?
(d) Apakah yang paling mengejutkan saya tentang mengusahakan projek itu?
(e) Apakah usaha pasukan terbaik kumpulan saya? Usaha pasukan yang paling teruk?

(f) Bagaimanakah saya rasa orang lain yang terlibat dengan projek itu merasakan kemajuan dan
produk akhir projek itu?
(g) Apakah kemahiran yang saya gunakan semasa projek ini? Bagaimana saya boleh terlibat
kemahiran ini pada masa hadapan?
SEMAK KENDIRI 7.6
1. Terangkan bagaimana proses boleh diukur dalam kerja projek berkumpulan.
2. Senaraikan beberapa masalah dengan penilaian proses.
AKTIVITI 7.5
Adakah anda fikir proses perlu dinilai?
Terangkan jawapan anda kepada rakan kursus anda dalam myINSPIRE dalam talian
forum.
7.2 PENILAIAN PORTFOLIO

Semakin hari, penilaian portfolio semakin penting sebagai strategi penilaian yang bertujuan
untuk membentangkan pandangan yang lebih holistik tentang pelajar. Portfolio cenderung
dikaitkan dengan seni, di mana pelajar menyimpan karyanya dalam jenis folder untuk
dibentangkan untuk penilaian. Sesetengah orang mungkin mengaitkan portfolio dengan pasaran
saham di mana seseorang atau organisasi menyimpan portfolio saham dan saham yang dimiliki.
Hart (1994) mentakrifkan portfolio sebagai bekas yang menyimpan bukti kemahiran, idea, minat
dan pencapaian individu (lihat Rajah 7.2).
Rajah 7.2: Contoh portfolio

Portfolio pelajar mungkin mempunyai pelbagai bentuk. Tidak mudah untuk menggambarkan
mereka. Portfolio bukanlah timbunan kerja pelajar yang terkumpul selama satu semester
atau tahun. Sebaliknya, portfolio ialah koleksi bermatlamat karya yang dihasilkan oleh
pelajar yang mencerminkan usaha, kemajuan dan pencapaian mereka dalam pelbagai
bidang kurikulum. Menurut Paulson, Paulson dan Meyer (1991), „portfolio menawarkan
cara menilai pembelajaran pelajar yang berbeza daripada kaedah tradisional.
Penilaian portfolio memberi peluang kepada guru untuk memerhati pelajar dalam konteks
yang lebih luas yang melibatkan mengambil risiko, membangunkan penyelesaian kreatif
dan belajar membuat pertimbangan tentang prestasi mereka‰.
7.2.1 Apakah itu Penilaian Portfolio?
Koleksi karya oleh pelajar dinilai dan oleh itu istilah penilaian portfolio. Portfolio
menyediakan penilaian berterusan dan berterusan (penilaian formatif) serta penilaian
pada akhir semester atau setahun (penilaian sumatif). Penekanan lebih kepada memantau
kemajuan pelajar ke arah mencapai hasil pembelajaran mata pelajaran, kursus atau
program tertentu.
Penilaian portfolio telah disifatkan sebagai multidimensi kerana ia membolehkan pelajar

memasukkan pelbagai aspek kerja mereka seperti esei, laporan projek, prestasi ujian
objektif, objek atau artifak yang telah mereka hasilkan, puisi, laporan makmal dan
sebagainya. Dalam erti kata lain, portfolio mengandungi sampel kerja sepanjang semester,
penggal atau tahun, bukannya satu mata dalam masa (seperti semasa minggu
peperiksaan). Guru harus menyampaikan kepada pelajar tujuan portfolio, apa yang
membentuk kerja berkualiti dan bagaimana portfolio itu digredkan.
Penilaian portfolio mewakili anjakan yang ketara dalam pemikiran tentang peranan
penilaian dalam pendidikan. Guru yang menggunakan strategi ini di dalam bilik darjah
telah mengalihkan falsafah penilaian mereka daripada hanya membandingkan pencapaian
berdasarkan gred, markah ujian dan kedudukan persentil kepada meningkatkan
pencapaian pelajar melalui maklum balas dan refleksi kendiri.
7.2.2 Rasional untuk Penilaian Portfolio
In telah kerap dicadangkan bahawa ujian kertas dan pensel (ujian objektif dan esei) tidak
dapat menilai semua hasil pembelajaran dalam bidang mata pelajaran tertentu.
Sebagai contoh, banyak kemahiran kognitif peringkat tinggi dan domain afektif (perasaan,
emosi, sikap dan nilai) tidak dinilai dengan secukupnya menggunakan kaedah penilaian
tradisional. Penilaian portfolio membolehkan penilaian yang lebih luas
pelbagai kemahiran dan pemahaman dan yang paling penting, ia memberi peluang
kepada guru untuk mengesan atau memantau perubahan dan pertumbuhan dalam satu tempoh

masa. Memandangkan penilaian portfolio adalah proses yang berterusan, ia memberi peluang kepada
pelajar untuk merenung pembelajaran dan pemikiran mereka sendiri. Mereka mempunyai peluang untuk
memantau pemahaman dan pendekatan mereka untuk menyelesaikan masalah dan membuat keputusan
(Paulson, Paulson & Meyer, 1991). Setelah membuat refleksi, pelajar boleh mengenal pasti di mana silap
mereka atau bagaimana mereka boleh memperbaiki diri mereka sendiri.
Epstein (2006) dalam Pengenalan kepada Portfolio, Reka Bentuk Pembelajaran Sinaps, dipetik dalam
Teachervision.com, berpendapat bahawa penilaian portfolio:
(a) Membolehkan guru melihat pelajar sebagai individu, masing-masing dengan sendiri
ciri unik, keperluan dan kekuatan;
(b) Menekankan peningkatan pencapaian pelajar dan bukannya meletakkan kedudukan pelajar mengikut
prestasi mereka berdasarkan ujian;
(c) Membantu pelajar untuk lebih bertanggungjawab terhadap kerja mereka;
(d) Membenarkan penyesuaian pengajaran kepada gaya pembelajaran pelajar;
(e) Melibatkan pelajar dalam proses penilaian; dan
(f) Menjemput pelajar untuk merenung pertumbuhan dan prestasi mereka sebagai pelajar.
Walau bagaimanapun, Epstein (2006) juga menyebut beberapa masalah dengan penilaian portfolio.
Penilaian portfolio mungkin kurang boleh dipercayai kerana ia cenderung lebih bersifat kualitatif dan
bukannya kuantitatif. Masyarakat masih sangat berorientasikan gred dan markah ujian. Selain itu,
kebanyakan universiti dan kolej masih menggunakan markah dan gred ujian sebagai kriteria kemasukan
utama. Selain itu, penilaian portfolio mungkin memakan masa untuk guru dan data daripada penilaian
portfolio boleh menjadi sukar untuk dianalisis.
7.2.3 Jenis Portfolio

Terdapat dua jenis portfolio utama iaitu portfolio berorientasikan proses dan portfolio berorientasikan
produk.
(a) Portfolio berorientasikan proses

Portfolio ini menceritakan kisah tentang pelajar dan bagaimana pelajar itu telah berkembang.
Ia termasuk draf terdahulu dan cara draf ini telah diperbaiki. Sebagai contoh, draf pertama puisi
yang ditulis oleh pelajar Tahun Tiga diolah semula berdasarkan komen oleh guru dan pelajar
merenung hasil kerjanya. Semua draf dan perubahan yang dibuat disimpan dalam portfolio.
Dengan cara ini, karya pelajar boleh dibandingkan dengan dan ia memberikan bukti berkenaan
dengan bagaimana kemahiran pelajar telah bertambah baik.

(b) Portfolio berorientasikan produk

Portfolio ini mengandungi karya seorang pelajar yang dianggapnya terbaik.
Matlamatnya adalah untuk mendokumentasikan dan mencerminkan kualiti produk akhir dan
bukannya proses yang menghasilkannya. Pelajar dikehendaki mengumpul semua kerjanya
pada akhir semester, pada masa itu dia mesti memilih karya yang paling berkualiti. Pelajar
boleh dibiarkan membuat keputusan sendiri atau guru boleh menetapkan kriteria tentang apa
yang mesti terkandung dalam portfolio dan kualiti kerja yang akan disertakan.
7.2.4 Cara Membangunkan Portfolio

Reka bentuk dan pembangunan portfolio melibatkan empat langkah utama (seperti yang dinyatakan
Pengenalan
dalam Epstein (2006), kepada
dipetik dalam Portfolio, Reka Bentuk Pembelajaran Sinaps ,
Teachervision.com).
(a) Koleksi
Langkah ini hanya memerlukan pelajar untuk mengumpul dan menyimpan semua kerja.
Pelajar perlu membiasakan diri dengan idea untuk mendokumentasikan dan menyimpan kerja mereka,
sesuatu yang mungkin tidak pernah mereka lakukan sebelum ini.
(i) Bagaimanakah kerja-kerja itu harus disusun? Mengikut mata pelajaran atau tema?
(ii) Bagaimanakah kerja-kerja itu perlu direkodkan dan disimpan?
(iii) Bagaimana untuk mendapatkan pelajar membentuk tabiat mendokumentasikan bukti?
(b) Pemilihan
Ini bergantung kepada sama ada ia adalah proses atau portfolio produk dan kriteria yang
ditetapkan oleh guru. Pelajar akan meneliti kerja yang dikumpul dan memilih karya tertentu
untuk portfolio mereka. Ini mungkin termasuk kertas peperiksaan dan kuiz, rakaman audio
dan video, laporan projek, jurnal, kerja komputer, esei, puisi, karya seni dan sebagainya.
Pendek kata,
(i) Bagaimanakah seseorang itu memilih? Apakah asas pemilihan?
(ii) Siapakah yang perlu terlibat dalam proses pemilihan?
(iii) Apakah akibat jika tidak melengkapkan portfolio?

(c) Refleksi
Ini adalah langkah paling penting dalam proses portfolio. Refleksi yang terlibatlah yang
membezakan portfolio sebagai koleksi karya pelajar semata-mata. Refleksi selalunya
dilakukan secara bertulis tetapi boleh juga dilakukan secara lisan. Pelajar ditanya mengapa
mereka memilih produk atau karya tertentu (contohnya, esei) dan bagaimana ia dibandingkan
dengan karya lain, apakah kemahiran dan pengetahuan tertentu yang digunakan untuk
menghasilkannya dan bagaimana ia boleh dipertingkatkan lagi. Sebagai tambahan,
(i) Pelajar harus memikirkan bagaimana atau mengapa mereka memilih karya tertentu.
(ii) Bagaimanakah seharusnya pelajar melakukan proses refleksi?
(d) Sambungan
Hasil daripada „refleksi‰, pelajar akan mula bertanya kepada diri sendiri, „Mengapa kita
melakukan ini?‰ Mereka digalakkan untuk membuat perkaitan antara kerja sekolah mereka
dan nilai apa yang mereka pelajari. Mereka juga digalakkan untuk membuat perkaitan antara
karya yang termasuk dalam portfolio mereka dengan dunia di luar bilik darjah. Mereka belajar
untuk mempamerkan apa yang telah mereka lakukan di sekolah kepada kejadian dan situasi
dalam masyarakat.
Isu yang perlu dipertimbangkan termasuk:
(i) Bagaimanakah kesan kumulatif portfolio dinilai?
(ii) Patutkah pelajar mempamerkan hasil kerja mereka?
7.2.5 Kelebihan dan Kelemahan

Penilaian Portfolio
Sebagai alat penilaian formatif, portfolio pelajar boleh digunakan oleh guru sebagai teknik diagnostik
atau maklum balas tidak formal. Maklum balas membolehkan pelajar merenung apa yang mereka
pelajari dan mengapa. Portfolio penilaian memerlukan pelajar untuk terus mereflek dan melaksanakan
penilaian kendiri terhadap kerja mereka. Kebaikan dan keburukan penilaian portfolio boleh
diringkaskan seperti berikut:
(a) Kelebihan Penilaian Portfolio

Berikut adalah beberapa kelebihan penilaian portfolio:
(i) Penilaian berterusan adalah faedah utama penilaian portfolio;
(ii) Menggalakkan penilaian kendiri, refleksi dan pemikiran kritis pelajar;

(iii) Memastikan pelajar bertanggungjawab untuk menguasai standard kandungan dalam bidang
mata pelajaran;
(iv) Mengukur prestasi berdasarkan sampel tulen hasil kerja pelajar;
(v) Menyediakan fleksibiliti dalam mengukur bagaimana pelajar mencapai matlamat pembelajaran
mereka;
(vi) Menggalakkan komunikasi antara guru dan pelajar. Membolehkan guru dan pelajar berkongsi
tanggungjawab untuk menetapkan matlamat pembelajaran dan untuk menilai kemajuan
ke arah mencapai matlamat tersebut;
(vii) Memberi peluang kepada pelajar untuk mendapatkan input yang meluas ke dalam
proses pembelajaran; dan
(viii) Memudahkan aktiviti pembelajaran koperatif termasuk penilaian dan tunjuk ajar rakan
sebaya, kumpulan pembelajaran koperatif dan persidangan rakan sebaya.
(b) Kelemahan Penilaian Portfolio Terdapat orang

yang beranggapan bahawa portfolio tidak dapat menyediakan maklumat yang boleh
dipercayai yang diperlukan untuk penilaian yang baik terhadap pembelajaran pelajar. Bagi
mereka kesalahan penilaian portfolio adalah:
(i) Tidak diseragamkan;
(ii) Tidak boleh dilaksanakan untuk penilaian berskala besar; dan
(iii) Berpotensi berat sebelah.
Selain itu, kelemahan lain penilaian portfolio menurut Venn (2000) adalah seperti berikut:
(i) Memerlukan masa tambahan untuk merancang sistem pentaksiran dan menjalankan
pentaksiran terutamanya untuk kumpulan besar pelajar;
(ii) Mengumpul semua data yang diperlukan dan sampel kerja boleh dibuat
portfolio besar dan sukar diurus;

(iii) Portfolio pemarkahan melibatkan penggunaan meluas prosedur penilaian

subjektif seperti skala penarafan dan pertimbangan profesional yang
mengehadkan kebolehpercayaan; dan
(iv) Menjadualkan persidangan portfolio individu adalah sukar dan tempoh setiap
persidangan mungkin mengganggu aktiviti pengajaran yang lain.
7.2.6 Bagaimana dan Bilakah Portfolio Perlu Ditaksir?
Jika tujuan penilaian adalah untuk menunjukkan kemajuan, guru boleh membuat
pertimbangan tentang bukti kemajuan dan memberikan pertimbangan tersebut sebagai
maklum balas kepada pelajar. Pelajar juga boleh menilai sendiri kemajuannya untuk
menyemak sama ada matlamatnya telah dicapai atau tidak.
Portfolio adalah lebih daripada sekadar koleksi kerja pelajar. Guru boleh menilai dan
memberikan gred kepada proses memasang dan merenung portfolio kerja pelajar. Pelajar
mungkin juga memasukkan refleksi tentang pertumbuhan, kekuatan dan kelemahan,
tentang matlamat yang telah atau akan ditetapkan, tentang mengapa sampel tertentu
menceritakan kisah tertentu tentang mereka atau tentang sebab kandungan mencerminkan
kemajuan yang mencukupi untuk menunjukkan penyempurnaan piawaian yang ditetapkan.
Sesetengah kemahiran proses juga mungkin menjadi sebahagian daripada standard guru,
sekolah atau daerah. Oleh itu, portfolio menyediakan beberapa bukti pencapaian piawaian
tersebut. Mana-mana atau semua elemen ini boleh dinilai dan/atau digredkan.
Tugasan portfolio juga boleh dinilai atau digredkan dengan rubrik. Rubrik berguna dalam
mengelakkan pertimbangan peribadi yang digunakan untuk menilai produk yang kompleks
seperti portfolio. Rubrik boleh memberikan sedikit kejelasan dan ketekalan dalam menilai
dan menilai kualiti kandungan dan unsur-unsur yang membentuk kandungan tersebut.
Selain itu, penggunaan rubrik meningkatkan kemungkinan konsistensi di kalangan guru
yang menilai portfolio.

Rubrik portfolio berikut boleh digunakan untuk penilaian kendiri dan maklum balas rakan
sebaya (rujuk Rajah 7.3).

Rajah 7.3: Contoh rubrik untuk penilaian kendiri dan maklum balas
rakan sebaya Sumber: Diadaptasi daripada eportfolio (rubrik
portfolio digital di https://www2.uwstout.edu/content/profdev/rubrics/eportfoliorubric.html)

SEMAK KENDIRI 7.7
1. Apakah kekuatan dan kelemahan penilaian portfolio?
2. Apakah kelebihan dan kekurangan penilaian portfolio?
AKTIVITI 7.6
1. Sejauh manakah penilaian portfolio digunakan dalam bahasa Malaysia

bilik darjah?
2. Adakah anda berpendapat penilaian portfolio boleh digunakan sebagai penilaian

teknik dalam bidang subjek anda? Terangkan.
forum.
• Penilaian berasaskan prestasi memerlukan pengambil ujian untuk menyelesaikan tugasan dalam
konteks atau persekitaran yang hampir menyerupai situasi kehidupan sebenar.
• Projek ialah aktiviti di mana kekangan masa telah banyak dibuang dan boleh dilaksanakan
secara individu atau kumpulan, dan biasanya melibatkan elemen penting kerja yang
dilakukan di rumah atau di luar sekolah.
• Projek berasaskan penyelidikan lebih bersifat teori dan mungkin terdiri daripada
mengemukakan soalan, merumuskan masalah atau menubuhkan beberapa hipotesis.
• Projek berasaskan produk ialah penghasilan objek konkrit, perkhidmatan, persembahan

tarian, filem, pameran, drama, program komputer dan sebagainya.
• Kerja projek ialah pengalaman pembelajaran yang membolehkan perkembangan pengetahuan,

kemahiran dan sikap tertentu yang menyediakan pelajar untuk pembelajaran sepanjang
hayat dan cabaran yang akan datang. Ia melibatkan aplikasi pengetahuan, kerjasama,
komunikasi dan pembelajaran bebas.

• Projek yang berkesan harus mengandungi elemen seperti situasi atau masalah, penerangan dan tujuan
projek, spesifikasi prestasi, peraturan, peranan ahli dan penilaian.
• Enam AÊs sesuatu projek ialah ketulenan, ketelitian akademik, pembelajaran gunaan, penerokaan aktif,
perhubungan dewasa dan amalan penilaian.
• Bekerja dalam kumpulan telah menjadi sebahagian daripada pembelajaran yang diterima kerana faedah
yang diiktiraf secara meluas daripada kerja kumpulan kolaboratif untuk pembelajaran pelajar.
• Pelbagai cara untuk memperuntukkan markah kepada kerja projek termasuk markah kumpulan yang
dikongsi, markah yang dikongsi, markah individu, markah individu (peperiksaan) dan gabungan purata
kumpulan dan markah individu.
• Penilaian kendiri ialah satu proses di mana pelajar belajar tentang diri mereka, contohnya, apa yang
mereka telah pelajari tentang projek, bagaimana mereka telah belajar dan bagaimana mereka bertindak
balas dalam situasi tertentu semasa menjalankan projek.
• Portfolio ialah koleksi bermatlamat karya yang dihasilkan oleh pelajar yang mencerminkan usaha, kemajuan
dan pencapaian mereka dalam pelbagai bidang kurikulum.
• Guru perlu mengetahui kebaikan dan kelemahan portfolio untuk menggunakannya untuk membantu
pembelajaran pelajar.
Artifak Reka bentuk projek
Kerja berkumpulan Idea projek
Peruntukan markah Projek
Penilaian rakan sebaya Projek berasaskan penyelidikan
Penilaian berasaskan prestasi Penilaian diri
Portfolio Tanda kumpulan yang dikongsi
Projek berasaskan produk Markah yang dikongsi

Topik ÿ Kebolehpercayaan
dan Kesahan Ujian
8
HASIL PEMBELAJARAN
1. Menerangkan konsep skor benar;
2. Bandingkan teknik yang berbeza untuk menganggar kebolehpercayaan a

ujian;
3. Bandingkan teknik yang berbeza untuk mewujudkan kesahan a

ujian; dan
4. Bincangkan hubungan antara kebolehpercayaan dan kesahan.
ÿ PENGENALAN
Dalam topik ini kita akan menangani dua isu penting iaitu kebolehpercayaan dan kesahan sesuatu
penilaian. Bagaimanakah kita memastikan bahawa teknik yang kita gunakan untuk menilai pengetahuan,
kemahiran dan nilai pelajar adalah boleh dipercayai dan sah? Kami sedang membuat keputusan penting
tentang kebolehan dan keupayaan generasi masa depan kami, jadi jelas sekali kami ingin memastikan
bahawa kami membuat keputusan yang betul.
8.1 APA ITU KEBOLEHPERCAYAAN?
Anda telah memberikan ujian geometri kepada sekumpulan pelajar Tingkatan Empat dan seorang
daripada pelajar anda, Swee Leong, memperoleh markah 66 peratus dalam ujian tersebut. Sejauh
manakah anda pasti bahawa markah itu adalah yang sepatutnya diterima oleh Swee Leong? Dengan
kata lain, adakah itu markah sebenar beliau? Apabila anda membangunkan ujian dan mentadbirkannya
kepada pelajar anda, anda cuba mengukur, sejauh mungkin, markah sebenar pelajar anda. Skor
sebenar adalah konsep hipotesis kebolehan, kecekapan dan kapasiti sebenar

TOPIK 8 UJIAN KEBOLEHPERCAYAAN DAN KESAHAN ÿ 161
seorang individu. Ujian cuba mengukur markah sebenar seseorang. Apabila mengukur
kebolehan manusia, hampir mustahil untuk membangunkan ujian bebas ralat.
Walau bagaimanapun, hanya kerana terdapat kesilapan, itu tidak bermakna ujian itu
tidak baik. Faktor yang lebih penting ialah saiz ralat.
X,
Secara formal, skor ujian yang diperhatikan, T, .
difikirkan sebagai jumlah skor benar, dan
istilah ralat, berulang
Skorkali
DAN
sebenar
diberikan
ditakrifkan
kepadasebagai
pelajar (dan
purata
pelajar
markah
boleh
ujian
dibuat
jika ujian
untukialah
melupakan kandungan ujian di antara pentadbiran berulang). Memandangkan skor benar
ditakrifkan sebagai purata markah yang diperhatikan, dalam setiap pentadbiran sesuatu
ujian, skor yang diperhatikan berlepas daripada skor sebenar dan perbezaan itu dipanggil
ralat pengukuran. Pemergian ini bukan disebabkan oleh kesilapan terang-terangan yang
dibuat oleh penulis ujian tetapi ia disebabkan oleh beberapa elemen peluang dalam
prestasi pelajar semasa ujian.
Skor Diperhatikan = Skor Benar + Ralat
Ralat pengukuran kebanyakannya berpunca daripada fakta bahawa kami hanya mencuba
sebahagian kecil daripada keupayaan pelajar. Soalan yang samar-samar dan tanda yang salah
boleh menyumbang kepada ralat pengukuran tetapi ia hanya sebahagian kecil daripada ralat
pengukuran. Bayangkan jika terdapat 10,000 item dan seorang pelajar boleh memperoleh 60
peratus daripada semua 10,000 item yang ditadbir (yang secara praktikalnya tidak boleh
dilaksanakan). Kemudian 60 peratus adalah skor sebenar. Kini apabila anda mencuba hanya 40
item dalam ujian, skor yang dijangkakan untuk pelajar ialah 24 item. Tetapi pelajar mungkin
mendapat 20, 26, 30 dan seterusnya bergantung pada item yang ada dalam ujian. Dalam contoh
ini, ini adalah sumber utama ralat pengukuran. Maksudnya, ralat pengukuran adalah disebabkan
oleh pensampelan item dan bukannya item yang ditulis dengan buruk.
Ralat mungkin datang dari pelbagai sumber seperti dalam pengambil ujian (pelajar),
dalam ujian (soalan tidak jelas), dalam pentadbiran ujian atau semasa pemarkahan (atau
pemarkahan). Sebagai contoh, keletihan, sakit, meniru atau pun perasan yang tidak
disengajakan terhadap jawapan pelajar lain semuanya menyumbang kepada kesilapan
dari dalam pengambil ujian.
Secara amnya, lebih kecil ralat, lebih besar kemungkinan anda lebih dekat untuk mengukur skor
sebenar pelajar. Jika anda yakin bahawa ujian geometri anda (skor yang diperhatikan) mempunyai
ralat kecil, maka anda dengan yakin boleh membuat kesimpulan bahawa skor Swee LeongÊs
sebanyak 66 peratus adalah hampir dengan markah sebenar beliau atau keupayaan sebenar
beliau dalam menyelesaikan masalah geometri, dengan kata lain, apakah dia sebenarnya tahu.
Untuk mengurangkan ralat dalam ujian, anda mesti memastikan bahawa ujian anda boleh
dipercayai dan sah. Semakin tinggi kebolehpercayaan dan kesahan ujian anda, semakin besar
kemungkinan anda akan mengukur skor sebenar pelajar anda.

162 ÿ TOPIK 8 KEBOLEHPERCAYAAN DAN KESAHAN UJIAN
Kami akan mengkaji dahulu kebolehpercayaan sesuatu ujian. Apakah kebolehpercayaan?

Kebolehpercayaan ialah ketekalan pengukuran. Adakah pelajar anda akan mendapat markah
yang sama jika mereka mengambil ujian anda pada dua kali berbeza? Adakah mereka akan
mendapat markah yang lebih kurang sama jika mereka mengambil dua bentuk ujian anda yang
berbeza? Soalan-soalan ini mempunyai kaitan dengan ketekalan ujian bilik darjah anda dalam
mengukur kebolehan, kemahiran dan sikap atau nilai pelajar. Nama generik untuk konsistensi
ialah kebolehpercayaan. Kebolehpercayaan adalah ciri penting bagi ujian yang baik kerana jika
ujian tidak mengukur secara konsisten (boleh dipercayai), maka anda tidak boleh mengira markah
yang terhasil daripada pentadbiran ujian (Jacobs, 1991).
8.2 KOEFISIEN KEBOLEHPERCAYAAN
Kebolehpercayaan dikira sebagai pekali kebolehpercayaan. Simbol yang digunakan untuk menandakan
pekali kebolehpercayaan adalah rdengan
amnyadua
ditakrifkan
subskripsebagai
yang sama
varians
(). Pekali rxxvarians
skor sebenar
kebolehpercayaan
dibahagikan
skor yang
secara
dengan
diperhatikan. Berikut ialah persamaan.
2
Varians Skor Benar ÿ Skor Benar
r xx ÿ ÿ
2
Varians Skor Yang Diperhatikan ÿ Skor Diperhatikan
Sekiranya terdapat ralat yang agak sedikit, nisbah varians skor benar kepada varians skor yang
diperhatikan menghampiri pekali kebolehpercayaan 1.00 yang merupakan kebolehpercayaan yang
sempurna. Sekiranya terdapat jumlah ralat yang agak besar, nisbah varians skor benar kepada varians
skor yang diperhatikan menghampiri 0.00 iaitu jumlah tidak boleh dipercayai.
Ujian tanpa kebolehpercayaan Uji dengan kebolehpercayaan yang sempurna

0.00 1.00
Kebolehpercayaan yang tinggi bermakna soalan-soalan sesuatu ujian cenderung untuk „menarik bersama‰.
Pelajar yang menjawab soalan yang diberikan dengan betul lebih berkemungkinan menjawab
soalan lain dengan betul. Jika ujian setara atau selari dibangunkan dengan menggunakan item
yang serupa, skor relatif pelajar akan menunjukkan sedikit perubahan. Kebolehpercayaan yang
rendah bermakna soalan-soalan itu cenderung tidak berkaitan antara satu sama lain dari segi
siapa yang menjawabnya dengan betul. Kebolehpercayaan yang rendah bermakna soalan-soalan
itu cenderung tidak berkaitan antara satu sama lain dari segi siapa yang menjawabnya dengan betul. The

TOPIK 8 KEBOLEHPERCAYAAN DAN KESAHAN UJIAN ÿ 163
markah ujian yang terhasil mencerminkan bahawa ada sesuatu yang tidak kena dengan item atau situasi
ujian dan bukannya pengetahuan pelajar tentang perkara tersebut. Garis panduan berikut boleh digunakan
untuk mentafsir pekali kebolehpercayaan untuk ujian bilik darjah seperti yang ditunjukkan dalam Jadual
8.1.
Jadual 8.1: Tafsiran Pekali Kebolehpercayaan
Kebolehpercayaan Tafsiran
0.90 dan ke atas Kebolehpercayaan yang sangat baik (setanding dengan ujian piawai terbaik).
0.80 hingga 0.90 Sangat bagus untuk ujian bilik darjah.
0.70 hingga 0.80 Baik untuk ujian bilik darjah tetapi mungkin terdapat beberapa item yang boleh diperbaiki.
0.60 hingga 0.70 Agak rendah. Mungkin terdapat beberapa item yang boleh dialih keluar atau diperbaiki.
0.50ÿ0.60 Ujian itu perlu disemak.
0.50 dan ke bawah Kebolehpercayaan yang boleh dipersoalkan dan ujian harus diganti atau memerlukan
semakan besar.
Jika anda mengetahui pekali kebolehpercayaan sesuatu ujian, bolehkah anda menganggarkan markah sebenar
pelajar dalam sesuatu ujian? Dalam ujian, kami menggunakan Ralat Standard Pengukuran untuk
menganggarkan skor sebenar.
Ralat Piawai bagi Sisihan Piawai Pengukuran 1 ÿ ÿ
„ ‰
Catatan: r adalah kebolehpercayaan ujian.
Dengan menggunakan lengkung biasa, anda boleh menganggarkan skor sebenar pelajar dengan
beberapa tahap kepastian berdasarkan skor yang diperhatikan dan Ralat Standard Pengukuran.
Contohnya:
Anda memberikan ujian sejarah kepada kumpulan 40 pelajar. Khairul memperoleh markah 75 dalam ujian
tersebut iaitu markah yang diamatinya. Sisihan piawai ujian anda ialah 2.0.
Sebelum ini anda telah menetapkan bahawa ujian sejarah anda mempunyai pekali kebolehpercayaan 0.7.
Anda berminat untuk mengetahui skor sebenar KhairulÊ.
Ralat Piawai bagi Sisihan Piawai Pengukuran 1 ÿ ÿ
ÿ ÿÿ2.0
ÿ 1 0.7 2.0 0.55 1.1 ÿ

Oleh itu, berdasarkan keluk taburan normal (rujuk Rajah 8.1), skor sebenar KhairulÊ hendaklah:
(a) Antara 75 ÿ 1.1 dan 75 + 1.1 atau antara 73.9 dan 76.1 untuk 68% masa.
(b) Antara 75 ÿ 2.2 dan 75 + 2.2 atau antara 72.8 dan 77.2 untuk 95% masa.
(c) Antara 75 ÿ 3.3 dan 75 + 3.3 atau antara 71.7 dan 78.3 untuk 99% masa.
Rajah 8.1: Menentukan skor benar Khairul berdasarkan taburan normal
SEMAK KENDIRI 8.1
1. Tentukan kebolehpercayaan sesuatu ujian.
3. Apakah yang ditunjukkan oleh pekali kebolehpercayaan?
4. Terangkan konsep skor benar.
AKTIVITI 8.1
Shalin memperoleh markah 70 dalam ujian biologi. Kebolehpercayaan ujian adalah

0.65 dan sisihan piawai ujian ialah 1.5. Kira skor sebenar
daripada Shalin untuk ujian biologi.
(int: Gunakan 1 ralat ukuran standard)
forum.

8.3 KAEDAH MENGANGGAR KEBOLEHPERCAYAAN

DARI SATU UJIAN
Sekarang mari kita bincangkan bagaimana kita menganggarkan kebolehpercayaan sesuatu ujian. Rajah 8.2
menyenaraikan tiga kaedah biasa untuk menganggarkan kebolehpercayaan sesuatu ujian. Tidak mungkin untuk mengira
kebolehpercayaan dengan tepat dan oleh itu kita perlu menganggarkan kebolehpercayaan.
Rajah 8.2: Kaedah untuk menganggar kebolehpercayaan
Sekarang mari kita lihat setiap kaedah secara terperinci.
(a) Uji-uji semula

Menggunakan teknik ujian-ujian semula, ujian yang sama ditadbir sekali lagi kepada
kumpulan pelajar yang sama. Markah yang diperolehi dalam pentadbiran pertama
ujian dikaitkan dengan markah yang diperoleh dalam pentadbiran kedua ujian.
Sekiranya korelasi antara dua markah adalah tinggi, maka ujian tersebut boleh
dianggap mempunyai kebolehpercayaan yang tinggi. Walau bagaimanapun, situasi
ujian-ujian semula agak sukar untuk dijalankan kerana tidak mungkin pelajar akan
bersedia untuk mengambil ujian yang sama dua kali.
Terdapat juga kesan amalan dan ingatan yang mungkin mempengaruhi korelasi.
Semakin pendek jurang masa, semakin tinggi korelasi; semakin lama jurang masa,
semakin rendah korelasi. Ini kerana kedua-dua pemerhatian itu berkaitan dari semasa
ke semasa. Oleh kerana korelasi ini ialah anggaran ujian-uji semula kebolehpercayaan,
anda boleh memperoleh anggaran yang jauh berbeza bergantung pada selang.
(b) Bentuk Selari atau Setara Untuk

teknik ini, dua ujian (atau bentuk) yang setara diberikan kepada kumpulan pelajar
yang sama. Kedua-dua ujian tidak serupa tetapi setara. Dalam erti kata lain, mereka
mungkin mempunyai soalan yang berbeza tetapi mereka mengukur pengetahuan,
kemahiran atau sikap yang sama. Oleh itu, anda mempunyai dua set skor yang
berkorelasi dan kebolehpercayaan boleh diwujudkan. Tidak seperti teknik ujian-uji
semula, ukuran kebolehpercayaan bentuk selari atau setara tidak terjejas

oleh pengaruh ingatan. Satu masalah utama dengan pendekatan ini ialah anda
perlu dapat menjana banyak item yang mencerminkan binaan yang sama. Ini
selalunya bukan satu pencapaian yang mudah.
(c) Ketekalan Dalaman

Ketekalan dalaman ditentukan menggunakan hanya satu ujian yang diberikan sekali kepada
pelajar. Konsistensi dalaman merujuk kepada bagaimana item atau soalan individu
berkelakuan berhubung antara satu sama lain dan dengan ujian keseluruhan. Sebenarnya,
kami menilai kebolehpercayaan instrumen dengan menganggar sejauh mana item yang
mencerminkan konstruk yang sama menghasilkan keputusan yang serupa. Kami sedang
melihat sejauh mana keputusan yang konsisten untuk item yang berbeza untuk binaan yang sama dalam ukuran.
Berikut ialah dua ukuran konsistensi dalaman biasa yang boleh digunakan.
(i) Split-half
Untuk menyelesaikan masalah perlu mentadbir ujian yang sama dua
kali, teknik split-half digunakan. Dalam teknik split-half, ujian diberikan
sekali kepada kumpulan pelajar. Ujian dibahagikan kepada dua
bahagian yang sama selepas pelajar menyelesaikan ujian. Teknik ini
paling sesuai untuk ujian yang merangkumi item aneka pilihan, item
palsu benar dan mungkin esei jawapan pendek. Item dipilih berdasarkan
kaedah ganjil-genap di mana separuh daripada ujian terdiri daripada
item bernombor ganjil manakala separuh lagi terdiri daripada item bernombor genap.
Kemudian, markah yang diperolehi bagi kedua-dua bahagian tersebut dikorelasikan
untuk menentukan kebolehpercayaan keseluruhan ujian menggunakan pekali korelasi
Spearman-Brown.
2r
r ÿ xy
sb
ÿ1ÿ r ÿ
xy
Dalam formula sb r ialah pekali kebolehpercayaan belah separuh dan r xy

ini, mewakili korelasi antara dua bahagian. Katakan sebagai contoh,
anda telah menetapkan bahawa pekali korelasi antara dua bahagian
ialah 0.65. Apakah kebolehpercayaan keseluruhan ujian?
2r 2 0.65 ÿ ÿ 1. 3
r ÿ xy ÿ ÿÿ
0.78
sb 1 ÿ0.65 1.65
ÿ1 ÿ r ÿ
xy

(ii) Alpha CronbachÊs

Alpha CronbachÊs coefficient alpha boleh digunakan untuk kedua-dua jenis
binari (1 = betul, 0 = salah atau 1 = benar dan 0 = salah) dan item skala (1 =
sangat setuju, 2 = setuju, 3 = tidak setuju, 4 = sangat tidak setuju).
Kebolehpercayaan dianggarkan dengan mengira korelasi antara soalan individu
dan sejauh mana soalan individu berkorelasi dengan jumlah ujian. Ini
dimaksudkan dengan konsistensi dalaman. Kuncinya ialah „dalaman‰. Ia tidak
seperti bentuk ujian-semula dan selari atau setara yang memerlukan ujian lain
sebagai rujukan luaran. Lebih kuat item saling berkaitan, lebih besar
kemungkinan ujian itu konsisten. Lebih tinggi alfa, lebih dipercayai adalah ujian.
Secara amnya tiada pemotongan yang dipersetujui. Biasanya 0.7 dan ke atas
boleh diterima (Nunnally, 1978).
Formula untuk alpha Cronbach adalah seperti berikut:
ÿ
k ÿ
k
ÿ ÿ pi ÿ1
ÿ
pi ÿ ÿ
ÿ
i 1
Alpha Cronbach ÿÿ ÿ ÿ
1 ÿ
ÿ
2
k ÿ
1 ÿ
x
ÿ ÿ
• k ialah bilangan item dalam ujian;
• pi merujuk kepada kesukaran item iaitu nisbah pelajar yang menjawab item
dengan betul; dan i
2
• ÿ
x ialah varians sampel untuk jumlah skor.
Sebagai
contoh: Katakan dalam ujian aneka pilihan yang terdiri daripada lima item atau
soalan, indeks kesukaran berikut bagi setiap item diperhatikan: 2 ÿ 0.5, = 0.75
hlm1 = 0.4, hlmdan = 0.85. = 0.6, hlm
hlm3 Varians sampel 4 hlm5
2
(ÿ x ) = 1.84. CronbachÊs alpha akan dikira seperti berikut:
ÿ 5 1.045 0.54
ÿ
ÿ ÿ ÿÿÿÿ1 ÿ
5 ÿ1 ÿ 1.840

Ujian piawai yang dibangunkan secara profesional harus mempunyai pekali

ketekalan dalaman sekurang-kurangnya 0.85. Pekali kebolehpercayaan yang
tinggi diperlukan untuk ujian piawai kerana ia ditadbir sekali sahaja dan skor pada
satu ujian itu digunakan untuk membuat kesimpulan tentang setiap tahap pelajar
pada konstruk yang diukur. Mungkin, yang paling hampir dengan ujian standard
dalam konteks Malaysia ialah ujian untuk mata pelajaran berbeza yang dijalankan
di peringkat kebangsaan dalam peperiksaan PT3 dan SPM. Menurut Wells dan
Wollack (2003), adalah boleh diterima untuk ujian bilik darjah mempunyai pekali
kebolehpercayaan 0.70 dan lebih tinggi kerana markah pelajar pada mana-mana
satu ujian tidak menentukan keseluruhan gred pelajar dalam subjek atau kursus.
Biasanya, gred adalah berdasarkan beberapa ukuran lain seperti kerja projek,
pembentangan lisan, ujian amali, penyertaan kelas dan sebagainya. Sejauh
manakah perkara ini benar dalam bilik darjah Malaysia?
Kata Awas!
Apabila anda memperoleh alfa rendah, anda harus berhati-hati untuk tidak membuat kesimpulan
segera bahawa ujian itu adalah ujian yang buruk. Anda harus menyemak untuk menentukan
sama ada ujian mengukur beberapa atribut atau dimensi dan bukannya satu atribut atau
dimensi. Jika ia berlaku, terdapat kemungkinan alfa Cronbach akan dikempiskan. Sebagai
contoh, Ujian Aptitud mungkin mengukur tiga sifat atau dimensi seperti kebolehan kuantitatif,
kebolehan bahasa dan kebolehan analisis. Oleh itu, tidak menghairankan bahawa alfa
Cronbach untuk keseluruhan ujian mungkin rendah kerana soalan mungkin tidak berkorelasi antara satu sama lain.
kenapa? Ini kerana item tersebut mengukur tiga jenis kebolehan manusia yang berbeza.
Penyelesaiannya adalah untuk mengira tiga alpha Cronbach berbeza; satu untuk kebolehan
kuantitatif, satu untuk kebolehan bahasa dan satu untuk kebolehan analitikal yang memberitahu
anda lebih lanjut tentang ketekalan dalaman item dalam ujian.
SEMAK KENDIRI 8.2
1. Apakah kelebihan utama teknik split-half berbanding teknik ujian semula ujian
dalam menentukan kebolehpercayaan sesuatu ujian?
2. Menerangkan teknik bentuk selari atau setara dalam menentukan

kebolehpercayaan sesuatu ujian.
3. Menerangkan konsep kebolehpercayaan ketekalan dalaman sesuatu ujian.

8.4 INTER-RATER DAN INTRA-RATER

KEBOLEHPERCAYAAN
Setiap kali anda menggunakan manusia sebagai sebahagian daripada prosedur pengukuran anda,
anda perlu bimbang sama ada keputusan yang anda perolehi boleh dipercayai atau konsisten. Orang
ramai terkenal dengan ketidakkonsistenan mereka. Kita mudah terganggu. Kami bosan melakukan
tugasan yang berulang-ulang. Kami mengelamun. Kami salah tafsir. Jadi, bagaimana kita menentukan
sama ada:
(a) Dua pemerhati sedang konsisten dalam pemerhatian mereka?
(b) Dua pemeriksa konsisten dalam menanda esei?
(c) Dua pemeriksa konsisten dalam pemarkahan projek?
Untuk mencari jawapan kepada soalan ini, mari kita membaca lebih lanjut tentang kebolehpercayaan
antara penilai dan kebolehpercayaan dalam penilai.
(a) Kebolehpercayaan Antara

Penilai Apabila dua orang atau lebih menandakan soalan esei, sejauh mana terdapat
persetujuan dalam markah yang diperuntukkan dipanggil kebolehpercayaan antara penilai
(rujuk Rajah 8.3). Semakin besar perjanjian, semakin tinggi kebolehpercayaan antara penilai.
Rajah 8.3: Pemeriksa A lwn Pemeriksa B
Kebolehpercayaan antara penilai boleh menjadi rendah kerana sebab berikut:
(i) Pemeriksa secara tidak sedar dipengaruhi oleh pengetahuan tentang

pelajar yang skripnya ditanda;
(ii) Ketekalan dalam pemarkahan terjejas selepas menandakan satu set sama ada skrip yang
sangat baik atau sangat lemah;

(iii) Apabila terdapat gangguan semasa penandaan kumpulan skrip, piawaian berbeza boleh
digunakan selepas rehat; dan
(iv) Skema pemarkahan kurang dibangunkan menyebabkan pemeriksa membuat tafsiran

sendiri terhadap jawapan.
Menurut Frith dan Macintosh (1987), kebolehpercayaan antara penilai boleh dipertingkatkan
jika kriteria untuk penandaan atau skema pemarkahan:
(i) Mengandungi cadangan jawapan yang berkaitan dengan soalan;
(ii) Telah membuat peruntukan untuk jawapan alternatif yang boleh diterima;
(iii) Memastikan masa yang diperuntukkan bersesuaian dengan kerja yang diperlukan;
(iv) Dipecahkan secukupnya untuk membolehkan pemarkahan menjadi seobjektif mungkin dan
penjumlahan markah adalah betul; dan
(v) Memperuntukkan markah mengikut tahap kesukaran soalan.
(b) Kebolehpercayaan Intrapenilai

Walaupun kebolehpercayaan antara penilai melibatkan dua atau lebih individu, kebolehpercayaan
intra-penilai ialah ketekalan penggredan oleh penilai tunggal. Markah pada ujian dinilai oleh
penilai tunggal pada masa yang berbeza. Apabila kami menilai ujian pada masa yang berbeza,
kami mungkin menjadi tidak konsisten dalam penggredan kami atas pelbagai sebab. Sebagai
contoh, sesetengah kertas yang digredkan pada siang hari mungkin mendapat perhatian penuh
kami manakala yang lain yang digredkan menjelang penghujung hari mungkin dikilapkan
dengan cepat. Begitu juga, perubahan dalam mood kita boleh menjejaskan penggredan kertas.
Dalam situasi ini, kekurangan ketekalan boleh menjejaskan kebolehpercayaan intra dalam
penggredan jawapan pelajar.
SEMAK KENDIRI 8.3
Senaraikan langkah-langkah yang boleh diambil untuk meningkatkan kebolehpercayaan antara

penilai dalam penggredan skrip jawapan esei.

AKTIVITI 8.1
Cadangkan langkah lain yang anda akan ambil untuk meningkatkan kebolehpercayaan
dalam penilai dalam penggredan tugasan pelajar.
forum.
8.5 JENIS-JENIS KESAHAN
Apakah kesahan? Kesahan sering ditakrifkan sebagai sejauh mana sesuatu ujian mengukur apa yang
direka bentuk untuk diukur (Nutall, 1987). Walaupun kebolehpercayaan berkaitan dengan ketekalan
ujian, kesahan berkaitan dengan kerelevanan ujian. Jika ia tidak mengukur apa yang ditetapkan untuk
diukur, maka penggunaannya adalah mengelirukan dan tafsiran berdasarkan ujian adalah tidak sah
atau relevan. Sebagai contoh, ujian yang sepatutnya mengukur „kebolehan mengeja kanak-kanak
berumur 8 tahun‰ tetapi tidak melakukannya bukanlah ujian yang sah. Ia akan menjadi bencana jika
anda membuat dakwaan tentang perkara yang boleh atau tidak boleh dilakukan oleh pelajar
berdasarkan ujian yang sebenarnya mengukur sesuatu yang lain. Atas sebab inilah ramai pendidik
berpendapat bahawa kesahan adalah aspek terpenting dalam sesuatu ujian. Walau bagaimanapun,
kesahan akan berbeza dari satu ujian ke satu ujian bergantung pada kegunaannya. Sebagai contoh,
ujian mungkin mempunyai kesahan yang tinggi dalam menguji ingatan fakta dalam ekonomi tetapi
ujian yang sama mungkin rendah dalam kesahan berkaitan dengan menguji aplikasi konsep dalam
ekonomi.
Messick (1989) amat mengambil berat tentang inferens yang dibuat oleh guru daripada markah ujian,
tafsiran yang dibuat oleh guru tentang pelajarnya dan akibat daripada inferens dan tafsiran tersebut.
Anda boleh bayangkan kuasa yang dipegang oleh seorang pendidik semasa mereka bentuk ujian.
Ujian anda boleh menentukan masa depan beribu-ribu pelajar. Inferens berdasarkan ujian kesahan
rendah boleh memberikan gambaran yang berbeza tentang kebolehan dan kecekapan sebenar pelajar.
Tiga jenis kesahan telah dikenal pasti: kesahan konstruk, kesahan kandungan dan kesahan berkaitan
kriteria yang terdiri daripada kesahan ramalan dan serentak (rujuk Rajah 8.4).

Rajah 8.4: Jenis kesahan
Sekarang mari kita ketahui lebih lanjut mengenai setiap jenis kesahihan.
(a) Kesahan Konstruk

Kesahan konstruk berkaitan sama ada ujian itu adalah ukuran yang mencukupi
bagi konstruk asas. Sesuatu konstruk boleh menjadi sebarang fenomena seperti
pencapaian matematik, kemahiran peta, kefahaman membaca, sikap terhadap
sekolah, penaakulan induktif, kesedaran alam sekitar, kebolehan mengeja dan
sebagainya. Anda mungkin menganggap kesahan membina sebagai isu
„pelabelan‰. Contohnya, apabila anda mengukur apa yang anda istilahkan sebagai
„pemikiran kritis‰, adakah itu yang anda ukur sebenarnya?
Oleh itu, untuk memastikan kesahan konstruk yang tinggi, anda mesti jelas tentang
definisi konstruk yang anda ingin ukur. Sebagai contoh, konstruk seperti pemahaman
bacaan akan merangkumi perkembangan perbendaharaan kata, membaca untuk
makna literal dan membaca untuk makna inferensi. Beberapa pakar dalam
pengukuran pendidikan berpendapat bahawa kesahan konstruk adalah jenis
kesahan yang paling kritikal. Anda boleh mewujudkan kesahan konstruk instrumen
dengan mengaitkannya dengan ujian lain yang mengukur konstruk yang sama.
Sebagai contoh, anda boleh membandingkan markah yang diperoleh pada ujian
pemahaman bacaan anda dengan markah yang diperoleh pada ujian pemahaman
bacaan terkenal lain yang diberikan kepada sampel pelajar yang sama. Jika markah
bagi kedua-dua ujian adalah sangat berkorelasi, maka anda boleh membuat
kesimpulan bahawa ujian kefahaman bacaan anda mempunyai kesahan konstruk yang tinggi.
Sesuatu konstruk ditentukan dengan merujuk kepada teori. Sebagai contoh, jika
anda berminat untuk mengukur konstruk „harga diri‰, anda perlu jelas apa itu
harga diri. Mungkin, anda perlu merujuk kepada literatur dalam bidang yang
menerangkan sifat-sifat harga diri. Anda akan mendapati bahawa secara teorinya,
harga diri dibuat daripada sifat-sifat berikut ÿ harga diri fizikal, harga diri akademik
dan harga diri sosial. Berdasarkan perspektif teori ini, anda boleh membina item
atau soalan untuk mengukur harga diri meliputi ketiga-tiga jenis penghargaan
kendiri ini. Melalui proses sedemikian anda akan lebih pasti untuk memastikan
kesahan konstruk yang tinggi.

(b) Kesahan Kandungan

Kesahan kandungan adalah lebih mudah dan berkemungkinan berkaitan dengan kesahan
konstruk. Ia melibatkan liputan kandungan yang sesuai dan perlu, sebagai contoh,
adakah ujian itu meliputi kemahiran yang diperlukan untuk prestasi yang baik atau semua
aspek subjek yang diajar? Ia berkenaan dengan keterwakilan sampel-populasi.
Maksudnya, fakta, konsep dan prinsip yang diliputi oleh item ujian harus mewakili domain
yang lebih besar (seperti sukatan pelajaran) fakta, konsep dan prinsip.
Sebagai contoh, unit Sains mengenai „Tenaga dan Daya‰ mungkin termasuk fakta,
konsep, prinsip dan kemahiran tentang cahaya, bunyi, haba, kemagnetan dan elektrik.
Walau bagaimanapun, adalah sukar, jika tidak mustahil, untuk mentadbir kertas dua
hingga tiga jam untuk menguji semua aspek sukatan pelajaran mengenai „Tenaga dan
Daya‰ (rujuk Rajah 8.5). Oleh itu, hanya fakta, konsep, prinsip dan kemahiran terpilih
daripada sukatan pelajaran (atau domain) sahaja yang dijadikan sampel. Kandungan
yang dipilih akan ditentukan oleh pakar kandungan yang akan menilai kaitan kandungan
dalam ujian dengan kandungan dalam sukatan pelajaran atau domain tertentu.
Rajah 8.5: Sampel kandungan yang diuji untuk unit pada „Tenaga dan Daya‰
Kesahan kandungan akan menjadi rendah jika soalan dalam ujian termasuk kandungan
pengujian yang tidak termasuk dalam domain atau sukatan pelajaran. Untuk memastikan
kesahan kandungan dan liputan, kebanyakan guru menggunakan Jadual Spesifikasi
(seperti yang dibincangkan dalam Topik 3). Jadual 8.2 ialah contoh Jadual Spesifikasi
yang menyatakan pengetahuan dan kemahiran yang akan diukur dan topik yang diliputi
untuk unit mengenai „Tenaga dan Daya‰. Anda tidak boleh mengukur semua kandungan
sesuatu topik, oleh itu, anda perlu memberi tumpuan kepada bidang utama dan
memberikan wajaran yang sewajarnya kepada bidang yang penting. Sebagai contoh,
guru telah memutuskan bahawa 64 peratus soalan akan menekankan kepada pemahaman konsep man

36 peratus akan memberi tumpuan kepada aplikasi konsep untuk lima topik. Jadual
Spesifikasi menyediakan bukti kepada guru bahawa sesuatu ujian mempunyai
kesahan kandungan yang tinggi dan ia meliputi perkara yang perlu diliputi.
Jadual 8.2: Jadual Spesifikasi Unit mengenai „Tenaga dan Daya‰
Pemahaman tentang Permohonan Jumlah

Topik
Konsep Konsep
Cahaya 7 4 11 (22%)
Bunyi 7 4 11 (22%)
Haba 7 4 11 (22%)
Kemagnetan 3 3 6 (11%)
Elektrik 8 3 11 (22%)
JUMLAH 32 (64%) 18 (36%) 50
Kesahan kandungan adalah berbeza daripada kesahan muka yang merujuk kepada
perkara yang kelihatan untuk diukur oleh ujian secara cetek. Kesahan muka menilai
sama ada ujian „kelihatan sah‰ kepada pemeriksa, kakitangan pentadbiran yang
memutuskan penggunaannya dan pemerhati lain yang tidak terlatih secara teknikal.
Kesahan muka adalah ukuran kesahihan yang lemah tetapi itu tidak bermakna ia
tidak betul, cuma perlu berhati-hati. Kepentingannya tidak boleh dipandang remeh.
(c) Kesahan Berkaitan Kriteria

Kesahan berkaitan kriteria sesuatu ujian diwujudkan dengan mengaitkan markah
yang diperolehi dengan markah beberapa kriteria lain atau ujian lain.
Terdapat dua jenis kesahan berkaitan kriteria:
(i) Kesahan ramalan berkaitan sama ada ujian meramalkan dengan tepat beberapa
prestasi atau keupayaan masa hadapan. Adakah peperiksaan STPM merupakan
peramal yang baik terhadap prestasi di universiti? Satu kesukaran dalam
mengira kesahan ramalan STPM adalah kerana hanya mereka yang lulus
peperiksaan sahaja yang melanjutkan pelajaran ke universiti (secara amnya)
dan kita tidak tahu sejauh mana pelajar yang tidak lulus peperiksaan mungkin
telah melakukan (Wood, 1991). Lebih-lebih lagi, hanya sebahagian kecil
penduduk yang menduduki peperiksaan STPM. Oleh itu, korelasi antara gred
STPM dan prestasi di peringkat ijazah adalah agak tinggi.

(ii) Kesahan serentak mengambil berat tentang sama ada ujian itu berkorelasi dengan, atau
memberikan keputusan yang sama dengan ujian lain dengan kemahiran yang sama.
Sebagai contoh, adakah ujian bahasa akhir tahun anda berkaitan dengan peperiksaan
MUET? Dengan kata lain, jika ujian bahasa anda berkorelasi tinggi dengan MUET,
maka ujian bahasa anda mempunyai kesahan serentak yang tinggi.
8.6 FAKTOR-FAKTOR YANG MEMPENGARUHI KEBOLEHPERCAYAAN DAN
SAH
Deale (1975) mencadangkan bahawa untuk menyediakan ujian yang boleh diterima dan boleh
dipercayai, faktor-faktor ini harus diambil kira:
(a) Tempoh Ujian

Secara amnya, semakin lama ujian, semakin dipercayai dan sah ujian tersebut. Ujian
pendek tidak akan mencukupi untuk kerja setahun. Sukatan pelajaran perlu dijadikan
sampel. Ujian hendaklah mengandungi soalan yang mencukupi yang mewakili pengetahuan,
kemahiran dan kecekapan dalam sukatan pelajaran. Walau bagaimanapun, terdapat juga
masalah dengan ujian yang terlalu panjang. Ujian yang panjang mungkin sah tetapi ia akan
mengambil terlalu banyak masa dan keletihan mungkin berlaku, yang boleh menjejaskan
prestasi dan kebolehpercayaan ujian.
(b) Pemilihan Topik

Topik-topik yang dipilih dan soalan-soalan ujian yang disediakan hendaklah menggambarkan
cara topik-topik tersebut ditangani semasa pengajaran dan pembelajaran. Adalah perlu
untuk menjadi jelas tentang hasil pembelajaran dan mereka bentuk item yang mengukur
hasil pembelajaran ini. Sebagai contoh, dalam pengajaran anda, pelajar tidak diberi peluang
untuk berfikir secara kritis dan menyelesaikan masalah. Walau bagaimanapun, ujian anda
terdiri daripada item yang memerlukan pelajar berfikir secara kritis dan menyelesaikan
masalah. Dalam keadaan sedemikian, kebolehpercayaan dan kesahan ujian akan terjejas.
(c) Pilihan Teknik Pengujian

Teknik pengujian yang dipilih juga akan mempengaruhi kebolehpercayaan dan kesahan.
Sebagai contoh, jika anda memilih untuk menggunakan soalan esei, kesahan mungkin
tinggi tetapi kebolehpercayaan mungkin rendah. Soalan esei cenderung kurang dipercayai
daripada soalan jawapan pendek. Esei berstruktur biasanya lebih dipercayai daripada esei
terbuka.

(d) Kaedah Pentadbiran Ujian

Pentadbiran ujian juga merupakan langkah penting dalam proses pengukuran.
Ini termasuk penyusunan item dalam ujian, pemantauan pengambilan ujian dan
penyediaan fail data daripada buku kecil ujian. Prosedur pentadbiran ujian yang
lemah boleh membawa kepada masalah dalam data yang dikumpul dan
mengancam kesahihan keputusan ujian.
Masa yang mencukupi mesti dibenarkan untuk majoriti pelajar menyelesaikan

ujian. Ini akan mengurangkan tekaan liar dan sebaliknya menggalakkan pelajar
berfikir dengan teliti tentang jawapan. Arahan perlu jelas untuk mengurangkan
kesan kekeliruan terhadap kebolehpercayaan dan kesahan. Keadaan fizikal di
mana ujian diambil mestilah sesuai untuk pelajar. Mesti ada ruang yang
mencukupi, pencahayaan dan suhu yang sesuai. Pelajar mesti boleh bekerja
secara berdikari dan kemungkinan gangguan dalam bentuk pergerakan dan
bunyi bising mesti dijaga.
(e) Kaedah Pemarkahan

Penandaan hendaklah seobjektif mungkin. Pemarkahan yang bergantung kepada
pelaksanaan pertimbangan manusia seperti dalam esei, pemerhatian aktiviti bilik
darjah dan amalan hands-on adalah tertakluk kepada variasi kesilapan manusia.
(Rujuk kepada kebolehpercayaan antara penilai yang dibincangkan dalam
subtopik terdahulu.) Agak mudah untuk menandakan item objektif dengan cepat,
tetapi ia juga sangat mudah untuk membuat kesilapan cuai. Ini benar terutamanya
apabila sejumlah besar skrip ditanda. Sistem semakan amat dinasihatkan. Satu
kaedah adalah melalui komen pelajar sendiri apabila kertas bertanda mereka
dikembalikan kepada mereka.
8.7 HUBUNGAN ANTARA KEBOLEHPERCAYAAN

DAN KESAHAN
Sesetengah orang mungkin menganggap kebolehpercayaan dan kesahan sebagai dua konsep yang
berasingan. Pada hakikatnya, kebolehpercayaan dan kesahan adalah berkaitan. Trochim (2005)
memberikan analogi berikut (rujuk Rajah 8.6).

Rajah 8.6: Perwakilan grafik hubungan antara kebolehpercayaan dan kesahan
Pusat atau bullseye adalah konsep yang kita cuba ukur. Katakan sebagai contoh, dalam
cuba mengukur konsep „penaakulan induktif‰, anda berkemungkinan besar akan mencapai
titik tengah (atau mata besar) jika ujian penaakulan induktif anda boleh dipercayai dan sah,
yang merupakan matlamat untuk dicapai oleh semua pembangun ujian (lihat Rajah 8.6(d)).
Sebaliknya, ujian penaakulan induktif anda boleh dipercayai tetapi tidak sah.
Bagaimana mungkin? Ujian anda mungkin tidak mengukur penaakulan induktif tetapi skor
yang anda perolehi setiap kali anda mentadbir ujian adalah lebih kurang sama (lihat Rajah
8.6(b)). Dalam erti kata lain, ujian secara konsisten dan sistematik mengukur konstruk yang
salah (itu bukan penaakulan induktif). Bayangkan akibat membuat pertimbangan tentang
penaakulan induktif pelajar menggunakan ujian sedemikian!
Dalam konteks ujian psikologi, jika instrumen tidak mempunyai kebolehpercayaan yang
memuaskan, seseorang biasanya tidak boleh menuntut kesahihan. Kesahan memerlukan
instrumen yang cukup dipercayai. Rajah dalam Rajah 8.6(c) tidak mempunyai kesahan
kerana kebolehpercayaan adalah rendah. Dalam erti kata lain, anda tidak mendapat
anggaran yang sah tentang keupayaan penaakulan induktif pelajar anda kerana mereka tidak konsisten.
Senario kes terburuk ialah apabila ujian tidak boleh dipercayai dan tidak sah (lihat Rajah
8.6(a)). Dalam senario ini, markah yang diperoleh oleh pelajar cenderung untuk menumpukan
pada separuh bahagian atas sasaran dan mereka secara konsisten kehilangan pusat.
Ukuran anda dalam kes ini tidak boleh dipercayai dan tidak sah dan ujian itu harus ditolak
atau diperbaiki.

• Skor sebenar adalah konsep hipotesis tentang keupayaan, kecekapan dan kebolehan sebenar
kapasiti seseorang individu.
• Semakin tinggi kebolehpercayaan dan kesahan ujian anda, semakin besar kemungkinannya
anda akan mengukur markah sebenar pelajar anda.
• Kebolehpercayaan merujuk kepada ketekalan sesuatu ukuran. Sesuatu ujian dianggap boleh dipercayai jika
kita mendapat keputusan yang sama berulang kali.
• Kesahan memerlukan instrumen yang cukup dipercayai.
• Kesahan muka ialah ukuran kesahan yang lemah.
• Menggunakan teknik ujian-uji semula, ujian yang sama ditadbir sekali lagi kepada kumpulan pelajar yang sama.
• Untuk teknik bentuk selari atau setara, dua ujian (atau bentuk) setara diberikan kepada kumpulan pelajar yang
sama.
• Ketekalan dalaman ditentukan menggunakan hanya satu ujian yang diberikan sekali untuk
pelajar.
• Apabila dua orang atau lebih menanda soalan esei, sejauh mana terdapat persetujuan dalam markah yang
diperuntukkan dipanggil kebolehpercayaan antara penilai.
• Manakala kebolehpercayaan antara penilai melibatkan dua atau lebih individu, intra-penilai
kebolehpercayaan ialah ketekalan penggredan oleh penilai tunggal.
• Kesahan ialah sejauh mana sesuatu ujian mengukur apa yang didakwa untuk diukur. Adalah penting untuk
ujian itu sah agar keputusan dapat digunakan dan ditafsirkan dengan tepat.
• Kesahan konstruk berkaitan sama ada ujian adalah ukuran yang mencukupi bagi konstruk asas.
• Kesahan kandungan lebih mudah dan berkemungkinan berkaitan dengan kesahan konstruk. Ia berkaitan
dengan liputan kandungan yang sesuai dan perlu.
• Sesetengah orang mungkin menganggap kebolehpercayaan dan kesahan sebagai dua konsep yang berasingan. Dalam
realiti, kebolehpercayaan dan kesahan adalah berkaitan.

Kesahan binaan Kebolehpercayaan intra-penilai
Kesahan serentak Kesahan ramalan
Kesahan kandungan Kebolehpercayaan
Kesahan berkaitan kriteria Uji-uji semula
Kesahan muka Skor sebenar
Konsistensi dalaman Kesahan
Kebolehpercayaan antara penilai

Topik ÿ Menilai
Bilik Darjah
9 Ujian dan Item
Analisis
HASIL PEMBELAJARAN
1. Tentukan analisis item; 2.
Kira indeks kesukaran; 3. Kira indeks
diskriminasi; 4. Menganalisis keberkesanan
distraktor dalam soalan; 5. Bincangkan perkaitan antara indeks
kesukaran dengan
indeks diskriminasi sesuatu item; dan
6. Jelaskan peranan bank barang.
ÿ PENGENALAN
Apabila anda membangunkan ujian, adalah penting untuk mengenal pasti kekuatan dan
kelemahan setiap item. Dalam erti kata lain, untuk menentukan prestasi item dalam ujian,
beberapa prosedur statistik perlu digunakan.
Dalam topik ini, kita akan membincangkan analisis item yang melibatkan penggunaan tiga
prosedur iaitu kesukaran item, diskriminasi item dan analisis distraktor untuk membantu
pembangun ujian membuat keputusan sama ada item dalam sesuatu ujian boleh diterima,
diubah suai atau ditolak. Prosedur ini agak mudah dan mudah digunakan tetapi pendidik
perlu memahami logik yang mendasari analisis pelajar untuk menggunakannya dengan
betul dan berkesan.

TOPIK 9 MENILAI UJIAN BILIK DARJAH DAN ANALISIS ITEM ÿ 181
9.1 APA ITU ANALISIS ITEM?
Setelah menjalankan ujian dan menandakannya, kebanyakan guru akan membincangkan

jawapan dengan pelajar. Perbincangan biasanya akan tertumpu kepada jawapan yang betul dan
kesilapan biasa yang dibuat oleh pelajar. Sesetengah guru mungkin menumpukan pada soalan
yang kebanyakan pelajar berprestasi dengan baik dan soalan yang pelajar melakukannya
dengan sangat baik. Walau bagaimanapun, terdapat lebih banyak maklumat yang tersedia
tentang ujian yang sering diabaikan oleh guru. Maklumat ini hanya akan tersedia jika analisis item dijalankan.
Apakah analisis item? Analisis item ialah satu proses yang mengkaji respons kepada item atau
soalan ujian individu untuk menilai kualiti item tersebut dan ujian secara keseluruhan. Analisis
item amat berharga dalam menambah baik item atau soalan yang akan digunakan semula dalam
ujian nanti. Selain itu, ia juga boleh digunakan untuk menghapuskan item yang samar-samar
atau mengelirukan dalam satu pentadbiran ujian.
Khususnya dalam Teori Ujian Klasik (CTT) statistik yang dihasilkan daripada menganalisis
keputusan ujian berdasarkan markah ujian termasuk ukuran indeks kesukaran dan indeks
diskriminasi. Menganalisis keberkesanan distraktor juga menjadi sebahagian daripada proses.
Kami akan membincangkan setiap komponen analisis item ini secara terperinci kemudian.
Kualiti sesuatu ujian ditentukan oleh kualiti setiap item atau soalan dalam ujian tersebut. Guru
yang membina ujian hanya boleh menganggarkan secara kasar kualiti sesuatu ujian. Anggaran
ini adalah berdasarkan fakta bahawa guru telah mengikuti semua peraturan dan syarat
pembinaan ujian. Walau bagaimanapun, ada kemungkinan bahawa anggaran ini mungkin tidak
tepat dan aspek penting tertentu telah diabaikan. Oleh itu, adalah dicadangkan untuk
mendapatkan pemahaman yang lebih menyeluruh tentang ujian, analisis item perlu dijalankan
ke atas respons pelajar. Analisis item dijalankan untuk mendapatkan maklumat tentang item
atau soalan individu dalam sesuatu ujian dan bagaimana ujian itu boleh diperbaiki. Ia juga
memudahkan pembangunan item atau bank soalan yang boleh digunakan dalam pembinaan
ujian.
9.2 LANGKAH DALAM ANALISIS ITEM
Kedua-dua Teori Ujian Klasik (CTT) dan teori ujian moden seperti Teori Tindak Balas Item (IRT)
menyediakan statistik berguna untuk membantu kami menganalisis data ujian.
Untuk banyak analisis item CTT cukup untuk memberikan maklumat yang kami perlukan. Oleh
itu, CTT akan digunakan dalam modul ini.

182 ÿ TOPIK 9 MENILAI UJIAN BILIK DARJAH DAN ANALISIS ITEM
Mari kita ambil contoh seorang guru yang telah mentadbir ujian objektif aneka pilihan 30 item dalam
geografi kepada 45 pelajar dalam bilik darjah sekolah menengah.
(a) Langkah 1
Jelas sekali, apabila menerima helaian jawapan, langkah pertama ialah menanda setiap helaian
jawapan.
(b) Langkah 2
Susun 45 helaian jawapan daripada markah tertinggi yang diperoleh kepada markah terendah
yang diperoleh. Kertas yang mendapat markah tertinggi berada di atas dan kertas yang mendapat
markah terendah berada di bahagian bawah.
(c) Langkah 3
Darab 45 (bilangan kertas jawapan) dengan 0.27 (atau 27 peratus) iaitu 12.15 dan bundarkan
kepada 12. Penggunaan nilai 0.27 atau 27 peratus adalah tidak fleksibel. Adalah mungkin untuk
menggunakan sebarang peratusan antara 27 hingga 35 peratus sebagai nilai. Bagaimanapun
peraturan 27 peratus boleh diabaikan jika saiz kelas terlalu kecil. Daripada mengambil sampel 27
peratus, bahagikan bilangan kertas jawapan dengan 2.
(d) Langkah 4
Susun longgokan 45 helaian jawapan mengikut markah yang diperolehi (skor tertinggi hingga
markah terendah). Keluarkan 12 helaian jawapan dari bahagian atas longgokan dan 12 helaian
jawapan dari bahagian bawah longgokan. Panggil dua longgokan ini sebagai pelajar „markah
tinggi‰ dan pelajar „markah rendah‰. Ketepikan kumpulan tengah kertas (21 kertas). Walaupun
ini boleh dimasukkan dalam analisis, hanya menggunakan kumpulan tinggi dan rendah
memudahkan prosedur.
(e) Langkah 5
Rujuk Item #1 atau Soalan #1:
(i) Hitung bilangan pelajar daripada kumpulan „markah tinggi‰ yang

memilih setiap pilihan (A, B, C atau D); dan
(ii) Kira bilangan pelajar daripada kumpulan „markah rendah‰ yang memilih pilihan A, B, C atau
D (rujuk Rajah 9.1).

Rajah 9.1: Analisis item untuk satu item atau soalan
Daripada analisis, 11 pelajar daripada kumpulan „markah tinggi‰ dan dua pelajar daripada
kumpulan „markah rendah‰ telah memilih „B‰ yang merupakan jawapan yang betul. Ini
bermakna 13 daripada 24 pelajar memilih jawapan yang betul. Juga, ambil perhatian bahawa
semua pengganggu (A, C dan D) telah dipilih oleh sekurang-kurangnya seorang pelajar. Walau
bagaimanapun, maklumat yang diberikan dalam Rajah 9.1 tidak mencukupi dan analisis lanjut perlu dijalankan.
9.3 INDEKS KESUKARAN

Menggunakan maklumat yang diberikan dalam Rajah 9.1, anda boleh mengira indeks kesukaran
yang merupakan penunjuk kuantitatif berkenaan dengan tahap kesukaran item atau soalan
individu. Ia boleh dikira menggunakan formula berikut:
Bilangan pelajar dengan jawapan yang betul (R)

Indeks kesukaran ÿhlmÿ ÿ
Jumlah bilangan pelajar yang mencuba soalan T ÿÿ

R 13
ÿÿ ÿ
0.54
T 24

Apakah yang dimaksudkan denganhlm indeks kesukaran () 0.54? Indeks kesukaran ialah pekali
yang menunjukkan peratusan pelajar yang mendapat jawapan yang betul berbanding dengan
jumlah pelajar dalam dua kumpulan yang menjawab. Dalam erti kata lain, 54 peratus pelajar
memilih jawapan yang betul. Walaupun pengiraan kami berdasarkan kumpulan markah tinggi
dan rendah sahaja, ia memberikan anggaran hampir kepada anggaran yang akan diperoleh
dengan jumlah kumpulan. Oleh itu, adalah wajar untuk mengatakan bahawa indeks kesukaran
untuk item ini ialah 54 peratus (untuk kumpulan tertentu ini). Ambil perhatian bahawa,
memandangkan kesukaran merujuk kepada peratusan mendapatkan item dengan betul, semakin
kecil angka peratusan semakin sukar item tersebut. Lien (1980) menyediakan garis panduan
mengenai tafsiran indeks kesukaran seperti berikut (rujuk Rajah 9.2):
Rajah 9.2: Tafsiran indeks kesukaran () hlm
Jika seorang guru percaya bahawa pencapaian 0.54 pada item tersebut adalah terlalu rendah,
dia boleh mengubah cara mengajarnya agar lebih memenuhi objektif yang diwakili oleh item
tersebut. Tafsiran lain mungkin adalah item itu terlalu sukar, mengelirukan atau tidak sah, yang
mana guru boleh menggantikan atau mengubah suai item tersebut, mungkin menggunakan
maklumat daripada indeks diskriminasi item atau analisis distraktor.
Di bawah CTT, ukuran kesukaran item hanyalah perkadaran jawapan yang betul daripada pelajar
untuk sesuatu item. Untuk item dengan skor maksimum 2, terdapat sedikit pengubahsuaian pada
pengiraan perkadaran peratusan yang betul.
Item ini mempunyai kemungkinan pemarkahan kredit separa 0, 1 dan 2. Jika jumlah bilangan
pelajar yang mencuba item ini ialah 100 dan 23 pelajar mendapat markah 0, 60 pelajar mendapat
markah 1 dan 17 pelajar mendapat markah 2, maka pengiraan mudah akan menunjukkan
bahawa 23 peratus pelajar mendapat markah 0, 60 peratus pelajar mendapat markah 1 dan 17
peratus pelajar mendapat markah 2 untuk item tertentu ini. Purata markah untuk item ini
hendaklah (0 ÿ 0.23) + (1 ÿ 0.6) + (2 ÿ 0.17) = 0.94.

Maka purata markah yang diperhatikan bagi item ini ialah 0.94 daripada maksimum 2. Jadi purata
perkadaran yang betul ialah 0.94/2 = 0.47 atau 47 peratus.
AKTIVITI 9.1
Seorang guru memberikan ujian sains 20 item kepada sekumpulan 35 pelajar. Yang betul
jawapan untuk Soalan #25 ialah „C‰ dan keputusannya adalah seperti berikut:
Pilihan A B C D kosong
Kumpulan markah tinggi (n = 12) 0 2 8 2 0
Kumpulan markah rendah (n = 12) 2 4 3 2 1
(a) Kira indeks kesukaran () untuk Soalan #25.hlm
(b) Adakah Soalan #25 soalan mudah atau sukar? Mewajarkan.
(c) Adakah anda fikir anda perlu menambah baik Soalan #25? kenapa?
forum.
9.4 INDEKS DISKRIMINASI

Indeks diskriminasi ialah ukuran asas yang menunjukkan sejauh mana sesuatu soalan mendiskriminasi
atau membezakan antara pelajar dalam kumpulan „markah tinggi‰ dan „markah rendah‰. Indeks ini
boleh ditafsirkan sebagai petunjuk sejauh mana pengetahuan keseluruhan bidang kandungan atau
penguasaan kemahiran berkaitan dengan respons pada sesuatu item. Paling penting untuk item ujian
bahawa pelajar mendapat jawapan yang betul kerana tahap pengetahuan atau keupayaan mereka dan
bukan disebabkan oleh perkara lain seperti peluang atau berat sebelah ujian.

Perhatikan dalam contoh kami sebelum ini, 11 pelajar dalam kumpulan „markah tinggi‰ dan dua
pelajar dalam kumpulan „markah rendah‰ memilih jawapan yang betul. Ini menunjukkan diskriminasi
positif kerana item tersebut membezakan antara pelajar dengan cara yang sama seperti jumlah markah
ujian. Iaitu, pelajar yang mendapat markah tinggi dalam ujian (kumpulan markah tinggi) mendapat item
yang betul dengan lebih kerap daripada pelajar yang mendapat markah rendah dalam ujian (kumpulan
markah rendah). Walaupun analisis melalui pemeriksaan mungkin semua yang diperlukan untuk
kebanyakan tujuan, indeks diskriminasi boleh dikira dengan mudah menggunakan formula berikut:
RR h ÿ
L
Indeks diskriminasi ÿ
1 T
2
Di mana Rh = Bilangan pelajar dalam kumpulan „markah tinggi‰ (RH) dengan betul
jawab
RL = Bilangan pelajar dalam kumpulan „markah rendah‰ (RL) dengan betul

jawab
T = Jumlah bilangan pelajar
Contoh:
Satu ujian telah diberikan kepada sekumpulan 43 pelajar dan 10 daripada 13 kumpulan „markah
tinggi‰ mendapat jawapan yang betul berbanding 5 daripada 13 kumpulan „markah rendah‰ yang
mendapat jawapan yang betul. Indeks diskriminasi dikira seperti berikut:
RR
h 10 5
ÿ
L 10 5
ÿ ÿ
D ÿ ÿ ÿÿ
0.38
T 1 ÿ ÿ26 13
12 2
Apakah maksud indeks diskriminasi 0.38? Indeks diskriminasi ialah pekali yang menunjukkan sejauh
mana soalan mendiskriminasi atau membezakan antara pelajar „markah tinggi‰ dan „markah rendah‰
pelajar. Blood and Budd (1972) menyediakan garis panduan berikut mengenai maksud indeks
diskriminasi seperti berikut (rujuk Rajah 9.3):
Rajah 9.3: Tafsiran indeks diskriminasi

Soalan yang mempunyai indeks diskriminasi yang tinggi mampu membezakan antara pelajar yang tahu dan
yang tidak tahu jawapannya. Apabila kita mengatakan sesuatu soalan mempunyai indeks diskriminasi yang
rendah, ia tidak dapat membezakan antara pelajar yang tahu dan pelajar yang tidak tahu. Indeks diskriminasi
yang rendah bermakna lebih ramai pelajar „markah rendah‰ mendapat jawapan yang betul kerana soalan
itu terlalu mudah. Ia juga boleh bermakna bahawa pelajar daripada kumpulan „markah tinggi‰ dan kumpulan
„markah rendah‰ mendapat jawapan yang salah kerana soalan itu terlalu sukar.
Formula untuk indeks diskriminasi adalah sedemikian rupa sehingga jika lebih ramai pelajar dalam kumpulan
„markah tinggi‰ memilih jawapan yang betul daripada pelajar dalam kumpulan markah rendah, bilangannya
akan menjadi positif. Sekurang-kurangnya, seseorang akan mengharapkan nilai positif kerana itu akan
menunjukkan bahawa pengetahuan tentang soalan yang mengakibatkan
jawapan yang betul.
(a) Semakin besar nilai positif (semakin hampir kepada 1.0), semakin kukuh hubungan antara prestasi ujian
keseluruhan dan prestasi pada itu
item.
(b) Jika indeks diskriminasi adalah negatif, ini bermakna atas sebab tertentu pelajar yang mendapat markah
rendah dalam ujian lebih berkemungkinan mendapat jawapan yang betul. Ini adalah situasi pelik yang
menunjukkan kesahihan yang lemah untuk item.
AKTIVITI 9.2
Seorang guru memberikan ujian ekonomi 35 item kepada 42 pelajar. Untuk Soalan #16, 8
daripada 11 kumpulan „markah tinggi‰ mendapat jawapan yang betul berbanding 4
daripada 11 daripada kumpulan „markah rendah‰ yang mendapat jawapan yang betul.
(a) Kira indeks diskriminasi untuk Soalan #16.
(b) Adakah Soalan #16 mempunyai indeks diskriminasi yang tinggi atau rendah? Mewajarkan.
forum.

9.5 APLIKASI ANALISIS ITEM PADA

SOALAN JENIS ESEI
Subtopik sebelumnya menerangkan penggunaan analisis item pada soalan aneka pilihan.
Analisis item juga boleh digunakan untuk soalan berbentuk esei. Subtopik ini akan
menggambarkan bagaimana ini boleh dilakukan. Untuk memudahkan pemahaman, ilustrasi
akan menggunakan soalan esei jawapan pendek sebagai contoh.
Mari kita andaikan bahawa sekumpulan 20 pelajar telah menjawab soalan esei jawapan
pendek dengan markah antara minimum 0 hingga maksimum 4. Jadual 9.1 menyediakan
markah yang diperolehi oleh pelajar.
Jadual 9.1: Skor Diperolehi oleh Pelajar untuk Soalan Esei Jawapan Pendek
Skor Item Bilangan Pelajar Mendapat Setiap Skor Jumlah Markah Diperolehi
4 5 20
3 6 18
2 5 10
1 3 3
0 1 0
Jumlah 51
Purata markah 51/20 = 2.55
Indeks kesukaran () itemhlmboleh dikira menggunakan formula berikut seperti yang dicadangkan
oleh Nitko (2004):
ÿ
Purata markah
hlm
Julat skor yang mungkin
Menggunakan maklumat daripada Jadual 9.1, indeks kesukaran soalan esei jawapan
pendek boleh dikira dengan mudah. Purata skor yang diperolehi oleh kumpulan pelajar ialah
2.55, manakala julat skor yang mungkin bagi item tersebut ialah (4 ÿ 0) = 4. Justeru,
2.55
ÿ
hlm
4
ÿ
0.64

Indeks kesukaran () 0.64hlm

bermakna secara purata pelajar menerima 64 peratus daripada markah
maksimum yang mungkin untuk item tersebut. Indeks kesukaran boleh ditafsirkan dengan cara
yang sama seperti soalan aneka pilihan yang dibincangkan dalam subtopik 9.3. Item adalah
tahap kesukaran yang sederhana (rujuk Rajah 9.2).
Ambil perhatian bahawa dalam mengira indeks kesukaran dalam contoh di atas, markah daripada
keseluruhan kumpulan digunakan untuk mendapatkan skor purata. Walau bagaimanapun, bagi
sekumpulan besar pelajar, adalah mungkin untuk menganggar indeks kesukaran untuk item
berdasarkan hanya sampel pelajar yang terdiri daripada kumpulan „markah tinggi‰ dan „markah
rendah‰ seperti dalam kes pengiraan indeks kesukaran sesuatu soalan aneka pilihan.
Untuk mengira indeks diskriminasi (formula D ) daripada soalan jenis esei, yang berikut
dicadangkan oleh Nitko (2004):
ÿ
D ÿ
Perbezaan antara skor purata kumpulan atas dan bawah
Julat skor yang mungkin
Menggunakan maklumat daripada Jadual 9.1 dan mempersembahkannya dalam format seperti
yang ditunjukkan dalam Jadual 9.2, kita boleh mengira indeks diskriminasi soalan esei jawapan
pendek.
Jadual 9.2: Taburan Markah Yang Diperolehi Oleh Pelajar
skor 0 1 2 3 4 Jumlah Purata

skor
Kumpulan markah tinggi (n = 10) 0 0 1 4 5 34 3.4
Kumpulan markah rendah (n = 10) 1 3 4 2 0 17 1.7
„n‰ merujuk kepada bilangan pelajar
Purata markah yang diperolehi oleh kumpulan atasan pelajar ialah 3.4 manakala kumpulan
bawahan ialah 1.7. Menggunakan formula seperti yang dicadangkan oleh Nitko (2004), kita boleh
mengira indeks diskriminasi bagi soalan esei jawapan pendek seperti berikut:
3.4 1.7
ÿ
D ÿ
4
ÿ
0.43

Indeks diskriminasi (D) 0.43 menunjukkan bahawa soalan jawapan pendek melakukan
diskriminasi antara kumpulan pelajar atas dan bawah dan pada tahap tinggi (rujuk Rajah
9.3.). Seperti dalam pengiraan indeks diskriminasi soalan aneka pilihan untuk sekumpulan
besar pelajar, sampel pelajar yang terdiri daripada 27 peratus teratas dan 27 peratus
terbawah boleh digunakan untuk memberikan anggaran yang baik.
AKTIVITI 9.3
Maklumat berikut ialah prestasi markah tinggi dan

kumpulan markah rendah dalam soalan esei jawapan pendek.
skor 0 1 2 3 4
Kumpulan markah tinggi (n = 10) 2 2 3 1 2
Kumpulan markah rendah (n = 10) 3 2 2 3 0
(a) Kira indeks kesukaran.
(b) Kira indeks diskriminasi.
(c) Bincangkan dapatan.
Bincangkan penemuan dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.

9.6 HUBUNGAN ANTARA KESUKARAN

INDEKS DAN INDEKS DISKRIMINASI
Secara teorinya, lebih sukar soalan (atau item) atau lebih mudah soalan (atau
item), semakin rendah indeks diskriminasi. Stanley dan Hopkins (1972)
menyediakan model teori untuk menerangkan hubungan antara indeks
kesukaran dan indeks diskriminasi soalan atau item tertentu (rujuk Rajah 9.4).
Rajah 9.4: Hubungan teori antara indeks kesukaran dan indeks diskriminasi
Sumber: Stanley & Hopkins (1972)

Mengikut model, indeks kesukaran 0.2 boleh menghasilkan indeks diskriminasi kira-kira 0.3
untuk item tertentu (yang boleh digambarkan sebagai item diskriminasi sederhana). Ambil
perhatian bahawa apabila indeks kesukaran meningkat daripada 0.1 kepada 0.5, indeks
diskriminasi meningkat lebih banyak lagi. Apabila indeks kesukaran mencapai 0.5 (diterangkan
sebagai item kesukaran sederhana), indeks diskriminasi adalah positif 1.00 (diskriminasi
sangat tinggi). Menariknya, untuk indeks kesukaran lebih daripada 0.5, indeks diskriminasi
berkurangan. Kenapa jadi begini?
(a) Contohnya, indeks kesukaran 0.9 menghasilkan indeks diskriminasi kira-kira 0.2 yang
digambarkan sebagai item diskriminasi rendah hingga sederhana.
Apakah maksud ini? Lebih mudah soalan, lebih sukar untuk soalan atau item itu
mendiskriminasi antara pelajar yang tahu dan tidak tahu jawapan kepada soalan itu.
(b) Begitu juga, apabila indeks kesukaran adalah kira-kira 0.1, indeks diskriminasi menurun
kepada kira-kira 0.2. Apakah maksud ini? Lebih sukar soalan itu, lebih sukar untuk
soalan atau item itu mendiskriminasi antara pelajar yang tahu dan tidak tahu jawapan
kepada soalan itu.
AKTIVITI 9.4
1. Apakah yang anda boleh simpulkan tentang hubungan antara

indeks kesukaran sesuatu item dan indeks diskriminasinya?
2. Adakah anda mengambil kira faktor-faktor ini semasa memberi a

ujian aneka pilihan kepada pelajar di sekolah anda? Terangkan.
forum.

9.7 ANALISIS DISTRAKTOR

Selain meneliti prestasi keseluruhan item ujian, guru juga berminat untuk meneliti prestasi distraktor individu
(pilihan jawapan yang salah) pada item aneka pilihan. Dengan mengira perkadaran pelajar yang memilih
setiap pilihan jawapan, guru boleh mengenal pasti distraktor yang "berfungsi" dan kelihatan menarik kepada
pelajar yang tidak tahu jawapan yang betul dan distraktor yang hanya mengambil ruang dan tidak dipilih
oleh ramai pelajar. Untuk menghapuskan tekaan buta yang menghasilkan jawapan yang betul secara
kebetulan semata-mata (yang menjejaskan kesahihan item ujian), guru mahukan seberapa banyak
gangguan yang munasabah yang boleh dilaksanakan. Analisis pilihan respons membolehkan guru
memperhalusi dan menambah baik item yang mereka mungkin ingin gunakan semula dengan kelas akan
datang. Mari kita periksa prestasi pada item atau soalan (rujuk Rajah 9.5).
Contoh:
Kuasa Eropah manakah yang menyerang Melaka pada tahun 1511?
Rajah 9.5: Keberkesanan distraktor
Secara amnya, distraktor yang baik mampu menarik lebih ramai pelajar „markah rendah‰ untuk memilih
respons tertentu atau mengalih perhatian „markah rendah‰ pelajar ke arah memilih respons tertentu
tersebut. Apakah yang menentukan keberkesanan distraktor? Dalam Rajah 9.5, seramai 24 orang pelajar
telah memilih pilihan A, B, C dan D untuk soalan tertentu. Pilihan B adalah pengacau yang kurang berkesan
kerana ramai pelajar „markah tinggi‰ (n = 5) memilih pilihan B. Pilihan D agak mengganggu kerana dua

pelajar daripada kumpulan „markah tinggi‰ dan lima pelajar daripada kumpulan „markah rendah‰
memilih pilihan ini. Analisis pilihan respons menunjukkan bahawa mereka yang terlepas item
berkemungkinan sama untuk memilih pilihan B dan pilihan D. Tiada pelajar memilih pilihan C. Oleh
itu, pilihan C tidak bertindak sebagai gangguan. Ini kerana pelajar tidak memilih antara empat pilihan
jawapan pada item ini, mereka benar-benar memilih antara tiga pilihan sahaja kerana mereka tidak
mempertimbangkan pilihan C.
Ini menjadikan meneka dengan betul lebih berkemungkinan, yang menjejaskan kesahihan item.
Indeks diskriminasi boleh diperbaiki dengan mengubah suai dan menambah baik pilihan B dan C.
AKTIVITI 9.5
Residen British manakah yang dibunuh oleh Maharajalela di Pasir Salak?
Hugh Low Birch Brooke Gurney

Pilihan Tiada jawapan
A B C D
Markah tinggi (n = 15) 4 7 0 4 0
Markah rendah (n = 15) 6 3 2 4 0
Jawapannya ialah B.
Menganalisis keberkesanan distraktor.
9.8 PENDEKATAN PRAKTIS KEPADA ITEM

ANALISIS
Sesetengah guru mungkin mendapati teknik yang dibincangkan sebelum ini sebagai memakan masa,
yang tidak boleh dinafikan (terutamanya apabila anda mempunyai ujian yang terdiri daripada 40 item).
Walau bagaimanapun, terdapat pendekatan yang lebih praktikal yang mungkin mengambil sedikit
masa. Bayangkan anda telah mentadbir ujian 40 item kepada kelas 30 pelajar. Pastinya ia akan
mengambil banyak masa untuk menganalisis keberkesanan setiap item dan mungkin tidak
menggalakkan anda menganalisis setiap item dalam ujian. Diederich (1971) mencadangkan kaedah
analisis item yang boleh dijalankan oleh guru dan pelajar di dalam kelasnya. Berikut adalah langkah-
langkahnya:

(a) Langkah
1 Susun 30 helaian jawapan daripada markah tertinggi yang diperoleh kepada markah
terendah yang diperoleh.
(b) Langkah 2
Pilih kertas jawapan yang mendapat skor tengah. Kumpulkan semua kertas jawapan di atas
markah ini sebagai „markah tinggi‰ (tandakan „H‰ pada helaian jawapan ini). Kumpulkan
semua kertas jawapan di bawah markah ini sebagai kumpulan „markah rendah‰ (tandakan
„L‰ pada helaian jawapan ini).
(c) Langkah 3
Bahagikan kelas kepada dua kumpulan (tinggi dan rendah) dan edarkan kertas jawapan
„tinggi‰ kepada kumpulan tinggi dan kertas jawapan „rendah‰ kepada kumpulan rendah.
Tugaskan seorang pelajar dalam setiap kumpulan untuk menjadi kaunter.
(d) Langkah 4
Guru kemudian bertanya kepada kelas.
Guru: Jawapan untuk Soalan #1 ialah „C‰ dan mereka yang mendapatnya betul, angkat
tangan.
Kaunter daripada kumpulan „H‰: 14 untuk kumpulan H.
Kaunter daripada kumpulan „L‰: 8 daripada kumpulan L.
(e) Langkah 5
Guru merekodkan jawapan di papan putih seperti berikut:
Tinggi Rendah Jumlah Jawapan Betul

Soalan 1 14 8 22
Soalan #2 12 6 18
Soalan #3 | | 16 7 23
Soalan #n n n n
(f) Langkah 6
Kira indeks kesukaran untuk Soalan #1 seperti berikut:
RR
HL
ÿ
14 ÿ8
Indeks kesukaran ÿ ÿÿ
0.73
30 30

(g) Langkah 7
Kira indeks diskriminasi untuk Soalan #1 seperti berikut:
RR
HL 14 8 6
ÿ ÿ
Indeks kesukaran ÿ ÿ ÿÿ
0.40
1 15 15
2 30
Perhatikan bahawa sebelum ini, kami mengambil 27 peratus kertas jawapan dalam kumpulan
„markah tinggi‰ dan 27 peratus kertas jawapan dalam kumpulan „markah rendah‰ daripada
jumlah kertas jawapan. Walau bagaimanapun, dalam pendekatan ini kami membahagikan jumlah
kertas jawapan kepada dua kumpulan. Tiada kumpulan pertengahan. Perkara penting ialah
menggunakan sebahagian besar kumpulan yang cukup besar untuk memberikan maklumat yang berguna.
Memilih bahagian atas dan bawah 27 peratus kumpulan disyorkan untuk analisis yang lebih
halus. Kaedah yang ditunjukkan dalam contoh mungkin kurang tepat tetapi ia adalah kaedah
„cepat dan kotor‰.
AKTIVITI 9.6
1. Bandingkan indeks kesukaran dan indeks diskriminasi yang diperolehi

menggunakan kaedah kasar ini dengan model teori oleh Stanley dan
Hopkins dalam Rajah 9.4. Adakah indeks sangat jauh?
2. Guru hendaklah melakukan analisis item setiap kali selepas

mentadbir ujian.
Terangkan jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
9.9 KEGUNAAN ANALISIS ITEM UNTUK

GURU
Selepas setiap ujian atau penilaian, adalah dinasihatkan untuk menjalankan analisis item bagi item ujian
kerana maklumat daripada analisis akan berguna kepada guru.
Antara faedah daripada analisis adalah seperti berikut:
(a) Daripada perbincangan dalam subtopik terdahulu, adalah jelas bahawa hasil analisis item boleh
memberikan jawapan kepada soalan berikut:
(i) Adakah item tersebut berfungsi seperti yang dimaksudkan?
(ii) Adakah item tersebut mempunyai kesukaran yang sesuai?

(iii) Adakah barang-barang tersebut bebas daripada petunjuk yang tidak berkaitan dan kecacatan lain?
(iv) Adakah setiap pengganggu berkesan (dalam soalan aneka pilihan)?
Jawapan kepada soalan sebelumnya boleh digunakan untuk memilih atau menyemak item ujian
untuk kegunaan masa hadapan. Ini akan membantu meningkatkan kualiti item ujian dan kertas
ujian untuk kegunaan masa hadapan. Ia juga menjimatkan masa guru semasa menyediakan
item ujian untuk kegunaan masa hadapan kerana item yang baik boleh disimpan di bank item.
(b) Data analisis item boleh menyediakan asas untuk perbincangan kelas yang cekap tentang keputusan
ujian. Mengetahui sejauh mana keberkesanan setiap item ujian berfungsi dalam mengukur
pencapaian hasil pembelajaran yang dihasratkan dan prestasi pelajar dalam setiap item, guru
boleh mengadakan perbincangan yang lebih berkesan dengan pelajar kerana maklum balas
berdasarkan analisis item adalah lebih objektif dan bermaklumat. Sebagai contoh, guru boleh
menyerlahkan maklumat salah atau salah faham yang dicerminkan dalam pilihan pengganggu
tertentu pada soalan aneka pilihan atau kesilapan yang kerap berulang pada soalan jenis esei,
dengan itu meningkatkan nilai pengajaran penilaian. Jika, semasa perbincangan, analisis item
mendedahkan bahawa terdapat kecacatan teknikal dalam item atau skema pemarkahan, markah
pelajar juga boleh diperbetulkan untuk memastikan ujian yang lebih adil.
(c) Data analisis item boleh digunakan untuk kerja pemulihan. Analisis akan mendedahkan bidang
khusus yang pelajar lemah. Guru boleh menggunakan maklumat untuk memfokuskan kerja
pemulihan secara langsung pada bidang kelemahan tertentu. Sebagai contoh, berdasarkan
analisis distraktor, didapati bahawa distraktor tertentu mempunyai diskriminasi yang rendah
dengan bilangan pelajar yang tinggi daripada kumpulan markah tinggi dan rendah memilih
pilihan. Ini boleh mencadangkan bahawa terdapat beberapa salah faham pada konsep tertentu.
Pelajaran pemulihan boleh dirancang untuk mengatasi masalah tersebut.
(d) Data analisis item boleh mendedahkan kelemahan dalam pengajaran dan memberikan maklumat
berguna untuk menambah baik pengajaran. Sebagai contoh, walaupun fakta bahawa item dibina
dengan betul, ia mempunyai indeks kesukaran yang rendah, menunjukkan bahawa kebanyakan
pelajar gagal menjawab item tersebut dengan memuaskan. Ini mungkin menunjukkan bahawa
pelajar belum menguasai kandungan sukatan pelajaran tertentu yang sedang dinilai. Ini mungkin
disebabkan oleh kelemahan dalam pengajaran dan oleh itu memerlukan pelaksanaan strategi
pengajaran yang lebih berkesan oleh guru. Tambahan pula, jika item itu berulang kali sukar
untuk pelajar, mungkin terdapat keperluan untuk menyemak semula kurikulum.

(e) Prosedur analisis item menyediakan asas kepada guru untuk meningkatkan
kemahiran mereka dalam pembinaan ujian. Semasa guru menganalisis tindak
balas pelajar terhadap item, mereka menyedari tentang kecacatan item dan
apa yang menyebabkannya. Apabila menyemak item, mereka mendapat
pengalaman dalam menyusun semula penyataan supaya lebih jelas, menulis
semula gangguan supaya lebih munasabah dan mengubah suai item supaya
berada pada tahap kesukaran yang lebih sesuai. Hasilnya, guru meningkatkan
kemahiran membina ujian mereka.
9.10 AWAS DALAM MENAFSIHKAN ITEM

HASIL ANALISIS
Walaupun analisis item berguna, hasil daripada analisis sedemikian adalah terhad dalam
banyak cara dan mesti ditafsirkan dengan berhati-hati. Berikut adalah beberapa
kebimbangan utama yang perlu diperhatikan:
(a) Kuasa mendiskriminasi item tidak menunjukkan kesahihan item. Indeks diskriminasi
yang tinggi hanya menunjukkan bahawa pelajar dari kumpulan markah tinggi
menunjukkan prestasi yang lebih baik berbanding pelajar dari kumpulan markah
rendah. Pembahagian kumpulan markah tinggi dan markah rendah adalah
berdasarkan jumlah markah ujian yang diperolehi oleh setiap pelajar, yang merupakan
kriteria dalaman. Dengan menggunakan kriteria dalaman jumlah markah ujian,
analisis item menawarkan bukti mengenai ketekalan dalaman ujian dan bukannya
kesahihannya. Kesahan sesuatu ujian perlu dinilai menggunakan kriteria luaran, iaitu
sejauh mana ujian itu menilai hasil pembelajaran yang dimaksudkan.
(b) Indeks diskriminasi tidak selalunya merupakan penunjuk kualiti item. Sebagai contoh,
indeks kuasa diskriminasi yang rendah tidak semestinya menunjukkan item yang
rosak. Jika sesuatu item tidak mendiskriminasi tetapi ia didapati bebas daripada
kesamaran dan kecacatan teknikal lain, item tersebut hendaklah disimpan
terutamanya dalam ujian rujukan kriteria. Dalam ujian sedemikian, item tanpa
diskriminasi mungkin mencadangkan bahawa semua pelajar telah mencapai kriteria
yang ditetapkan oleh guru. Oleh yang demikian, item tersebut tidak membezakan
antara pelajar yang baik dan lemah. Satu lagi sebab yang mungkin mengapa
diskriminasi rendah berlaku untuk item ialah item itu mungkin sama ada sangat
mudah atau sangat sukar. Kadangkala, item ini perlu atau wajar disimpan untuk mengukur a

sampel yang mewakili hasil pembelajaran dan kandungan kursus. Selain itu, ujian
pencapaian biasanya direka untuk mengukur beberapa jenis hasil pembelajaran
(pengetahuan, pemahaman, aplikasi dan sebagainya). Dalam kes sedemikian, akan
terdapat hasil pembelajaran yang dinilai oleh item ujian yang lebih sedikit dan item ini
akan mempunyai diskriminasi yang rendah kerana ia mempunyai kurang perwakilan
dalam jumlah markah ujian. Mengeluarkan item ini daripada ujian adalah tidak
digalakkan kerana ia akan menjejaskan kesahan ujian.
(c) Jenis data analisis item tradisional ini adalah tentatif. Ia tidak tetap tetapi dipengaruhi oleh
jenis dan bilangan pelajar yang diuji dan prosedur pengajaran yang digunakan. Data
itu akan berubah dengan setiap pentadbiran item ujian yang sama. Oleh itu, jika
penggunaan item berulang mungkin, analisis item perlu dijalankan untuk setiap
pentadbiran setiap item. Oleh itu sifat tentatif analisis item harus diambil serius dan
hasilnya ditafsirkan dengan berhati-hati.
9.11 BANK ITEM

Bank item ialah koleksi besar soalan atau item yang mudah diakses yang telah ditadbir dalam
satu tempoh masa. Bagi ujian pencapaian yang menilai prestasi dalam badan pengetahuan
seperti geografi, sejarah, kimia atau matematik, soalan yang boleh ditanya adalah agak
terhad. Oleh itu, tidak hairanlah bahawa soalan terdahulu dikitar semula dengan beberapa
perubahan kecil dan diberikan kepada kumpulan pelajar yang berbeza. Membuat item ujian
yang baik bukanlah satu tugas yang mudah dan boleh memakan masa untuk guru. Item atau
bank soalan akan sangat membantu guru.
Bank item terdiri daripada soalan yang telah dianalisis dan disimpan kerana ia adalah item
yang baik. Setiap item yang disimpan akan mempunyai maklumat tentang indeks kesukaran
dan indeks diskriminasinya. Setiap item disimpan mengikut apa yang diukur terutamanya
berkaitan dengan topik kurikulum. Item ini akan disimpan dalam bentuk Jadual Spesifikasi
yang menunjukkan kandungan yang diukur serta tahap kognitif yang diukur. Contohnya, dari
bank item, anda akan dapat melukis item yang mengukur aplikasi konsep untuk topik
„Elektrik‰.
Anda juga akan dapat menarik item dari bank dengan tahap kesukaran yang berbeza.
Mungkin, anda ingin menyusun soalan yang lebih mudah pada permulaan ujian untuk
membina keyakinan dalam diri pelajar dan secara beransur-ansur memperkenalkan soalan
yang semakin sukar.

Dengan pangkalan data berkomputer, bank item mudah diakses. Guru akan mempunyai beratus-
ratus item yang mereka boleh gunakan semasa membangunkan ujian bilik darjah. Ini sudah tentu
akan membantu guru dengan tugas yang membosankan dan memakan masa untuk membina
item atau soalan dari awal.
Malangnya, tidak banyak institusi pendidikan yang dilengkapi dengan bank item sedemikian.
Amalan yang lebih biasa ialah guru memilih item atau soalan daripada buku kerja yang disediakan
secara komersial, kertas peperiksaan lepas dan item sampel daripada buku teks. Sumber-sumber
ini tidak mempunyai maklumat tentang indeks kesukaran dan indeks diskriminasi item atau
maklumat tentang tahap kognitif soalan atau perkara yang mereka ingin ukur. Guru perlu
memikirkan sendiri ciri-ciri item berdasarkan pengalaman mereka dalam mengajar kandungan.
Walau bagaimanapun, terdapat beberapa isu berkaitan dengan penggunaan bank item. Salah
satu kebimbangan utama bank item ialah cara meletakkan item ujian berbeza yang dikumpul dari
semasa ke semasa pada skala yang sama. Skala hendaklah menunjukkan kesukaran item, satu
skala bagi setiap perkara. Pengambilan semula barang dari bank menjadi mudah apabila semua
item diletakkan pada skala yang sama.
Orang yang bertanggungjawab juga mesti berusaha sedaya upaya untuk menambah hanya item
berkualiti pada kumpulan item. Untuk membangun dan mengekalkan bank item yang baik
memerlukan banyak persediaan, perancangan, kepakaran dan organisasi. Walaupun pendekatan
Item Response Theory (IRT) bukanlah ubat untuk semua masalah perbankan item, banyak isu ini
boleh diselesaikan.
9.12 PERISIAN PSIKOMETRIK

Program perisian yang direka untuk analisis statistik umum seperti SPSS selalunya boleh
digunakan untuk jenis analisis psikometrik tertentu. Pelbagai program perisian tersedia khusus
untuk menganalisis data daripada ujian.
Teori Ujian Klasik (CTT) ialah pendekatan kepada analisis psikometrik yang mempunyai andaian
yang lebih lemah daripada Teori Tindak Balas Item (IRT) dan lebih sesuai untuk saiz sampel yang
lebih kecil. Di bawah CTT, markah ujian mentah pelajar adalah jumlah markah yang diterima pada
item dalam ujian. Sebagai contoh, Iteman ialah program komersial manakala TAP ialah program
percuma untuk analisis klasik.

IRT ialah pendekatan psikometrik yang menganggap bahawa kebarangkalian tindak balas tertentu
adalah fungsi langsung sifat atau sifat asas. Di bawah IRT, kebimbangan adalah sama ada pelajar
memperoleh setiap item dengan betul atau tidak, dan bukannya skor ujian mentah. Konsep asas
IRT adalah mengenai item ujian individu dan bukannya tentang markah ujian. Sifat atau kebolehan
dan ciri-ciri item pelajar dirujuk kepada skala yang sama. Sebagai contoh, ConQuest ialah program
komputer untuk respons item dan model regresi terpendam dan TAM ialah pakej R untuk model
respons item.
• Analisis item ialah satu proses yang mengkaji tindak balas kepada item ujian individu atau soalan
untuk menilai kualiti item tersebut dan ujian secara keseluruhan.
• Analisis item dijalankan untuk mendapatkan maklumat tentang item individu atau
soalan dalam ujian dan bagaimana ujian itu boleh diperbaiki.
• Indeks kesukaran adalah penunjuk kuantitatif berkaitan dengan tahap kesukaran item atau soalan
individu.
• Indeks diskriminasi ialah ukuran asas yang menunjukkan sejauh mana sesuatu soalan
mendiskriminasi atau membezakan antara pelajar dalam kumpulan „markah tinggi‰ dan
kumpulan „markah rendah‰.
• Secara teorinya, lebih sukar soalan (atau item) atau lebih mudah soalan (atau item), semakin
rendah indeks diskriminasi.
• Dengan mengira nisbah pelajar yang memilih setiap pilihan jawapan, guru boleh mengenal pasti
distraktor yang "berfungsi" dan kelihatan menarik kepada pelajar yang tidak tahu jawapan yang
betul dan distraktor yang hanya mengambil ruang dan tidak dipilih oleh ramai pelajar.
• Secara umumnya, distraktor yang baik mampu menarik lebih ramai pelajar „markah rendah‰ untuk
memilih respons tertentu atau mengalih perhatian „markah rendah‰ pelajar ke arah memilih
respons tertentu tersebut.
• Bank item terdiri daripada soalan yang telah dianalisis dan disimpan kerana ia adalah item yang
baik.

Teori Ujian Klasik (CTT) Kumpulan markah tinggi
Soalan susah Analisis item
Indeks kesukaran Bank barang
Indeks diskriminasi Teori Tindak Balas Item (IRT)
Analisis distraktor Kumpulan markah rendah
Soalan mudah Psikometrik

Pengganggu yang baik

Topik ÿ Analisis dan

10 Tafsiran
daripada Markah Ujian
HASIL PEMBELAJARAN
1. Kira pelbagai ukuran kecenderungan memusat;
2. Menerangkan penggunaan skor standard; 3. Kira
skor z dan skor T; 4. Huraikan ciri-ciri lengkung
normal; dan
5. Jelaskan peranan norma dalam ujian piawai.
ÿ PENGENALAN
Semua data yang telah anda kumpulkan mengenai prestasi pelajar perlu dianalisis.
Dalam topik ini kami akan memberi tumpuan kepada analisis dan tafsiran data yang
telah anda kumpulkan tentang pengetahuan, kemahiran dan sikap pelajar anda.
Anda menganalisis dan mentafsir maklumat yang telah anda kumpulkan tentang
pelajar anda secara kuantitatif dan kualitatif. Untuk analisis kuantitatif data, pelbagai
alat statistik digunakan, yang akan kami fokuskan dalam topik ini. Sebagai contoh,
statistik digunakan untuk menunjukkan taburan markah pada ujian Geografi dan
purata markah yang diperoleh oleh pelajar.

204 ÿ TOPIK 10 ANALISIS DAN TAFSIRAN MARKAH UJIAN
10.1 KENAPA KITA MENGGUNAKAN STATISTIK?
Apabila anda mentadbir ujian Geografi kepada kelas anda yang terdiri daripada 40 pelajar pada
akhir semester, anda akan memperoleh markah untuk setiap pelajar yang merupakan ukuran
sampel keupayaan pelajar. Tingkah laku yang diuji boleh menjadi keupayaan untuk menyelesaikan
masalah seperti membaca peta, glob dan tafsiran graf. Sebagai contoh, pelajar A mendapat
markah 64 manakala pelajar B mendapat 32. Adakah ini bermakna keupayaan pelajar A lebih
baik daripada pelajar B? Adakah ia bermakna keupayaan pelajar A adalah dua kali ganda
keupayaan pelajar B? Adakah markah 64 dan 32 dalam peratusan? Markah atau markah ini
sukar untuk ditafsir kerana ia adalah skor mentah. Skor mentah boleh mengelirukan jika tiada
rujukan dibuat kepada „unit‰. Ia hanya logik bahawa anda menukar markah kepada unit seperti
peratusan. Dalam contoh ini, anda mendapat 64 peratus dan 32 peratus.
Malah penggunaan peratusan mungkin tidak bermakna. Sebagai contoh, mendapat 64 peratus
dalam ujian mungkin dianggap „baik‰ jika ujian itu merupakan ujian yang sukar. Sebaliknya, jika
ujian itu mudah, maka 64 peratus boleh dianggap sebagai hanya „purata‰. Dengan kata lain,
untuk mendapatkan gambaran yang lebih tepat tentang markah yang diperoleh oleh pelajar
dalam ujian, guru hendaklah:
(a) Ketahui pelajar manakah yang memperoleh markah tertinggi dalam kelas dan
bilangan soalan yang dijawab dengan betul;
(b) Ketahui pelajar manakah yang mendapat markah terendah dalam kelas dan bilangan soalan
yang dijawab dengan betul; dan
(c) Ketahui bilangan soalan yang dijawab dengan betul oleh semua pelajar dalam
kelas.
Ini menggambarkan bahawa markah yang diperoleh oleh pelajar dalam sesuatu ujian perlu diteliti
dengan teliti. Tidak memadai dengan hanya melaporkan markah yang diperolehi. Maklumat lanjut
perlu diberikan tentang markah yang diperoleh dan untuk melakukan ini anda perlu bergantung
pada statistik. Sesetengah guru mungkin takut dengan statistik manakala yang lain mungkin
menganggapnya sebagai terlalu memakan masa. Malah, ramai di antara kita sering menggunakan
statistik tanpa disedari. Sebagai contoh, apabila kita bercakap tentang purata hujan, pendapatan
per kapita, kadar faedah dan peratusan peningkatan dalam kehidupan seharian kita, kita bercakap
bahasa statistik. Apakah statistik?

TOPIK 10 ANALISIS DAN TAFSIRAN SKOR UJIAN ÿ 205
Statistik ialah sains matematik yang berkaitan dengan analisis, tafsiran dan
pembentangan data. Ia boleh digunakan untuk pelbagai disiplin akademik daripada
sains fizikal dan sosial kepada kemanusiaan. Statistik telah digunakan secara meluas
oleh penyelidik dalam pendidikan dan guru bilik darjah. Dalam mengaplikasikan statistik
dalam pendidikan, seseorang itu bermula dengan populasi yang hendak dikaji. Contoh
ini boleh jadi semua pelajar Tingkatan Dua di Malaysia iaitu kira-kira 450,000 pelajar
atau semua guru sekolah menengah di negara ini. Atas sebab praktikal, daripada
menyusun data tentang keseluruhan populasi, kami biasanya memilih atau melukis
subset populasi yang dipanggil sampel. Dengan kata lain, 40 orang pelajar Tingkatan
Dua yang anda ajar adalah sampel populasi pelajar Tingkatan Dua di negara ini. Data
yang anda kumpulkan tentang pelajar dalam kelas anda boleh tertakluk kepada analisis
statistik yang mempunyai dua tujuan yang berkaitan, iaitu deskriptif dan inferens.
(a) Statistik Deskriptif

Anda menggunakan teknik statistik deskriptif untuk menerangkan prestasi pelajar
anda. Sebagai contoh, anda menggunakan teknik statistik deskriptif untuk
meringkaskan data dengan cara yang berguna sama ada secara numerik atau
grafik. Tujuannya adalah untuk membentangkan data yang dikumpul supaya
dapat difahami oleh guru, pentadbir sekolah, ibu bapa, masyarakat dan
Kementerian Pendidikan. Teknik deskriptif yang biasa digunakan ialah min atau
purata dan sisihan piawai. Data juga boleh dipersembahkan secara grafik
menggunakan pelbagai jenis carta dan graf.
(b) Statistik Inferensi

Anda menggunakan teknik statistik inferensi apabila anda ingin membuat
kesimpulan tentang populasi berdasarkan sampel anda. Anda menggunakan
statistik inferensi apabila anda ingin mengetahui perbezaan antara kumpulan
pelajar, hubungan antara pembolehubah atau apabila anda ingin membuat
ramalan tentang prestasi pelajar. Sebagai contoh, anda ingin mengetahui sama
ada lelaki melakukan lebih baik daripada perempuan atau sama ada terdapat
hubungan antara prestasi dalam kerja kursus dan peperiksaan akhir. Statistik
inferensi yang sering digunakan ialah ujian-t, ANOVA dan regresi linear.

10.2 MENERANGKAN MARKAH UJIAN
Andaikan anda baru sahaja memberikan ujian Bahasa Malaysia kepada kelas 35 pelajar
Tingkatan Satu. Selepas menandakan skrip, anda mempunyai satu set markah untuk setiap
pelajar dalam kelas dan anda ingin mengetahui lebih lanjut tentang prestasi pelajar anda.
Rajah 10.1 menunjukkan taburan markah yang diperoleh oleh pelajar dalam ujian tersebut.
Rajah 10.1: Taburan markah Bahasa Malaysia
Lajur „frekuensi‰ menunjukkan bilangan pelajar yang mendapat markah bagi setiap markah
yang ditunjukkan dan peratusan ditunjukkan dalam lajur „peratusan‰. Anda boleh
menerangkan skor ini menggunakan dua jenis ukuran, iaitu kecenderungan memusat dan serakan.

(a) Kecenderungan Pusat

Istilah „kecenderungan pusat‰ merujuk kepada nilai „tengah‰ dan diukur
menggunakan min, median dan mod. Ia adalah petunjuk lokasi markah. Setiap
daripada tiga ukuran dikira secara berbeza. Yang mana satu untuk digunakan
bergantung pada situasi dan perkara yang ingin anda tunjukkan.
(saya maksudkan
Min ialah ukuran kecenderungan memusat yang paling biasa digunakan.

Apabila kita bercakap tentang „purata‰, kami biasanya merujuk kepada min.
Min hanyalah jumlah semua nilai (markah) dibahagikan dengan jumlah
bilangan item (pelajar) dalam set. Hasilnya dirujuk sebagai min aritmetik.
Menggunakan data dari Rajah 10.1 dan menggunakan formula berikut, anda
boleh mengira min.
Min ÿ
ÿ x 35 41 42 ÿÿÿ
ÿ
ÿÿ 75 2148 ÿ
ÿ
53.22
N 35 40
(ii) Median
Median ditentukan dengan menyusun skor yang diperolehi daripada nilai terendah
kepada nilai tertinggi dan mengambil skor yang berada di tengah-tengah urutan.
Untuk contoh dalam Rajah 10.1, median ialah 52. Terdapat 17 pelajar dengan markah
kurang daripada 52 dan 17 pelajar yang markahnya lebih daripada 52. Jika terdapat
bilangan pelajar genap, tidak akan ada satu mata pun di tengah. . Dalam kes ini, anda
mengira median dengan mengambil min dua titik tengah, iaitu membahagikan jumlah dua
markah dengan 2.
(iii) Mod
Mod ialah skor yang paling kerap berlaku dalam set data. Objek manakah yang paling
kerap muncul dalam set data anda? Dalam Rajah 10.1, mod ialah 57 kerana 7 orang
pelajar memperoleh markah tersebut. Walau bagaimanapun, anda juga boleh
mempunyai lebih daripada satu mod. Jika anda mempunyai dua mod ia adalah bimodal.
Taburan markah boleh digraf untuk menunjukkan secara visual hubungan

antara markah dalam kumpulan. Dalam graf sedemikian, paksi mendatar atau
paksi x ialah kontinum di mana individu diukur; paksi menegak atau paksi y
ialah kekerapan (atau bilangan) individu yang memperoleh sebarang markah
yang ditunjukkan pada paksi x. Rajah 10.2 ialah histogram yang mewakili
markah bagi Bahasa Malaysia yang diperolehi oleh sekumpulan 35 orang
pelajar seperti yang ditunjukkan sebelum ini dalam Rajah 10.1.

Rajah 10.2 menunjukkan graf dengan taburan markah Bahasa Malaysia.
Rajah 10.2: Graf menunjukkan taburan markah Bahasa Malaysia
SEMAK KENDIRI 10.1
Apakah perbezaan antara min, median dan mod?
(b) Sebaran
Walaupun min memberitahu kita tentang prestasi purata kumpulan, ia tidak
memberitahu kita berapa hampir dengan purata atau min markah pelajar. Sebagai
contoh, adakah setiap pelajar mendapat markah 80 peratus dalam ujian atau adakah
markah tersebar dari 0 hingga 100 peratus? Serakan ialah pengagihan markah.
Antara ukuran yang digunakan untuk menggambarkan sebaran ialah julat dan sisihan piawai.
(i) Julat Julat

markah dalam sesuatu ujian merujuk kepada markah terendah dan tertinggi
yang diperolehi dalam ujian. Julat ialah jarak antara keterlaluan taburan.

(ii) Sisihan Piawai

Sisihan piawai merujuk kepada berapa banyak skor yang diperoleh pelajar menyimpang
atau menangguhkan daripada min. Rajah 10.3 ialah satu set markah yang diperolehi oleh
10 orang pelajar dalam satu ujian Sains.
Rajah 10.3: Markah dalam ujian Sains yang diperolehi oleh 10 orang pelajar
Berdasarkan skor mentah, anda boleh mengira sisihan piawai menggunakan formula yang diberikan
dalam berikut.
ÿx x ÿ2 153
ÿ
Sisihan piawai ÿ ÿÿ
ÿ N ÿ
1 9
17
ÿ
4.12
(a) Langkah pertama dalam mengira sisihan piawai ialah mencari min yang
ialah 390 dibahagikan dengan 10 = 39.
(b) Seterusnya ialah menolak min daripada setiap markah dalam lajur yang berlabel x ÿ
x.
(c) Ini diikuti dengan pengiraan dalam lajur di sebelah kanan berlabel ( ).
2
x x
ÿ
Ambil perhatian bahawa semua nombor dalam lajur ini adalah positif. Perbezaan
kuasa dua kemudiannya dijumlahkan dan punca kuasa dua dikira.
(c) Sisihan piawai ialah 4.12, iaitu punca kuasa dua positif bagi 153
dibahagikan dengan 9.

Untuk lebih memahami maksud sisihan piawai, rujuk Rajah 10.4 yang menunjukkan
sebaran skor dengan min yang sama tetapi sisihan piawai yang berbeza.
(a) Untuk Kelas A, dengan sisihan piawai 4.12, kira-kira 68%

(1 sisihan piawai) pelajar mendapat markah antara 34.88 dan 43.12.
(b) Bagi Kelas B, dengan sisihan piawai 2, kira-kira 68% (1 sisihan piawai) pelajar
mendapat markah antara 37 dan 41.
(c) Untuk Kelas C, dengan sisihan piawai 1, kira-kira 68% pelajar

mendapat markah antara 38 dan 40.
Rajah 10.4: Taburan markah dengan sisihan piawai yang berbeza-beza

Ambil perhatian bahawa lebih kecil sisihan piawai, lebih besar skor cenderung untuk „kumpulan‰
di sekitar min dan sebaliknya. Oleh itu, tidak cukup untuk hanya meneliti min sahaja kerana sisihan
piawai banyak memberitahu kita tentang sebaran skor di sekitar min. Kelas mana yang anda fikir
berprestasi lebih baik? Min tidak memberitahu kami kelas mana yang berprestasi lebih baik. Kelas
C menunjukkan prestasi terbaik kerana lebih kurang dua pertiga 2
( ) 3daripada pelajar mendapat markah antara 38 dan 40.
SEMAK KENDIRI 10.2
Apakah perbezaan antara julat dan sisihan piawai?
AKTIVITI 10.1
Apakah perbezaan antara sisihan piawai 2 dan sisihan piawai 5?
forum.
Skew
Skew merujuk kepada simetri taburan. Sesuatu pengedaran condong jika salah satu ekornya lebih
panjang daripada yang lain. Rujuk Rajah 10.5 yang menunjukkan taburan markah yang diperolehi
oleh 38 orang pelajar dalam ujian Sejarah. Terdapat kecondongan negatif
kerana ia mempunyai ekor yang lebih panjang ke arah negatif. Apakah maksudnya? Ini bermakna
lebih ramai pelajar mendapat markah tinggi dalam ujian sejarah yang mungkin menunjukkan
bahawa ujian itu terlalu mudah atau kaedah dan bahan pengajaran berjaya menghasilkan hasil
pembelajaran yang diinginkan.

Rajah 10.5: Pencongan negatif
Rajah 10.6 menggambarkan taburan markah yang diperolehi oleh 38 orang pelajar
dalam ujian Biologi. Terdapat pencongan positif kerana ia mempunyai ekor yang
lebih panjang ke arah positif. Apakah maksudnya? Ini bermakna lebih ramai pelajar
mendapat markah rendah dalam ujian Biologi yang menunjukkan ujian itu terlalu
sukar. Sebagai alternatif, ia juga boleh bermakna soalan tidak jelas atau kaedah dan
bahan pengajaran tidak membawa hasil pembelajaran yang diinginkan.

Rajah 10.6: Pencongan positif
AKTIVITI 10.2
Seorang guru menjalankan ujian Bahasa Inggeris kepada 10 pelajar di dalam

kelasnya. Pelajar memperoleh markah berikut: 14, 28, 48, 52, 77, 63, 84, 87,
90 dan 98. Untuk pembahagian markah, cari yang berikut:
(a) Min;
(b) Median;
(c) Julat; dan

(d) Sisihan piawai.

10.3 MARKAH STANDARD

Setelah diberi ujian, kebanyakan guru melaporkan markah mentah yang diperoleh pelajar.
Contohnya, Zulinda, pelajar Tingkatan Empat memperoleh markah berikut pada peperiksaan akhir
semester:
(a) 80 untuk Sains;
(b) 72 untuk Sejarah; dan
(c) 40 untuk bahasa Inggeris.
Dengan hanya markah mentah, apakah yang boleh anda katakan tentang prestasi Zulinda dalam
ujian ini atau kedudukannya dalam kelas? Nah, sebenarnya tidak sangat. Tanpa mengetahui
bagaimana skor mentah ini dibandingkan dengan jumlah taburan markah mentah untuk setiap
mata pelajaran, adalah sukar untuk membuat sebarang kesimpulan yang bermakna mengenai
prestasi relatifnya dalam setiap ujian ini.
Bagaimanakah anda menjadikan skor mentah ini lebih bermakna?
(a) Andaikan bahawa markah ketiga-tiga ujian adalah lebih kurang normal
diedarkan.
(b) Min dan sisihan piawai bagi tiga ujian adalah seperti berikut:
(i) Sains: Min = 90 dan sisihan piawai = 10
(ii) Sejarah: Min = 60 dan Sisihan piawai = 12
(iii) Bahasa Inggeris: Min = 40 dan Sisihan piawai = 15
Berdasarkan maklumat tambahan, apakah kenyataan yang boleh anda buat mengenai prestasi
relatif Zulinda dalam setiap tiga ujian? Berikut adalah beberapa kesimpulan yang boleh anda buat:
(a) Zulinda mendapat markah terbaik dalam ujian Sejarah dan markah mentahnya 72 jatuh pada
titik satu sisihan piawai di atas min;
(b) Markah terbaiknya yang seterusnya ialah bahasa Inggeris dan skor mentahnya 40 jatuh tepat
pada min taburan markah; dan
(c) Akhirnya, walaupun markah mentahnya untuk Sains ialah 80, ia jatuh satu standard
sisihan di bawah min.

Markah mentah, seperti skor ZulindaÊs, boleh ditukar kepada dua jenis skor standard iaitu skor
Z dan skor T.
(a) Skor-Z
Menukarkan skor mentah Zulinda kepada „z-skor‰, kita boleh mengatakan bahawa dia
mencapai:
(i) Z-skor +1 untuk Sejarah
(ii) Z-skor 0 untuk bahasa Inggeris
(iii) Z-skor ÿ1 untuk Sains.
Apakah skor z? Bagaimanakah anda mengira skor z? Skor z ialah sejenis skor standard.
Istilah skor piawai ialah nama umum untuk menukar skor mentah kepada skala lain
menggunakan min yang telah ditentukan dan sisihan piawai yang telah ditetapkan. Skor-Z
memberitahu berapa banyak sisihan piawai dari min skor itu terletak. Skor Z boleh positif
atau negatif. Skor z positif menunjukkan bahawa nilai berada di atas min manakala skor z
negatif menunjukkan bahawa nilai berada di bawah min. Skor ialah skor mentah yang
telah diubah atau ditukar kepada skala dengan min yang piawai
telah ditetapkan
yang telah0ditetapkan
dan sisihandengan-
sebanyak 1. Skor z ÿ6 bermakna skor adalah 6 sisihan piawai di bawah min.
Formula yang digunakan untuk menukar skor mentah kepada skor-z melibatkan penolakan
min daripada skor mentah dan membahagikannya dengan sisihan piawai.
x ÿ
x
ÿ
Dengan
SD
Mari kita gunakan formula ini untuk menukar markah KumarÊs sebanyak 52 yang
diperolehi dalam ujian Geografi. Min bagi ujian itu ialah 70 dan sisihan piawai ialah 7.5.
x ÿ
x 52 70 18
ÿ ÿ
Dengan
ÿ ÿ ÿ ÿÿ
2.4
SD 7.5 7.5
Skor z yang dikira untuk skor mentah 52 ialah ÿ2.4 yang bermaksud bahawa skor Kumar
untuk ujian Geografi terletak 2.4 sisihan piawai di bawah min.

Contoh: Menggunakan Skor Z untuk Membuat Keputusan

Seorang guru mentadbir dua ujian Bahasa Malaysia kepada pelajar di Tingkatan Empat A,
Tingkatan Empat B dan Tingkatan Empat C. Dua pelajar terbaik di Tingkatan Empat C ialah Seng
Huat dan Mei Ling. Guru itu bercadang untuk memberi hadiah kepada pelajar terbaik dalam Bahasa
Malaysia di Tingkatan Empat C tetapi tidak pasti siapa pelajar terbaik.
Ujian 1 Ujian 2
Seng Huat 30 50
Mei Ling 45 35
Min 42 47
Sisihan piawai 7 8
Guru boleh menggunakan min untuk menentukan siapa yang lebih baik. Tetapi kedua-dua pelajar
mempunyai min yang sama. Bagaimana guru membuat keputusan? Dengan menggunakan skor-z,
guru boleh mengetahui sejauh mana skor kedua-dua pelajar itu daripada min dan dengan itu siapa
yang berprestasi lebih baik. Menggunakan formula di atas, guru mengira skor z yang ditunjukkan
dalam perkara berikut:
Ujian 1 Ujian 2 Jumlah
30 42 ÿ
50 47
ÿ
Seng Huat
ÿ
1.71 ÿ
0.375 ÿ1.34
7 8
45 42
ÿ
35 72 ÿ
Mei Ling
ÿ
0.43 ÿ
1.50 ÿ1.07
7 8
Setelah meneliti maklumat dalam jadual, guru mendapati kedua-dua Seng Huat dan Mei Ling
mempunyai skor z negatif untuk jumlah kedua-dua ujian.
Walau bagaimanapun, Mei Ling mempunyai jumlah z-skor yang lebih tinggi (ÿ1.07) berbanding
dengan jumlah z-skor Seng HuatÊs (ÿ1.34). Dalam erti kata lain, jumlah skor Mei LingÊ lebih
hampir kepada min dan oleh itu guru membuat kesimpulan bahawa Mei Ling melakukan lebih baik
daripada Seng Huat.
Skor Z agak mudah digunakan tetapi ramai pendidik enggan menggunakannya terutamanya
apabila markah ujian dilaporkan sebagai nombor negatif. Bagaimanakah anda mahu skor Matematik
anda dilaporkan sebagai ÿ4? Atas sebab ini, kaedah skor standard alternatif digunakan seperti
skor T.

(b) Skor-T
Skor-T telah dibangunkan oleh W. McCall pada tahun 1920-an dan merupakan salah
satu daripada banyak markah standard yang sedang digunakan. Skor-T digunakan
secara meluas dalam psikologi dan pendidikan terutamanya apabila melaporkan prestasi
dalam ujian piawai. Skor T ialah skor piawai dengan min 50 dan sisihan piawai 10.
Formula untuk mengira skor T ialah:
T = 10(z) + 50
Katakan sebagai contoh, pelajar mempunyai skor z ÿ1.0 dan untuk menukarnya kepada skor T:
ÿ
ÿ ÿ ÿ50
T 10(z) 50 10( 1.0) ÿ ÿÿ ÿ 50
( 10)
ÿ
40
Apabila menukar z-skor kepada T-skor, anda harus berhati-hati untuk tidak menjatuhkan
negatif. Menggugurkan negatif akan menghasilkan skor yang sama sekali berbeza.
AKTIVITI 10.3
Tukarkan skor-z berikut kepada skor-T:
z-skor T-skor
+1.0
ÿ2.4
+1.8
Mengapakah anda menggunakan skor-T dan bukannya skor-z apabila melaporkan

prestasi pelajar di dalam bilik darjah?
Terangkan jawapan anda kepada rakan kursus anda dalam forum dalam talian
myINSPIRE.

10.4 KELUK BIASA

Lengkung normal (juga dipanggil „lengkung loceng‰) ialah lengkung hipotetikal yang
sepatutnya mewakili semua fenomena semula jadi. Dalam taburan normal, min,
median dan mod mempunyai nilai yang sama. Diandaikan bahawa jika kita mencuba
ciri tertentu seperti ketinggian lelaki Malaysia, anda akan mendapati ketinggian purata
ialah 5 kaki 4 inci atau 163 cm. Walau bagaimanapun, akan ada beberapa lelaki yang
akan lebih pendek daripada ketinggian purata dan bilangan yang sama yang akan
menjadi lebih tinggi. Dengan memplot ketinggian semua lelaki Malaysia mengikut
kekerapan kejadian, anda boleh mengharapkan untuk memperoleh sesuatu yang
serupa dengan keluk taburan normal.
Rajah 10.7 menunjukkan keluk taburan normal bagi IQ berdasarkan Skala Kepintaran
Wechsler untuk kanak-kanak. Dalam taburan normal, kira-kira dua pertiga (ÿ) individu
akan mempunyai IQ antara 85 dan 115 dengan min 100. Menurut American
Association of Mental Retardation (2006), individu yang mempunyai IQ kurang
daripada 70 boleh diklasifikasikan sebagai terencat akal atau cacat mental dan mereka
yang mempunyai IQ lebih daripada 130 boleh dianggap sebagai berbakat.
Rajah 10.7: Keluk taburan normal IQ berdasarkan Skala Kepintaran Wechsler untuk
kanak-kanak
Begitu juga, markah ujian yang mengukur ciri tertentu seperti kecekapan bahasa,
keupayaan kuantitatif atau literasi saintifik populasi tertentu boleh dijangka
menghasilkan lengkung normal. Lengkung normal dibahagikan mengikut sisihan
piawai (seperti ÿ4s, ÿ3s ÿÿ +3s dan 4s) yang ditunjukkan pada paksi mendatar. Luas
lengkung antara sisihan piawai ditunjukkan

sebagai peratusan pada rajah. Sebagai contoh, kawasan antara min dan sisihan piawai +1 ialah
34.13%. Begitu juga, luas antara min dan sisihan piawai ÿ1 juga 34.13%. Oleh itu, kawasan
antara sisihan piawai ÿ1 dan sisihan piawai +1 ialah 68.26%. Ini bermakna dalam taburan normal,
68.26% individu akan mendapat markah antara sisihan piawai ÿ1 dan +1.
Dalam menggunakan lengkung normal, adalah penting untuk membuat perbezaan antara nilai
sisihan piawai dan skor sisihan piawai. Nilai sisihan piawai ialah pemalar dan ditunjukkan pada
paksi mengufuk dalam Rajah 10.7. Sebaliknya, skor sisihan piawai ialah skor yang diperoleh
apabila kita menggunakan formula sisihan piawai (yang kita bincangkan sebelum ini). Sebagai
contoh, jika kita memperoleh sisihan piawai bersamaan dengan 5, maka skor untuk 1 sisihan
piawai ialah 5 dan skor untuk 2 sisihan piawai ialah 10, skor untuk 3 sisihan piawai ialah 15 dan
seterusnya.
Nilai sisihan piawai ÿ1, ÿ2, dan ÿ3 akan mempunyai skor negatif sepadan ÿ5, ÿ10 dan ÿ15.
Ambil perhatian bahawa dalam Rajah 10.7, skor-z ditunjukkan daripada + 1 hingga + 4 dan ÿ1
hingga ÿ4 dengan min sebagai 0. Setiap selang adalah sama dengan satu sisihan piawai. Begitu
juga, skor-T dilaporkan dari 10 hingga 90 (selang 10) dengan min ditetapkan pada 50. Setiap
selang 10 adalah sama dengan satu sisihan piawai.
ÿ Istilah „kecenderungan pusat‰ merujuk kepada nilai „tengah‰ dan diukur menggunakan min,
median dan mod. Ia adalah petunjuk lokasi
markah.
ÿ Min hanyalah jumlah semua nilai (markah) dibahagikan dengan jumlah item (pelajar) dalam set.
• Median ditentukan dengan menyusun skor yang diperoleh daripada nilai terendah kepada nilai
tertinggi dan mengambil skor yang berada di tengah-tengah urutan.
• Mod adalah skor yang paling kerap berlaku dalam set data.
ÿ Julat markah dalam sesuatu ujian ialah jarak antara markah terendah dengan markah tertinggi
yang diperolehi dalam ujian.
ÿ Sisihan piawai merujuk kepada berapa banyak skor yang diperoleh pelajar menyimpang atau
menangguhkan daripada min.
ÿ Skew merujuk kepada simetri taburan. Sesuatu pengedaran condong jika salah satu ekornya
lebih panjang daripada yang lain.

ÿ Pencong negatif mempunyai ekor yang lebih panjang ke arah negatif.
ÿ Pencong positif mempunyai ekor yang lebih panjang ke arah positif.
ÿ Skor standard merujuk kepada skor mentah yang telah ditukar daripada satu skala
ke skala lain menggunakan min dan sisihan piawai.
ÿ Skor-Z menunjukkan berapa banyak sisihan piawai dari min skor

terletak.
ÿ Skor-T ialah skor piawai dengan min 50 dan sisihan piawai

daripada 10.
ÿ Lengkung normal (juga dipanggil „lengkung loceng‰) ialah lengkung hipotetikal yang sepatutnya
mewakili semua fenomena semula jadi.
Kecenderungan pusat Kecondongan positif
Penyerakan Julat
Min Sisihan piawai
Median Skor standard
Mod T-skor
Pencongan negatif z-skor
Keluk biasa

ÿ JAWAPAN 221
Rujukan
Kebaikan dan keburukan rubrik. Diperoleh daripada

https://engage.intel.com/ thread/11468
ASCD. (2017). Cara mencipta dan menggunakan rubrik untuk penilaian formatif. kepada Diambil semula
daripada http://www.ascd.org/publications/books/112001/chapters/What Are-Rubrics-and-Why-

Are-They-Important%C2%A2.aspx
Menilai pembelajaran berasaskan projek . Diperoleh daripada

http://pblmm.k12.ca.us/PBLGuide/AssessPBL.html
Penilaian autentik dalam bilik darjah . Diperoleh daripada

https://www.teachervision.com/teaching-methods-and-management/ educational-testing/
4911.html
Blank, W., & Harwell, S. (1997). Menghubungkan sekolah menengah dengan dunia sebenar.
Perkhidmatan Pengeluaran Semula Dokumen ERIC No. ED407586 kosong.
Institut Teknologi British Columbia. (2010). Membangunkan senarai semak dan

skala penilaian . Diperoleh daripada
http://www.northernc.on.ca/leid/docs/ ja_developchecklists.pdf
Brookhart, SM (1999). Seni dan sains penilaian bilik darjah: Bahagian pedagogi yang hilang.
Laporan Pengajian Tinggi ASHE-ERIC (Jilid 27, No. 1).
Washington, DC: Universiti George Washington, Siswazah. Pusat Pengajian Pendidikan dan
Pembangunan Insan.
Cashin, KAMI (2014). Menambah baik ujian esei . Amerika Syarikat: Universiti Negeri Kansas.
Diperoleh daripada http://www.idea.ksu.edu/papers/Idea_Paper_17.pdf
Chard, SC (1992). Pendekatan projek: Panduan praktikal untuk guru .

Edmonton, Alberta: Perkhidmatan Percetakan Universiti Alberta.
Kanak-kanak, RA (1989). Membina ujian pencapaian. ERIC Digest. (ED315426ERIC

Clearinghouse mengenai Pengukuran dan Penilaian Ujian Washington DC., Institut Penyelidikan
Amerika Washington DC. Diperoleh daripada http://www.ericdigests.org/pre-9213/classroom.htm
Chong, HY http://Kebolehpercayaan dan kesahan. Diperoleh daripada

seamonkey.ed.asu.edu/~alex/teaching/assessment/reliability.html

222 ÿ RUJUKAN
Connie Malamed. (2016). Menulis soalan aneka pilihan untuk susunan yang lebih tinggi
berfikir. Diperoleh
daripada http://theelearningcoach.com/elearning_design/multiple-choice
questions/
Universiti Concordia. Nasihat menggunakan penilaian autentik dalam pengajaran.

Diperoleh
daripada http://education.cu-portland.edu/blog/curriculum-instruction/tips-on how-to-
use-authentic-assessment-as-a-teaching-strategy/
Frey, BB (2003). Soalan yang sepadan . Diperoleh

daripada http://www.specialconnections.ku.edu/cgi bin/
cgiwrap/specconn/main.php?cat=assessment&section=main&subsect
ion=ujian kualiti/padanan
Frey, BB (2003). Soalan aneka pilihan . Diperoleh daripada

http://www.specialconnections.ku.edu/cgi bin/
ion=ujian kualiti/berbilang
Frey, BB (2003). Jadual spesifikasi . Diperoleh daripada

http://www.specialconnections.ku.edu/cgi bin/
ion=ujian kualiti/jadual
Universiti Flinders. (2017). Apa itu a rubrik? Diperoleh daripada

https://www.flinders.edu.au/teaching/teaching strategies/
assessment/grading/rubric.cfm
Gibson, I. (2005). Mereka bentuk projek untuk pembelajaran . Diperoleh

daripada http://www.aishe.org/readings/2005-2/chapter3.pdf
Grams, B.F. (1981). yang membina

Peperiksaan karangan . Diperoleh daripada
http://www.studygs.net/tsttak4a.htm
Grams, B.F. (1981). Peraturan membina soalan esei . NY: Holt, Rinehart &
Winstoo. Diperoleh daripada
http://www.personal.psu.edu/faculty/s/r/sra113/602/essayexams.htm
Griffith, K., & Nguyen, A. (2005). Adakah pendidik bersedia mempengaruhiafektif kepada
domain? Diperoleh daripada
www.nationalforum.com/Jumlah Jurnal Elektronik/Griffith, Kimberly G

RUJUKAN ÿ 223
Huitt, W. (2004). mekar dan al.Ês taksonomi domain kognitif. Psikologi pendidikan interaktif.
Valdosta, GA: Universiti Negeri Valdosta. Diperoleh daripada
http://chiron.valdosta.edu/whuitt/col/cogsys/bloom.html
.
Analisis item untuk item aneka pilihanERIC Digest. Diperoleh daripada
http://www.eric.ed.gov/ERICDocs/data/ericdocs2/content_storage_01/0
000000b/80/2a/26/4c.pdf
Analisis item . Sambungan Khas. Diperoleh daripada

http://www.specialconnections.ku.edu/cgi bin/cgiwrap/
specconn/main.php?cat=assessment&section=main&subsect
ion=ujian kualiti/item
Kemp, J., & Teperof, D. (nd). Garis panduan untuk penilaian portfolio . Diambil semula
daripada http://www.anglit.net/main/portfolio/default.html
Kohn, A. (2006). Masalah dengan rubrik. tidak. 4. Jurnal Bahasa Inggeris Mac 2006. Jld. 95,
Kubiszyn, T., & Borich, G. (2003). Ujian dan pengukuran pendidikan:

Aplikasi dan latihan Bilik Darjah . Amerika Syarikat: John Wiley & Sons.
L. Brady. (2012). Penilaian dan Pelaporan: Meraikan Pencapaian Pelajar

(edisi ke-4). Pearson Australia.
Landsberger, JF (1996). http:// Membina Item Betul-Salah. Diperoleh daripada

www.studygs.net/tsttak2a.htm
Sekolah Rendah Larapinta. (2008). Kotak alat berfikir: Domain afektif

(Taksonomi KrathwohlÊs). Diperoleh daripada http://www.schools.nt.edu.au/
larapsch/affective.htm
Lewis, T. (1904). Kecerdasan am: Ditentukan dan diukur secara objektif.

Jurnal Amerika Psikologi.
daripada 15. 201ÿ293. Diperoleh daripada
http://psychclassics.yorku.ca/Spearman
Lewis, T. (1916). Kegunaan Ujian Kecerdasan. Pertama kali diterbitkan dalam The
pengukuran kecerdasan
daripada (bab 1). Boston, MA: Houghton Mifflin.
Diperoleh daripada http://psychclassics.yorku.ca/Terman/terman1.htm
Lin, RL, & Gronlund, NE (2000). Pengukuran dan penilaian dalam pengajaran.
New Jersey: Prentice Hall.

224 ÿ RUJUKAN
Linquist, EF (1951). Pertimbangan Awal dalam Pembinaan Ujian Objektif. (ms. 4ÿ22).
Dalam EF Linquist (Ed.). Pengukuran Pendidikan Washington
DC. Majlis Pendidikan Amerika.
Long, C. (2006). Menyedari potensi pentaksiran

berasaskan sekolah . Diambil semula
daripada
http://www.iaea2006.seab.gov.sg/conference/download/papers/Realisin
g%20potensi%20%20pentaksiran%20berasaskan%20sekolah.pdf
Matematik. (2008). Pentaksiran dalam matematik . Diperoleh

daripada http://www.learnalberta.ca/content/mewa/html/assessment/checklists.
html
Perbincangan min, median dan mod . Diperoleh

daripada http://www.shodor.org/interactivate/discussions/sd1.html
Mueller, J. (2016). Kotak alat penilaian tulen. Diperoleh

daripada http://jfmueller.faculty.noctrl.edu/toolbox/howstep1.htm
Pennekamp, M. (nd). Panduan tingkah laku dan arahan bilik darjah . Diambil semula
daripada http://www.humboldt.edu/~tha1/observ.html
Universiti Negeri Pennsylvania. (2009). Taksonomi domain afektif. Diperoleh

daripada http://www.personal.psu.edu/staff/b/x/bxb11/Objectives/affective.htm
Melakukan analisis item . Diperoleh

daripada http://www.alexandercsd.org/testing/performing_item_analysis.htm
Phillips, JA, Ansary Ahmed, & Kuldip Kaur. (2005). Reka bentuk
prinsip pengajaran pembangunan kursus siswazah e-pembelajaran.Kertasdalam
kerja dibentangkan di The International Conference in E-Learning. Bangkok,
Thailand.
Kerja amali dalam sains . Diperoleh daripada

http://www.cie.org.uk/CIE/WebSite/UCLESData/Documents/IGCSE/
Sample%20Papers/Maths,%20Science%20&%20Technical/Science.pdf
Fakta pantas tentang keluk biasa . Diperoleh daripada

http://www.willamette.edu/~mjaneba/help/normalcurve.html
Randall, V. (2004). Domain psikomotor . Diperoleh daripada

http://academic.udayton.edu/gender/01Unit/lesson01c.htm

RUJUKAN ÿ 225
Kebolehpercayaan dan kesahan ujian bilik darjah. Diperoleh daripada

http://www.ncrel.org/sdrs/areas/issues/methods/assment/as5relia.htm
Kebolehpercayaan dan kesahan. Diperoleh daripada

http://www.georgetown.edu/departments/psychology/researchmethods
/researchanddesign/validityndreliability.htm
Reynolds, CR, Livingston, RB, & Willson, V. (2006). Pengukuran dan

pendidikan. penilaian
dalam Amerika Syarikat: Pendidikan Pearson.
ScorePak. Analisis item . Diperoleh daripada

http://www.washington.edu/oea/pdfs/resources/item_analysis.pdf
Serong. Diperoleh daripada http://davidmlane.com/hyperstat/A11284.html
Stanley, G., & Hopkins, D. (1972). Pengenalan pengukuran pendidikan dan kepada
ujian. Boston, MA: Macmillan.
Svinicki, M. (2002). Pembinaan ujian: beberapa idea praktikal . Diperoleh daripada

http://www.utexas.edu/academic/cte/sourcebook/tests.pdf
T-skor . Diperoleh daripada

http://www.sadovsky.wustl.edu/Tscore/Introduction.html
Universiti Mississippi. (2009). Domain psikomotor . Diperoleh daripada

http://www.olemiss.edu/depts/educ_school2/docs/stai_manual/manual
10.htmPusat Sains Kesihatan Universiti Texas Utara UNTHSC Scholarly Repository
(2012). Merekabentuk Soalan Aneka Pilihan untuk Mengukur Pemikiran Aras Tinggi.
Diperoleh daripada http://digitalcommons.hsc.unt.edu/cgi/viewcontent.cgi?article=1009&con
text=test_item
Universiti Washington. (2017). Membina ujian. Diperoleh daripada

http://www.washington.edu/teaching/constructing-tests/
Universiti Wisconsin. Jenis soalan peperiksaan dan kecekapan pelajar .

Diperoleh daripada
http://wiscweb3.wisc.edu/teachingacademy/Assistance/course/mult.htm
Kesahan . Diperoleh daripada

http://www.ihs.ox.ac.uk/sepho/publications/carrhill/vii/7-4-2.htm
Vander Ark, T. (2013). Apakah penilaian prestasi? Diperoleh daripada

http://gettingsmart.com/2013/12/performance-assessment/

226 ÿ RUJUKAN
Whitehouse, M. (2013). Kepentingan dalam penilaian perancangan kurikulum .

Diperoleh
daripada http://www.workingoutwhatworks.com/en
GB/Magazine/2015/2/Assessment_and_curriculum_planning
Williams, D. (2011). Penilaian formatif terbenam. Bloomington, IN: Penyelesaian

Tekan Pokok.
Wiggins, G., & McTighe, J. (2005). Pemahaman mengikutreka bentuk. New Jersey, NJ:
Pendidikan Pearson.
Wiggins, Grant. (1990). Kes untuk penilaian autentik. Penilaian Praktikal,

Penyelidikan& Penilaian, 2 (2). Diperoleh pada 14 Julai 2016
daripada http://PAREonline.net/getvn.asp?v=2&n=2
Skor Z dijelaskan . Diperoleh daripada

http://www.sysurvey.com/tips/statistics/zscore.htm

MAKLUM BALAS MODUL

MAKLUM BALAS MODUL
Jika anda mempunyai sebarang komen atau maklum balas, anda dialu-alukan untuk:
1. E-mel komen atau maklum balas anda ke modulefeedback@oum.edu.my
ATAU
2. Isi borang penilaian dalam talian Modul Cetak yang terdapat di myINSPIRE.
Terima kasih.
Pusat Reka Bentuk dan Teknologi Pengajaran ()

Pusat Reka Bentuk Pengajaran dan Teknologi
No. Telefon: 03-78012140
No. Faks: 03-78875911 / 03-78875966


Nota Ea BM

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Nota Ea BM

Uploaded by

Copyright:

Available Formats

Machine Translated by Google

Copyright © Open University Malaysia (OUM)

Copyright © Open University Malaysia (OUM)

Edisi keempat 2021 (CS)

Dibangunkan oleh Pusat Reka Bentuk dan Teknologi Pengajaran, OUM.

Hak Cipta © Open University Malaysia (OUM), HPGD2303 Hak cipta

Copyright © Open University Malaysia (OUM)

Panduan Kursus ixÿxix

Panduan Tugasan Kursus xxiaxxv

Topik 1 Peranan Pentaksiran dalam Pengajaran dan Pembelajaran 1

1.3 Prinsip Umum Penilaian 1.4 Jenis-jenis 10

Penilaian 1.4.1 Penilaian Formatif vs Sumatif 11

Hasil Afektif 2.5 Menilai Hasil Pembelajaran Psikomotor 24

Ringkasan Istilah Utama 30

Topik 3 Merancang Ujian Bilik Darjah 3.1 Tujuan 42

Skema Pemarkahan 3.2.6 Menyediakan Item Ujian 49

3.3 Menilai Ringkasan Ujian Guru Sendiri Terma Utama 50

Copyright © Open University Malaysia (OUM)

Topik 4 Membina Item Ujian Objektif 4.1 Apakah itu Ujian 55

4.5 Soalan Aneka pilihan 4.5.1 Bahagian 68

Soalan Aneka pilihan 4.5.2 Pembinaan Soalan Aneka 69

pilihan 4.5.3 Kelebihan dan Had MCQ 4.5.4 Membina MCQ 70

untuk Mengukur Pemikiran Aras Tinggi (HOT) 75

Topik 5 Membina Soalan Esei 5.1 Apakah Soalan 83

Pelbagai Jenis Tugasan Mental 5.9 Menanda Soalan Utama Esei 91

Topik 6 Pentaksiran Tulen 110

6.1.1 Jenis-jenis Pentaksiran Tulen 6.1.2 Ciri-ciri 112

Copyright © Open University Malaysia (OUM)

6.4 Alat Penilaian 6.4.1 Rubrik 121

Pemarkahan 6.4.2 Skala 122

Penilaian 6.4.3 Ringkasan 124

Topik 7 Penilaian Projek dan Portfolio 7.1 Penilaian Projek 128

Topik 8 Kebolehpercayaan dan Kesahan Ujian 8.1 160

antara Kebolehpercayaan dan Ringkasan Kesahan Terma Utama 175

Copyright © Open University Malaysia (OUM)

Topik 9 Menilai Ujian Bilik Darjah dan Analisis Item 180

Copyright © Open University Malaysia (OUM)

Copyright © Open University Malaysia (OUM)

Copyright © Open University Malaysia (OUM)

Selamat datang ke HPGD2303 x

Apa yang Anda Akan Dapatkan daripada Kursus ini? x

Bagaimana Anda Akan Dinilai? xv

Bagaimana Anda harus Belajar untuk Kursus ini? xvi

Copyright © Open University Malaysia (OUM)

SELAMAT DATANG KE HPGD2303 EDUCATIONAL

APA YANG ANDA AKAN DAPAT DARI KURSUS INI?

Copyright © Open University Malaysia (OUM)

Hasil Pembelajaran Kursus

Rajah 1: Masa Pembelajaran Murid

Copyright © Open University Malaysia (OUM)

xii ÿ PANDUAN KURSUS

BAGAIMANAKAH ANDA BOLEH MENDAPATKAN YANG TERBAIK

1. Panduan Kursus yang sedang anda baca;

2. Kandungan Kursus (terdiri daripada 10 topik);

4. Platform Kursus Dalam Talian iaitu Perbincangan Dalam Talian myINSPIRE.

Topik Tajuk Minggu

1. Peranan Pentaksiran dalam Pengajaran dan Pembelajaran 1

2. Asas untuk Penilaian: Apa yang Perlu Dinilai 2ÿ3

3. Merancang Ujian Bilik Darjah 3

4. Membina Item Ujian Objektif 4ÿ5

5. Membina Ujian Esei 6ÿ7

7. Penilaian Projek dan Portfolio 8ÿ9

8. Kebolehpercayaan dan Kesahan Ujian 10