Professional Documents
Culture Documents
Nota Ea BM
Nota Ea BM
HPGD2303
Penilaian Pendidikan
HPGD2303
PENDIDIKAN
PENILAIAN
Prof Dr John Arul Phillips
www.oum.edu.my
Isi kandungan
Menilai? 5
17
19
19
Topik 2 Asas untuk Pentaksiran: Apa yang Perlu Ditaksir 2.1 Apa 20
yang Perlu Dinilai 2.2 Tiga Jenis Hasil Pembelajaran 21
2.3 Menilai Hasil Pembelajaran Kognitif 2.4 Menilai 22
iv ÿ ISI KANDUNGAN
66
67
Ringkasan 81
Syarat Utama 82
5.4 Memutuskan Sama ada Menggunakan Esei Atau Soalan Objektif 5.5 87
Batasan Soalan Esei 5.6 Beberapa Kesalahpahaman tentang Soalan Esei 5.7 88
Beberapa Garis Panduan Membina Soalan Esei 5.8 Kata Kerja Menghuraikan 89
ISI KANDUNGAN ÿ v
155
Terma Utama 158
Ringkasan 159
vi ÿ ISI KANDUNGAN
Topik 10 Analisis dan Tafsiran Skor Ujian 10.1 Mengapa Kami 203
Menggunakan Statistik? 204
10.2 Menghuraikan Markah Ujian 206
10.3 Markah Piawai 10.4 Terma 214
Utama Ringkasan Keluk Biasa 218
219
220
Rujukan 221
PANDUAN KURSUS
Isi kandungan
Bagaimana Anda boleh Mendapat Manfaat Terbaik daripada Kursus ini? xii
Panduan Susunan
Teks Sinopsis Kursus
Pakej Pembelajaran
Apakah Sokongan yang Anda Akan Dapatkan dalam Mempelajari Kursus ini? xv
Seminar
myINSPIRE Sumber Perpustakaan
Fasilitator Perbincangan Dalam Talian
x ÿ PANDUAN KURSUS
Penerangan Kursus
Kursus ini membincangkan perbezaan antara ujian, pengukuran dan penilaian atau
penilaian. Tumpuan diberikan kepada peranan penilaian dan diikuti dengan
perbincangan tentang „apa yang perlu dinilai‰, yang membentuk asas penilaian.
Berkenaan dengan „apa‰, penekanan adalah pada hasil kognitif, hasil afektif dan hasil
psikomotor. Topik seterusnya merangkumi aspek cara menilai dengan penekanan
kepada kemahiran berfikir aras tinggi. Selain ujian objektif dan esei biasa, teknik
penilaian autentik lain seperti projek dan portfolio dibentangkan. Turut dibincangkan
ialah teknik untuk menentukan keberkesanan pelbagai pendekatan penilaian yang
memberi tumpuan kepada kebolehpercayaan, kesahan dan analisis item. Akhir sekali,
pelbagai prosedur statistik asas dibentangkan dalam analisis keputusan penilaian dan
tafsirannya.
Matlamat Kursus
Matlamat utama kursus ini adalah untuk menyediakan pelajar asas mengenai prinsip
dan teori ujian dan penilaian pendidikan serta aplikasinya di dalam bilik darjah.
PANDUAN KURSUS ÿ xi
1. Mengaplikasikan prinsip yang berbeza dalam pembangunan teknik penilaian untuk persekitaran
bilik darjah.
2. Rancang dan bina ujian bilik darjah yang berbeza untuk tujuan yang berbeza.
3. Melaksanakan ujian bilik darjah menggunakan statistik untuk menganalisis dan mentafsir penilaian
keputusan.
JADUAL PENGAJIAN
Ia adalah amalan OUM standard bahawa pelajar mengumpul 40 jam belajar untuk setiap jam kredit.
Oleh itu, untuk kursus 3 jam kredit, anda dijangka menghabiskan 120 jam belajar. Rajah 1
menunjukkan masa pembelajaran pelajar (SLT).
Pakej Pembelajaran
Dalam Pakej Pembelajaran ini anda dibekalkan dengan tiga jenis bahan kursus:
3. Panduan Penilaian Kursus (yang menerangkan tugasan yang perlu dihantar dan peperiksaan
yang anda perlu duduki); dan
Sila pastikan anda mempunyai semua bahan ini dan url yang betul.
Sinopsis Kursus
Untuk membolehkan anda mencapai empat hasil kursus, kandungan kursus telah dibahagikan
kepada 10 topik. Hasil pembelajaran khusus dinyatakan pada permulaan setiap topik yang
menunjukkan perkara yang anda sepatutnya dapat capai selepas menyelesaikan setiap topik.
6. Penilaian Tulen 8
Topik 1 membincangkan perbezaan antara ujian, pengukuran, penilaian dan penilaian, peranan penilaian
dalam pengajaran dan pembelajaran dan beberapa prinsip umum penilaian. Turut diterokai ialah perbezaan
antara penilaian formatif dan sumatif serta perbezaan antara ujian rujukan kriteria dan norma. Topik ini
diakhiri dengan perbincangan ringkas tentang trend semasa
dalam penilaian.
Topik 2 membincangkan tingkah laku yang akan diuji memfokuskan pada hasil pembelajaran kognitif,
afektif dan psikomotor serta sebab mengapa penilaian dua hasil yang terakhir diabaikan.
Topik 3 menyediakan beberapa garis panduan berguna untuk membantu guru merancang penilaian yang
sah, boleh dipercayai dan berguna. Perbincangan termasuk menentukan perkara yang hendak diukur dan
meminimumkan ketidakrelevanan pengukuran. Topik ini juga akan membimbing guru untuk merangka
strategi untuk mengukur domain dengan baik. Contoh Jadual Spesifikasi, jadual 2 hala dibentangkan.
Topik 4 membincangkan reka bentuk dan pembangunan ujian objektif dalam penilaian pelbagai jenis
tingkah laku dengan penekanan kepada batasan dan kelebihan menggunakan alat penilaian jenis ini.
Topik 5 mengkaji peranan ujian esei dalam menilai pelbagai jenis hasil pembelajaran serta batasan dan
kekuatannya, dan prosedur yang terlibat dalam reka bentuk soalan esei yang baik.
Topik 6 memperkenalkan satu bentuk penilaian di mana pelajar ditugaskan untuk melaksanakan tugas
dunia sebenar yang menunjukkan aplikasi bermakna pengetahuan dan kemahiran penting. Guru akan
dapat memahami bagaimanakah Pentaksiran Autentik serupa atau berbeza dengan Pentaksiran
Tradisional. Penekanan juga diberikan kepada rubrik pemarkahan.
Topik 7 membincangkan secara terperinci dua contoh penilaian autentik iaitu penilaian portfolio dan projek.
Garis panduan kepada penyertaan portfolio dan kerja projek dan kriteria penilaian dibincangkan secara
terperinci.
Topik 8 memberi tumpuan kepada konsep asas kebolehpercayaan dan kesahan ujian. Topik ini juga
termasuk kaedah untuk menganggarkan kebolehpercayaan sesuatu ujian dan faktor untuk meningkatkan
kebolehpercayaan dan kesahan sesuatu ujian.
Topik 9 mengkaji konsep analisis item dan prosedur yang berbeza untuk mewujudkan
keberkesanan ujian objektif dan jenis esei yang memfokuskan kepada kesukaran item dan
diskriminasi item. Topik diakhiri dengan penerangan ringkas tentang bank item.
Topik 10 memberi tumpuan kepada analisis dan tafsiran data yang dikumpul oleh ujian.
Untuk analisis kuantitatif data, pelbagai prosedur statistik digunakan. Beberapa prosedur
statistik yang digunakan dalam tafsiran dan analisis keputusan penilaian ialah ukuran
kecenderungan memusat dan pekali korelasi.
Hasil Pembelajaran: Bahagian ini merujuk kepada perkara yang perlu anda capai selepas
anda menyelesaikan topik sepenuhnya. Semasa anda meneliti setiap topik, anda harus
kerap merujuk kepada hasil pembelajaran ini. Dengan melakukan ini, anda boleh terus
mengukur pemahaman anda tentang topik tersebut.
Semakan Kendiri: Komponen modul ini disisipkan di lokasi strategik sepanjang modul. Ia
boleh disisipkan selepas satu subtopik atau beberapa subtopik.
Ia biasanya datang dalam bentuk soalan. Apabila anda menjumpai komponen ini, cuba
renungkan apa yang telah anda pelajari setakat ini. Dengan cuba menjawab soalan, anda
seharusnya dapat mengukur sejauh mana anda telah memahami subtopik. Selalunya,
jawapan kepada soalan boleh didapati terus daripada modul itu sendiri.
Aktiviti: Seperti Semak Kendiri, komponen Aktiviti juga diletakkan di pelbagai lokasi atau
persimpangan sepanjang modul. Komponen ini mungkin memerlukan anda menyelesaikan
soalan, meneroka kajian kes pendek atau menjalankan pemerhatian atau penyelidikan. Ia
mungkin memerlukan anda menilai senario tertentu. Apabila anda menjumpai Aktiviti, anda
harus cuba merenung apa yang telah anda kumpulkan daripada modul dan gunakannya
dalam situasi sebenar. Anda harus, pada masa yang sama, melibatkan diri anda dalam
pemikiran aras tinggi di mana anda mungkin diperlukan untuk menganalisis, mensintesis
dan menilai dan bukannya hanya perlu mengingat dan mentakrifkan.
PANDUAN KURSUS ÿ xv
Ringkasan: Anda akan menemui komponen ini pada akhir setiap topik. Komponen ini
membantu anda meringkas keseluruhan topik. Dengan melalui ringkasan, anda seharusnya
dapat mengukur tahap pengekalan pengetahuan anda. Sekiranya anda mendapati perkara
dalam ringkasan yang anda tidak faham sepenuhnya, adalah idea yang baik untuk anda
menyemak semula butiran dalam modul.
Istilah Utama: Komponen ini boleh didapati pada akhir setiap topik. Anda harus melalui
komponen ini untuk mengingatkan diri anda tentang istilah atau jargon penting yang
digunakan sepanjang modul. Sekiranya anda menemui istilah di sini yang tidak dapat anda
jelaskan, anda harus mencari istilah dalam modul.
Rujukan: Bahagian Rujukan ialah tempat senarai buku teks, jurnal, artikel, kandungan
elektronik atau sumber yang relevan dan berguna boleh ditemui. Senarai itu boleh muncul
di beberapa lokasi seperti dalam Panduan Kursus (di bahagian Rujukan), pada akhir setiap
topik atau di belakang modul. Anda digalakkan untuk membaca atau merujuk kepada
sumber yang dicadangkan untuk mendapatkan maklumat tambahan yang diperlukan dan
untuk meningkatkan pemahaman keseluruhan kursus anda.
Kaedah Penilaian
Sila rujuk myINSPIRE.
Seminar
Terdapat 15 jam seminar atau interaksi bersemuka yang menyokong kursus.
Ini terdiri daripada empat hingga lima sesi seminar selama 3 jam setiap satu. Anda akan
dimaklumkan tentang tarikh, masa dan lokasi seminar ini bersama-sama dengan nama
dan nombor telefon tutor anda sebaik sahaja anda ditugaskan ke kumpulan tutorial.
Selain sesi tutorial bersemuka, anda mendapat sokongan perbincangan dalam talian. Anda harus
berinteraksi dengan pelajar lain dan fasilitator anda menggunakan myINSPIRE. Penyertaan dan
sumbangan anda kepada perbincangan dalam talian akan meningkatkan pemahaman anda
tentang kandungan kursus, membimbing anda dalam tugasan serta persediaan untuk peperiksaan.
Fasilitator
Fasilitator anda akan menandakan tugasan anda dan membantu anda semasa kursus. Jangan
teragak-agak untuk berbincang semasa sesi tutorial atau dalam talian jika:
ÿ Anda tidak memahami mana-mana bahagian kandungan kursus atau yang diberikan
bacaan;
Sumber Perpustakaan
Perpustakaan Digital mempunyai banyak koleksi buku dan jurnal yang boleh anda akses
menggunakan ID pelajar anda.
(a) Langkah yang paling penting ialah membaca kandungan Panduan Kursus ini dengan teliti.
(b) Susun jadual belajar. Perhatikan masa yang anda dijangka luangkan untuk setiap topik
dan tarikh penyerahan tugasan serta tarikh seminar dan peperiksaan. Ini dinyatakan
dalam Panduan Penilaian Kursus anda. Catatkan semua maklumat ini di satu tempat
seperti diari anda atau kalendar dinding. Catat tarikh anda sendiri untuk mengerjakan
setiap topik. Anda mempunyai sedikit fleksibiliti kerana terdapat 10 topik yang tersebar
dalam tempoh 14 minggu.
(c) Sebaik sahaja anda telah mencipta jadual belajar anda sendiri, berusaha sedaya upaya
untuk „berpegang padanya‰. Sebab utama pelajar tidak dapat mengatasi adalah kerana
mereka ketinggalan dalam kerja kursus mereka.
ÿ Ingat bahawa dalam pembelajaran jarak jauh, banyak masa anda akan dibelanjakan
untuk MEMBACA kandungan kursus. Kaji senarai topik yang diberikan pada
permulaan setiap topik dan periksa hubungan topik dengan topik lain.
ÿ Baca hasil pembelajaran topik tersebut (apa yang diharapkan daripada anda).
Adakah anda sudah mengetahui beberapa perkara penting dalam topik tersebut?
Apakah perkara yang anda tidak tahu?
ÿ Semasa anda menyelesaikan topik, anda akan diarahkan untuk melakukan ujian kendiri pada
selang masa yang sesuai sepanjang topik. Ini akan membolehkan anda mengetahui sama
ada anda memahami perkara yang baru anda baca.
ÿ Kerjakan aktiviti yang dinyatakan (untuk melihat sama ada anda boleh menggunakan konsep
yang dipelajari dalam situasi dunia sebenar).
(f) Apabila anda telah menyelesaikan topik tersebut, semak semula hasil pembelajaran untuk
mengesahkan bahawa anda telah mencapainya dan mampu melakukan apa yang diperlukan.
(g) Jika anda yakin, anda boleh meneruskan ke topik seterusnya. Teruskan topik demi topik melalui
kursus dan cuba mempercepatkan kajian anda supaya anda mengikut jadual yang dirancang.
(h) Selepas menyelesaikan semua topik, semak semula kursus dan sediakan diri anda untuk
peperiksaan akhir. Semak bahawa anda telah mencapai semua topikÊ hasil pembelajaran dan
objektif kursus (disenaraikan dalam Panduan Kursus ini).
MAKLUMAN AKHIR
Sekali lagi, selamat datang ke kursus. Untuk memaksimumkan keuntungan anda daripada kursus ini, anda
harus cuba pada setiap masa untuk mengaitkan perkara yang anda pelajari dengan dunia sebenar. Lihatlah
persekitaran dalam organisasi anda dan tanya diri anda sama ada idea yang dibincangkan terpakai. Kebanyakan
idea, konsep dan prinsip yang anda pelajari dalam kursus ini mempunyai aplikasi praktikal. Adalah penting
untuk menyedari bahawa kebanyakan perkara yang kita lakukan dalam pendidikan dan latihan mestilah
berdasarkan asas teori yang kukuh.
Kandungan kursus ini hanya membincangkan prinsip asas dan konsep pentaksiran dalam pendidikan. Anda
dinasihatkan untuk melangkaui kursus dan teruskan dengan banyak belajar sendiri untuk meningkatkan lagi
pengetahuan anda tentang pendidikan
penilaian.
Kami berharap anda berjaya dengan kursus ini dan berharap anda akan mendapati ia menarik, berguna dan
relevan dalam pembangunan anda sebagai seorang profesional. Kami berharap anda akan menikmati
pengalaman anda dengan OUM dan kami ingin mengakhiri dengan pepatah oleh Confucius ÿ „Pendidikan
tanpa berfikir adalah hilang tenaga‰.
Isi kandungan
pengenalan xxii
(a) Plagiarisme
• Petikan Langsung
(c) Rujukan
• Artikel Jurnal
• Laman web
• Buku
• Akhbar Bercetak
PENGENALAN
Panduan ini menerangkan asas di mana anda akan dinilai dalam kursus ini pada semester tersebut. Ia
mengandungi butiran tugasan yang ditanda fasilitator, peperiksaan akhir dan penyertaan yang diperlukan
untuk kursus.
Satu elemen dalam strategi penilaian kursus ialah semua pelajar dan fasilitator harus diberikan maklumat
yang sama tentang bagaimana pelajar akan dinilai. Oleh itu, panduan ini juga mengandungi kriteria
pemarkahan yang akan digunakan oleh fasilitator dalam menilai kerja anda.
PENULISAN AKADEMIK
(a) Plagiarisme
Parafrasa Hujah pengarang yang beralasan rapat diparafrasa tetapi pelajar tidak mengakui berbuat
demikian. (Jelas sekali, semua pengetahuan kita diperolehi dari suatu tempat tetapi
hujah terperinci daripada sumber yang boleh dikenal pasti dengan jelas mesti diakui.)
Plagiarisme Bahagian besar kertas hanya disalin daripada sumber lain dan bahagian yang
secara terang-terangan disalin tidak diiktiraf sebagai petikan.
Lain-lain Ini selalunya termasuk esei yang ditulis oleh pelajar lain atau dijual oleh organisasi
sumber yang tidak bertanggungjawab. Petikan daripada kertas tersebut adalah sah jika
tanda petikan digunakan dan sumbernya disebut.
Kerja oleh Mengambil kredit dengan sengaja atau tidak sengaja untuk karya yang dihasilkan
orang lain oleh orang lain tanpa memberikan pengakuan yang sewajarnya.
Kerja-kerja ini termasuk gambar, carta, graf, lukisan, statistik, klip video, klip audio,
pertukaran lisan seperti temu bual atau kuliah, persembahan di televisyen dan teks
yang dicetak di Web.
Penduaan Pelajar menghantar esei yang sama untuk dua atau lebih kursus.
• Masukkan tanda petikan untuk „salin dan tampal‰ klausa, frasa, ayat dan
perenggan, dan nyatakan sumber asal;
• Menghuraikan klausa, frasa, ayat atau perenggan dengan perkataan anda sendiri
dan sebutkan sumber anda;
• Cuba untuk menulis secara bebas tanpa terlalu bergantung kepada maklumat
daripada karya asal orang lain; dan
• Didik diri anda tentang perkara yang boleh dianggap sebagai pengetahuan umum
(tidak perlu hak cipta), domain awam (hak cipta telah tamat tempoh atau tidak
dilindungi di bawah undang-undang hak cipta) atau hak cipta (dilindungi secara
sah).
(c) Rujukan
Semua sumber yang anda sebutkan dalam kertas kerja anda hendaklah Rujukan
disenaraikan dalam bahagian di penghujung kertas anda. Berikut ialah cara anda harus
menyenaraikan rujukan anda:
www.nps.gov/abli/
Dicetak Holden, S. (1998, 16 Mei). Frank Sinatra meninggal dunia pada usia 82 tahun:
surat khabar Penggaya pop yang tiada The New York Times ,
tandingan. ms A1, A22ÿA23.
• Anda telah berfikir secara kritis tentang isu yang dibangkitkan dalam kursus;
• Anda menyatakan hujah-hujah anda dengan jelas dengan bukti-bukti sokongan dan wajar
rujukan sumber; dan
Topik ÿ Peranan
Penilaian dalam
1 Pengajaran dan
Pembelajaran
HASIL PEMBELAJARAN
Pada akhir topik ini, anda seharusnya dapat:
1. Bezakan antara ujian, pengukuran, penilaian dan
penilaian;
ÿ PENGENALAN
Topik ini membincangkan perbezaan antara ujian, pengukuran, penilaian dan penilaian, peranan
penilaian dalam pengajaran dan pembelajaran, dan beberapa prinsip umum penilaian. Turut
diterokai ialah perbezaan antara penilaian formatif dan sumatif serta perbezaan antara ujian
rujukan kriteria dan norma. Topik ini diakhiri dengan perbincangan ringkas mengenai trend semasa
dalam penilaian.
Rajah 1.1: Bolehkah anda membezakan antara ujian, pengukuran, dan penilaian
dan penilaian?
(a) Ujian
Kebanyakan orang biasa dengan ujian kerana kita semua, pada satu ketika dalam hidup
kita, telah mengambil beberapa bentuk ujian. Di sekolah, ujian diberikan untuk mengukur
kebolehan akademik kita dan secara tidak langsung untuk menilai sama ada kita telah
mendapat daripada pengajaran oleh guru. Di tempat kerja, ujian dijalankan untuk memilih
orang yang sesuai untuk pekerjaan tertentu, ujian digunakan sebagai asas untuk kenaikan
pangkat pekerjaan dan ujian digunakan untuk menggalakkan pembelajaran semula. pakar perubatan,
peguam, perunding insurans, ejen hartanah, jurutera, penjawat awam dan banyak lagi
profesion lain dikehendaki mengambil ujian untuk menunjukkan kecekapan mereka dalam
bidang tertentu dan dalam beberapa kes untuk dilesenkan untuk mengamalkan profesion
atau perdagangan mereka.
Sepanjang kerjaya profesional mereka, guru, kaunselor dan pentadbir sekolah dikehendaki
menjalankan, menskor dan mentafsir pelbagai jenis ujian. Sebagai contoh, pentadbir
sekolah menilai prestasi guru individu dan kaunselor sekolah merekodkan prestasi klien
mereka. Ada kemungkinan seorang guru boleh membina, mentadbir dan menilai beribu-
ribu ujian semasa kerjayanya!
Item ujian boleh ditulis dalam pelbagai format termasuk soalan aneka pilihan, padanan,
benar atau salah, jawapan pendek dan esei. Format ini berbeza dalam kekuatan dan
kelemahan. Tiada satu format yang sesuai untuk semua keadaan.
Ujian boleh dianggap sebagai satu set tugasan atau soalan yang bertujuan untuk
menimbulkan jenis tingkah laku tertentu apabila dibentangkan dalam keadaan piawai
dan untuk menghasilkan skor yang akan mempunyai sifat psikometrik yang diingini
(1974).
Walaupun kebanyakan orang tahu apa itu ujian, ramai yang mengalami kesukaran
membezakan antara pengukuran, penilaian dan penilaian. Ada juga yang berpendapat
bahawa mereka serupa!
(b) Pengukuran
Pengukuran ialah tindakan memberikan nombor kepada fenomena. Dalam pendidikan, ia
adalah proses di mana sifat-sifat seseorang diukur dan diberi nombor. Ingat ia adalah satu
proses, menunjukkan terdapat langkah-langkah tertentu yang terlibat!
Sebagai pendidik, kita sering mengukur sifat-sifat manusia seperti sikap, pencapaian
akademik, kebolehan, minat, keperibadian dan sebagainya.
Oleh itu, untuk mengukur kita perlu menggunakan instrumen tertentu supaya kita boleh
membuat kesimpulan bahawa Ahmad lebih baik dalam matematik berbanding Kumar
manakala Tajang lebih positif terhadap sains berbanding Kong Beng. Kami mengukur
untuk mendapatkan maklumat tentang „apa itu‰. Maklumat sedemikian mungkin atau mungkin tidak
berguna bergantung pada ketepatan instrumen yang kita gunakan dan kemahiran kita
menggunakannya. Sebagai contoh, kita mengukur suhu menggunakan termometer,
dan termometer ialah alat yang digunakan.
Sebagai contoh, berdasarkan maklumat penilaian kita boleh menentukan sama ada
Chee Keong memerlukan perkhidmatan khas untuk membantunya mengembangkan
kemahiran membacanya atau sama ada Khairul yang telah dikenal pasti sebagai
kanak-kanak disleksia memerlukan perhatian khusus. Kata kunci dalam definisi
penilaian ialah mengumpul data dan membuat keputusan. Oleh itu, untuk membuat
keputusan seseorang perlu menilai, iaitu proses membuat pertimbangan, tentang
situasi tertentu.
Apabila kita menilai, kita mengatakan bahawa sesuatu itu baik, sesuai, sah atau positif, sebagai contoh.
Untuk membuat penilaian, kita memerlukan maklumat dan maklumat diperoleh dengan mengukur
menggunakan instrumen yang boleh dipercayai.
Sebagai contoh, anda mengukur suhu di dalam bilik darjah dan ia adalah 30 darjah Celsius, yang
merupakan maklumat semata-mata. Sesetengah pelajar mungkin mendapati suhu terlalu panas untuk
pembelajaran manakala yang lain mungkin mengatakan bahawa ia sesuai untuk pembelajaran. Pada
satu ketika pada siang hari, kami sedang menilai sesuatu atau seseorang!
Pendidik sentiasa menilai pelajar. Ini biasanya dilakukan berbanding dengan beberapa piawaian.
Sebagai contoh, jika objektif pelajaran adalah untuk pelajar menggunakan Undang-undang BoyleÊs
untuk menyelesaikan masalah dan 80 peratus pelajar dapat menyelesaikan masalah itu, maka guru
boleh membuat kesimpulan bahawa pengajaran prinsip itu agak berjaya. Oleh itu, penilaian ialah
perbandingan apa yang diukur terhadap beberapa kriteria yang ditetapkan dan untuk menentukan sama
ada ia telah dicapai, sama ada ia sesuai, sama ada ia baik, sama ada ia munasabah, sama ada ia sah
dan sebagainya.
Jawapan : Baik, saya menilai untuk mengetahui sama ada pelajar saya faham apa yang telah diajar.
Jawapan : Sama ada mereka boleh ingat apa yang saya ajar dan mampu menyelesaikan masalah.
Jawapan : Baiklah, saya menyediakan jawapan yang betul kepada pelajar dan menunjukkan kesilapan
yang dilakukan semasa menjawab soalan.
Perkara di atas boleh menjadi alasan yang diberikan oleh pendidik apabila ditanya tentang tujuan penilaian.
Dalam konteks pendidikan, penilaian dilakukan untuk mendapatkan pemahaman tentang kekuatan dan
kelemahan seseorang individu untuk membuat keputusan pendidikan yang sesuai. Keputusan pendidikan
terbaik adalah berdasarkan
maklumat dan keputusan yang lebih baik biasanya berdasarkan lebih banyak maklumat
(Salvia & Ysseldyke, 1995). Berdasarkan alasan penilaian yang diberikan oleh Harlen
(1978) dan Deale (1975), dua sebab utama dikenal pasti (rujuk Rajah 1.2).
(i) Diagnosis
Penilaian atau penilaian diagnostik dilakukan pada permulaan pelajaran
atau unit untuk bidang mata pelajaran tertentu untuk menilai kesediaan dan
latar belakang pelajar untuk perkara yang akan diajar. Penilaian pra
pengajaran ini dilakukan apabila anda memerlukan maklumat tentang pelajar
tertentu, kumpulan pelajar atau keseluruhan kelas sebelum anda boleh
meneruskan kaedah pengajaran yang paling berkesan. Sebagai contoh,
anda boleh mentadbir Ujian Membaca kepada murid Tahun Satu untuk
menilai tahap bacaan mereka. Berdasarkan maklumat, anda mungkin ingin
menetapkan pembaca yang lemah untuk campur tangan khas atau tindakan
pemulihan. Sebaliknya, ujian mungkin mendedahkan bahawa sesetengah
pelajar membaca pada tahap yang sangat tinggi dan anda mungkin ingin
mengesyorkan agar mereka ditugaskan ke program pengayaan (rujuk Jadual 1.1).
Untuk membantu
Soalan yang Perlu Dijawab
Pembelajaran
Diagnosis untuk • Perlukah murid dihantar ke kelas pemulihan supaya kesukaran dalam
tindakan pemulihan pembelajaran dapat diatasi?
(ii) Penilaian
Exceptionality juga dijalankan untuk membuat keputusan tentang exceptionality.
Berdasarkan maklumat yang diperoleh daripada penilaian, guru boleh membuat
keputusan sama ada pelajar tertentu perlu ditugaskan ke kelas dengan pelajar
luar biasa. Pelajar luar biasa ialah pelajar yang berbeza dari segi fizikal, mental,
emosi atau tingkah laku daripada populasi normal. Sebagai contoh, berdasarkan
maklumat penilaian, kanak-kanak yang didapati mengalami disleksia boleh
ditugaskan untuk rawatan khas atau pelajar yang telah disahkan kurang upaya
pembelajaran boleh ditugaskan untuk pendidikan khas.
(iii) Pensijilan
Pensijilan mungkin sebab paling penting untuk penilaian. Sebagai contoh, Sijil
Pelajaran Malaysia (SPM) adalah peperiksaan yang bertujuan untuk
menyediakan sijil kepada pelajar. Markah yang diperoleh ditukar kepada gred
huruf yang menandakan tahap prestasi dalam pelbagai bidang mata pelajaran
dan digunakan sebagai asas perbandingan antara pelajar.
Sijil yang diperolehi selanjutnya digunakan untuk memilih pelajar untuk
melanjutkan pelajaran, biasiswa atau pekerjaan.
Copyright © Open University Malaysia (OUM)
Machine Translated by Google
(iv) Penempatan
Selain pensijilan, penilaian juga dijalankan untuk tujuan penempatan. Pelajar
dikurniakan kebolehan yang berbeza-beza dan salah satu tugas sekolah adalah
menempatkan mereka mengikut kebolehan dan minat mereka. Sebagai contoh,
persembahan dalam Pentaksiran Tingkatan 3 (PT3) (sebelum ini Penilaian Menengah
Rendah) dijadikan asas untuk menempatkan pelajar dalam aliran seni atau sains.
Penilaian juga digunakan untuk menstrim pelajar mengikut prestasi akademik. Sudah
menjadi tradisi bahawa kelas „A‰ dan „B‰ terdiri daripada pencapaian tinggi
berdasarkan keputusan mereka pada peperiksaan akhir semester atau akhir tahun.
AKTIVITI 1.1
Berbincang dengan rakan kursus anda dalam forum dalam talian myINSPIRE.
Data penilaian juga boleh memberikan pandangan tentang mengapa sesetengah guru lebih berjaya
dalam mengajar kumpulan pelajar tertentu manakala yang lain kurang berjaya.
Pengetahuan sedia ada Adakah pelajar mempunyai pengetahuan sedia ada yang berkaitan?
Perbezaan guru Adakah guru tertentu lebih berkesan daripada yang lain?
AKTIVITI 1.2
Sejauh manakah anda menggunakan data penilaian untuk menyemak strategi pengajaran
pembelajaran anda?
Bincangkan perkara ini dengan rakan kursus anda dalam forum dalam talian myINSPIRE.
(c) Prosedur Penilaian yang berbeza Diperlukan untuk Menyediakan yang Lengkap
Gambar Pencapaian dan Perkembangan Pelajar
Tiada prosedur penilaian tunggal boleh menilai semua hasil pembelajaran yang
berbeza dalam kurikulum sekolah. Prosedur penilaian yang berbeza (penilaian formatif,
sumatif dan autentik) boleh mencapai objektif yang berbeza. Sebagai contoh, soalan
aneka pilihan berguna untuk mengukur pengetahuan, pemahaman dan hasil aplikasi
manakala ujian esei sesuai untuk mengukur kebolehan menyusun dan menyatakan
idea. Projek yang memerlukan menjalankan penyelidikan perpustakaan diperlukan
untuk mengukur kemahiran tertentu dalam merumus dan menyelesaikan masalah.
Teknik pemerhatian diperlukan untuk menilai kemahiran prestasi dan pelbagai aspek
tingkah laku pelajar.
Sebelum kita meneruskan untuk membincangkan lebih lanjut tentang penilaian, anda perlu jelas tentang
konsep yang sering digunakan ini dalam penilaian:
(c) Penilaian autentik (contoh penilaian autentik akan dibincangkan dalam Topik 6 dan
7).
Pentaksiran boleh dilakukan pada pelbagai masa sepanjang tahun persekolahan. Pelan
penilaian yang komprehensif akan merangkumi kedua-dua penilaian formatif dan
sumatif. Titik di mana penilaian berlaku dan tujuan penilaian membezakan kedua-dua
kategori penilaian ini.
Sebagai contoh, jika seorang guru memerhatikan bahawa sesetengah pelajar masih
belum memahami sesuatu konsep, dia mungkin mereka bentuk aktiviti semakan atau
menggunakan strategi pengajaran yang berbeza. Begitu juga, pelajar boleh memantau
kemajuan mereka dengan kuiz berkala dan tugasan prestasi. Keputusan penilaian
formatif digunakan untuk mengubah suai dan mengesahkan pengajaran. Ringkasnya,
penilaian formatif sedang berjalan dan termasuk ulasan dan pemerhatian tentang apa
yang berlaku di dalam bilik darjah.
Penilaian formatif biasanya mempunyai kepentingan yang rendah, yang bermaksud bahawa ia
mempunyai nilai mata yang minimum atau tiada.
„Apabila tukang masak merasai sup, itu adalah penilaian formatif; apabila tetamu
merasai sup, itu adalah penilaian sumatif‰
(Robert Stakes)
Penilaian sumatif selalunya mempunyai kepentingan yang tinggi, yang bermaksud bahawa ia
mempunyai nilai mata yang tinggi.
Kaedah • Ujian kertas dan pensel, • Ujian kertas dan pensel, ujian lisan yang
pemerhatian, kuiz, latihan, sesi amali diberikan kepada kumpulan.
yang diberikan kepada kumpulan dan
individu.
Matlamat
• Untuk menilai kemajuan dan • Penggredan untuk menentukan
mengesyorkan tindakan pembaikan sama ada program ini berjaya. •
untuk tidak mencapai objektif. • Untuk memperakui pelajar dan menambah
Pemulihan atau pengayaan atau mengajar baik kurikulum.
semula topik.
Contoh • Kuiz, esei, ujian diagnostik, laporan makmal dan • Peperiksaan akhir, peperiksaan
rekod anekdot. kebangsaan dan kelayakan
ujian.
Bolehkah maklumat daripada penilaian sumatif digunakan secara formatif? Ujian yang diberikan
pada akhir unit kerja memberikan maklumat tentang sejauh mana setiap pelajar telah belajar atau
belum belajar. Jika dibiarkan sebagai proses sumatif, maka markah ujian pelajar hanya menjadi
rekod kejayaan atau kegagalan mereka pada satu-satu masa dan tidak secara langsung membantu
mereka untuk bertambah baik. Lebih-lebih lagi, sebenarnya sesetengah pelajar akan mengetahui
lebih daripada apa yang ditunjukkan dalam prestasi ujian mereka.
Walau bagaimanapun, apabila maklumat digunakan secara formatif, keputusan ujian boleh
menyediakan sumber penting bagi maklum balas individu yang terperinci dan mengenal pasti di
mana setiap pelajar perlu memperdalam pemahaman mereka dan meningkatkan ingatan mereka
tentang pengetahuan yang telah mereka pelajari.
Lebih banyak guru mengetahui tentang setiap pelajar semasa mereka terlibat dalam proses
pembelajaran, lebih baik guru boleh menyesuaikan arahan untuk memastikan semua pelajar terus
maju dalam pembelajaran mereka.
Kelebihan menggunakan maklumat yang diperoleh daripada penilaian sumatif untuk meningkatkan
prestasi pelajar masa hadapan ialah:
(a) Data sumatif mendedahkan prestasi pelajar pada akhir sesuatu program pembelajaran, iaitu
lanjutan, mahir, asas atau di bawah asas.
Contohnya, jika pelajar mendapat markah di bawah asas dalam peperiksaan semester dan
menunjukkan tanda pelajar bergelut, guru mungkin mahu meletakkan pelajar itu di hadapan
kelas supaya guru boleh mengakses pelajar dengan mudah apabila pelajar memerlukan
tambahan. sokongan;
(b) Pentaksiran sumatif boleh dijadikan panduan untuk menambah baik kaedah pengajaran. Guru
sering menggunakan kaedah pengajaran yang pelbagai di dalam bilik darjah. Pentaksiran
sumatif boleh membantu guru bekerjasama dan menambah baik kaedah pengajaran dari
tahun ke tahun; dan
(c) Penilaian sumatif membantu guru dan pentadbir dalam menambah baik kurikulum dan
perancangan kurikulum. Pengajaran berasaskan standard memainkan peranan yang besar
di sekolah pada masa kini. Apabila penilaian sumatif menunjukkan jurang yang konsisten
antara pengetahuan pelajar dan sasaran pembelajaran, sekolah mungkin beralih kepada
pihak berkuasa yang berkaitan di Kementerian Pendidikan untuk mencadangkan
penambahbaikan perancangan kurikulum atau kurikulum baharu bagi mengisi jurang pembelajaran tersebut.
Data yang dikumpul menggunakan penilaian sumatif dapat membantu guru dan sekolah membuat
keputusan berdasarkan arahan yang telah siap.
Ini berbeza dengan penilaian formatif, di mana penilaian formatif boleh membantu guru dan pelajar
semasa proses pengajaran. Adalah penting untuk memahami perbezaan antara kedua-duanya,
kerana kedua-dua penilaian boleh memainkan peranan penting dalam pendidikan.
Perbezaan utama antara ujian rujukan norma dan ujian rujukan kriteria bergantung pada
tujuan atau matlamat menilai pelajar anda, cara kandungan dipilih dan proses pemarkahan
yang mentakrifkan cara keputusan ujian mesti ditafsirkan.
Sebagai contoh, pelajar yang memperoleh markah 70 pada ujian rujukan norma tidak
akan bermakna sehingga ia dibandingkan dengan norma. Jika dibandingkan dengan
norma, markahnya adalah dalam persentil ke-80 yang bermaksud bahawa dia
menunjukkan prestasi yang baik atau lebih baik daripada 20 peratus pelajar dalam kumpulan norma.
Maklumat jenis ini boleh berguna untuk menentukan sama ada pelajar memerlukan
bantuan pemulihan atau calon untuk program berbakat.
Walau bagaimanapun, skor memberikan sedikit maklumat tentang perkara yang sebenarnya diketahui
atau boleh dilakukan oleh pelajar. Kritikan utama terhadap ujian rujukan norma ialah mereka
cenderung memberi tumpuan kepada menilai tahap rendah, kemahiran asas (Romberg, 1989).
Jadual 1.4 menggambarkan perbezaan antara ujian rujukan norma dan ujian rujukan kriteria.
Jadual 1.4: Perbezaan antara Ujian Rujukan Norma dan Rujukan Kriteria
Matlamat
• Bandingkan seseorang pelajar • Bandingkan prestasi pelajar
persembahan bersama dengan beberapa kriteria.
pelajar lain.
1. Terangkan perbezaan antara ujian rujukan norma dan ujian rujukan kriteria.
(a) Peperiksaan bertulis secara beransur-ansur digantikan dengan penilaian dan kerja kursus
yang lebih berterusan;
(b) Terdapat satu langkah ke arah lebih banyak penglibatan dan pilihan pelajar dalam
penilaian;
(c) Penilaian kumpulan menjadi lebih popular dalam usaha untuk menekankan pembelajaran
kolaboratif antara pelajar dan mengurangkan persaingan yang berlebihan;
(d) Bidang mata pelajaran dan kursus menyatakan dengan lebih jelas tentang jangkaan dalam
penilaian, lebih khusus lagi jenis prestasi yang diperlukan daripada pelajar apabila mereka
dinilai. Ini tidak seperti amalan terdahulu di mana penilaian sangat rahsia dan pelajar perlu
memikirkan sendiri apa yang diperlukan daripada mereka;
(e) Pemahaman tentang proses kini dilihat sebagai, sekurang-kurangnya, sama pentingnya
dengan pengetahuan fakta. Ini selaras dengan peralihan umum daripada penilaian
berasaskan produk kepada penilaian berasaskan proses; dan
(f) „Hasil pembelajaran‰ yang berfokuskan pelajar telah mula menggantikan „objektif‰ yang
berorientasikan guru. Fokus lebih kepada apa yang pelajar akan pelajari dan bukannya
apa yang guru rancang untuk mengajar.
Meringankan Peperiksaan
Putrajaya: Mengurangkan bilangan mata pelajaran Antara langkah yang dicadangkan ialah:
peperiksaan dan mempunyai sistem semester
ÿ Mengurangkan bilangan mata pelajaran dalam
antara perubahan besar yang dirancang untuk
peperiksaan awam;
menjadikan sistem pendidikan lebih holistik dan
kurang tertumpu kepada pencapaian akademik.
ÿ Menekankan kemahiran dan kebolehan
daripada memberi tumpuan kepada
kandungan dan pencapaian;
AKTIVITI 1.3
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
• Ujian boleh dianggap sebagai satu set tugasan atau soalan yang bertujuan untuk menimbulkan jenis
tingkah laku tertentu apabila dibentangkan dalam keadaan piawai dan untuk menghasilkan skor
yang akan mempunyai sifat psikometrik yang diingini.
• Pengukuran dalam pendidikan ialah proses di mana sifat-sifat seseorang diukur dan diberi nombor.
• Pentaksiran dilihat sebagai proses mengumpul maklumat dengan tujuan membuat keputusan
berkenaan pelajar.
• Penilaian sumatif bersifat menyeluruh, memberikan akauntabiliti dan digunakan untuk menyemak
tahap pembelajaran pada akhir program.
• Penilaian formatif selalunya dijalankan pada awal atau semasa tahun persekolahan, sekali gus
memberi peluang untuk bukti segera pembelajaran pelajar dalam bidang mata pelajaran tertentu
atau pada masa tertentu dalam sesuatu program.
• Maklumat daripada penilaian sumatif boleh digunakan secara formatif. Pelajar atau sekolah boleh
menggunakan maklumat tersebut untuk membimbing usaha dan aktiviti mereka dalam kursus
seterusnya.
• Sebab utama ujian rujukan norma adalah untuk mengklasifikasikan pelajar. Ujian ini direka bentuk
untuk menyerlahkan perbezaan pencapaian antara dan dalam kalangan pelajar untuk menghasilkan
susunan pangkat pelajar yang boleh dipercayai.
• Ujian rujukan kriteria menentukan apa yang pelajar boleh atau tidak boleh lakukan dan tidak
bagaimana mereka membandingkan dengan orang lain.
Penilaian Pengukuran
HASIL PEMBELAJARAN
Pada akhir topik ini, anda seharusnya dapat:
1. Wajarkan tingkah laku yang akan diukur untuk mempersembahkan holistik
penilaian pelajar;
ÿ PENGENALAN
Jika anda bertanya kepada seorang guru, apakah yang patut dinilai di dalam bilik darjah,
jawapan segera adalah, sudah tentu, fakta dan konsep yang diajar. Ia adalah fakta dan
konsep yang terdapat dalam sains, sejarah, geografi, bahasa, seni, pendidikan agama
dan mata pelajaran lain yang serupa. Walau bagaimanapun, Falsafah Pendidikan
Malaysia menyatakan bahawa pendidikan harus bermatlamat ke arah pembangunan
holistik individu. Oleh itu, adalah logik bahawa sistem penilaian juga harus berusaha
untuk menilai lebih daripada pemerolehan fakta dan konsep sesuatu bidang mata
pelajaran. Bagaimana pula dengan penilaian kebolehan fizikal dan motor? Bagaimana
pula dengan tingkah laku sosioemosi seperti sikap, minat, personaliti dan sebagainya?
Adakah mereka tidak menyumbang kepada orang yang holistik?
Dalam topik ini, anda akan mempelajari jenis hasil pembelajaran yang perlu dinilai dalam
kurikulum. Topik ini akan diakhiri dengan penerangan ringkas tentang cara merancang
jadual spesifikasi untuk ujian bilik darjah.
Apabila pendidik ditanya apa yang patut dinilai di dalam bilik darjah, majoriti akan
merujuk kepada menilai pemerolehan fakta, konsep, prinsip, prosedur dan kaedah
sesuatu bidang mata pelajaran. Anda mungkin mendapati minoriti pendidik yang
menegaskan bahawa kemahiran yang diperoleh oleh pelajar juga harus dinilai
terutamanya dalam mata pelajaran seperti pendidikan jasmani, seni, drama, muzik,
lukisan teknikal, pertukangan kayu, kejuruteraan automobil dan sebagainya. Malah
lebih sedikit pendidik akan mencadangkan bahawa tingkah laku sosioemosi pelajar juga harus dinilai
(a) Sama ada sekolah kita telah membangunkan „potensi individu secara menyeluruh
dan bersepadu‰;
(b) Sama ada pelajar kita „seimbang dari segi intelek, rohani, emosi dan jasmani‰;
(c) Sama ada pelajar kita „berilmu dan berkebolehan‰ dan „memiliki
standard moral yang tinggi‰;
(d) Sama ada pelajar kita mempunyai „kesejahteraan peribadi yang tinggi‰; dan
(e) Sama ada pelajar dilengkapi dengan kebolehan dan sikap yang akan membolehkan
mereka „menyumbang kepada keharmonian dan kemajuan keluarga, masyarakat
dan negara secara amnya‰.
Domain boleh dianggap sebagai kategori. Para pendidik sering merujuk kepada ketiga-tiga domain
ini sebagai KSA (Pengetahuan, Kemahiran dan Sikap). Setiap domain terdiri daripada subbahagian,
bermula daripada tingkah laku yang paling mudah kepada yang paling kompleks, seterusnya
membentuk taksonomi hasil pembelajaran. Setiap taksonomi tingkah laku pembelajaran boleh
dianggap sebagai „matlamat proses persekolahan.‰ Ini bermakna selepas persekolahan, pelajar
sepatutnya telah memperoleh kemahiran, pengetahuan, dan/atau sikap baharu. Walau
bagaimanapun, peringkat setiap bahagian yang digariskan bukanlah mutlak.
Walaupun terdapat sistem atau hierarki lain yang telah direka dalam dunia pendidikan, ketiga-tiga
taksonomi ini mudah difahami dan mungkin yang paling banyak digunakan hari ini.
Untuk menilai ketiga-tiga domain, seseorang perlu mengenal pasti dan mengasingkan tingkah laku
yang mewakili domain ini. Apabila kita menilai, kita menilai beberapa aspek tingkah laku pelajar,
contohnya, keupayaannya untuk membandingkan, menerangkan, menganalisis, menyelesaikan,
melukis, menyebut, merasa, merenung dan sebagainya. Istilah „tingkah laku‰ digunakan secara
meluas untuk merangkumi keupayaan pelajar untuk berfikir (kognitif), merasa (afektif) dan
melakukan sesuatu kemahiran (psikomotor). Sebagai contoh, anda baru sahaja mengajar tentang
„The Rainforest of Malaysia‰ dan anda ingin menilai pelajar anda dalam:
(a) Berfikir ÿ Anda boleh meminta mereka menyenaraikan ciri-ciri hutan hujan Malaysia dan
membandingkannya dengan hutan konifer Kanada;
(b) Perasaan (emosi, sikap) ÿ Anda boleh meminta mereka untuk mereka bentuk pameran tentang
bagaimana pelajar boleh menyumbang ke arah pemuliharaan hutan hujan; dan
(c) Kemahiran ÿ Anda boleh meminta mereka menyediakan peta satelit tentang perubahan hutan
hujan Malaysia dengan mengakses laman web daripada Internet.
AKTIVITI 2.1
Berbincang dengan rakan kursus anda dalam forum dalam talian myINSPIRE.
Apabila kami menilai kami tidak menilai storan pelajar bagi fakta, konsep atau prinsip sesuatu mata pelajaran
tetapi lebih kepada perkara yang pelajar boleh lakukan dengan fakta, konsep atau prinsip sesuatu bidang mata
pelajaran. Sebagai contoh, kami menilai keupayaan pelajar untuk membandingkan fakta, menerangkan konsep,
menganalisis generalisasi (atau pernyataan) atau menyelesaikan masalah berdasarkan prinsip yang diberikan.
Dalam erti kata lain, kita menilai kefahaman atau penguasaan badan pengetahuan berdasarkan apa yang pelajar
dapat lakukan dengan kandungan subjek. Mari kita lihat dua mekanisme yang digunakan untuk mengukur atau
menilai pembelajaran kognitif, iaitu Taksonomi Bloom dan The
Terdapat enam peringkat dalam klasifikasi BloomÊs dengan tahap paling rendah dipanggil
pengetahuan. Tahap pengetahuan diikuti oleh lima tahap kebolehan mental yang semakin sukar:
kefahaman, aplikasi, analisis, sintesis dan penilaian.
(i) Pengetahuan: Tingkah laku pada tahap pengetahuan memerlukan pelajar mengingat kembali maklumat
tertentu. Tahap pengetahuan adalah tahap kognitif yang paling rendah. Contoh kata kerja yang
menerangkan tingkah laku pada tahap pengetahuan termasuk kebolehan untuk menyenaraikan,
mentakrifkan, menamakan, menyatakan, mengingat kembali, memadankan, mengenal pasti,
memberitahu, melabel, menggariskan, mencari, mengecam, memilih dan sebagainya. Sebagai
contoh, keupayaan pelajar untuk menyebut faktor-faktor yang membawa kepada Perang Dunia II,
memetik formula untuk ketumpatan dan daya, memberitahu peraturan keselamatan makmal.
(ii) Pemahaman: Tingkah laku pada tahap pemahaman yang merupakan tahap keupayaan mental
yang lebih tinggi daripada tahap pengetahuan memerlukan pemahaman tentang makna
konsep dan prinsip, terjemahan perkataan dan frasa ke dalam perkataan sendiri, interpolasi
yang melibatkan pengisian yang hilang. maklumat, tafsiran yang melibatkan membuat
kesimpulan dan melampaui maklumat yang diberikan. Contoh kata kerja yang menerangkan
tingkah laku pada tahap pemahaman ialah menerangkan, membezakan, membuat inferens,
mentafsir, menukar, menggeneralisasi, mempertahankan, menganggar, memanjangkan,
menghuraikan, menceritakan semula menggunakan perkataan sendiri, meramal, menulis
semula, meringkaskan, menterjemah dan sebagainya. Sebagai contoh, pelajar dapat
tulis semula tiga undang-undang gerakan Newton, terangkan dengan perkataan sendiri
langkah-langkah untuk melaksanakan tugas yang kompleks dan menterjemah persamaan
ke dalam hamparan komputer.
(iii) Aplikasi: Tingkah laku di peringkat aplikasi memerlukan pelajar untuk menggunakan peraturan
atau prinsip yang dipelajari di dalam bilik darjah ke dalam novel atau situasi baharu di
tempat kerja atau penggunaan abstraksi tanpa gesaan.
Contoh kata kerja yang menerangkan tingkah laku pada peringkat aplikasi ialah mengaplikasi,
menukar, mengira, menunjukkan, menemui, memanipulasi, mengubah suai, memberi
contoh, mengendalikan, meramal, menyediakan, menghasilkan, mengaitkan, menunjukkan,
menyelesaikan, menggunakan dan sebagainya. Sebagai contoh, pelajar boleh menggunakan
formula untuk gerakan peluru untuk mengira jarak maksimum lompat jauh lompat dan
menggunakan undang-undang statistik untuk menilai kebolehpercayaan sesuatu tulisan.
ujian.
(iv) Analisis: Tingkah laku di peringkat analisis memerlukan pelajar mengenal pasti bahagian
komponen dan menerangkan hubungannya, mengasingkan bahan atau konsep kepada
bahagian komponen supaya struktur organisasinya dapat difahami dan membezakan antara
fakta dan inferens. Contoh kata kerja yang menerangkan tingkah laku pada peringkat
analisis ialah menganalisis, memecahkan, membanding, membezakan, diagram,
menyahkonstruk, meneliti, membedah, membezakan, mendiskriminasi, membezakan,
mengenal pasti, menggambarkan, membuat kesimpulan, menggariskan, menghubungkait,
memilih, memisahkan dan sebagainya.
Sebagai contoh, pelajar dapat menyelesaikan masalah sesuatu peralatan dengan
menggunakan potongan logik, mengenali kesilapan logik dalam penaakulan, menganalisis
maklumat daripada syarikat dan menentukan keperluan untuk latihan.
(v) Sintesis: Tingkah laku di peringkat sintesis memerlukan pelajar membina struktur atau corak
daripada unsur-unsur yang pelbagai dan menyusun bahagian-bahagian untuk membentuk
keseluruhan dengan penekanan untuk mencipta makna atau struktur baharu. Contoh kata
kerja yang menerangkan tingkah laku pada peringkat sintesis ialah mengkategorikan,
menggabungkan, menyusun, mengarang, mencipta, mereka bentuk, mereka bentuk,
menerangkan, menjana, mengubah suai, menyusun, merancang, menyusun semula,
membina semula, mengaitkan, menyusun semula, mencari cara luar biasa, merumus,
menyemak semula. , menulis semula, meringkaskan, memberitahu, menulis dan sebagainya.
Sebagai contoh, pelajar dapat menulis cerpen yang kreatif, mereka bentuk kaedah untuk
melaksanakan tugas tertentu, mengintegrasikan idea daripada beberapa sumber untuk
menyelesaikan masalah, merangka pelan tindakan baharu untuk menambah baik hasil.
Tambah
pengiraan gerudi label menjangkakan
negeri
hadir potong
menjana ubah suai membina semula masa
membina mempertahankan
genggam nama keluarkan taip
gua tentukan mengisar beroperasi menyemak semula garis bawah
Pada tahun 2001, Krathwohl dan Anderson telah mengubahsuai Taksonomi Bloom yang asal (1956).
Mereka mengenal pasti dan mengasingkan senarai tingkah laku berikut yang perlu ditangani oleh
sistem penilaian (rujuk Jadual 2.2).
1. Mengingat ÿ
Mengenali ÿ ÿ Mengenal pasti ÿ
2. Memahami ÿ
Mentafsir ÿ ÿ Menjelaskan, menghuraikan, mewakilkan,
Mencontohi ÿ menterjemah ÿ Mengilustrasikan, mengkategorikan
3. Mengaplikasi
ÿ Melaksana ÿ ÿ Menjalankan ÿ
Melaksana Menggunakan
4. Menganalisis
ÿ Membezakan ÿ ÿ Mendiskriminasi, membezakan, memfokus, memilih
Menyusun ÿ ÿ Mencari keselarasan, menyepadukan,
5. Menilai ÿ
Menyemak ÿ ÿ Menyelaras, mengesan, memantau, menguji ÿ
Mengkritik Menghakimi
6. Mencipta
ÿ Menjana ÿ ÿ Hipotesis ÿ
Merancang ÿ Merekabentuk ÿ
Menghasil Membina
Ambil perhatian bahawa penjujukan beberapa peringkat telah disusun semula dan dinamakan semula.
Dua tahap asal pertama „pengetahuan‰ dan „pemahaman‰ masing-masing diganti dengan „mengingat‰
dan „memahami‰. Tahap „sintesis‰ telah dinamakan semula dengan istilah „mencipta‰. Ambil
perhatian bahawa dalam taksonomi asal jujukan ialah „sintesis‰ diikuti dengan „menilai‰. Dalam
taksonomi yang diubah suai, urutan itu disusun semula kepada „menilai‰ diikuti dengan „mencipta‰.
Seperti yang anda lihat, perbezaan utama antara taksonomi asal dan taksonomi yang disemak bukan
dalam penyenaraian atau kata semula daripada kata nama kepada kata kerja, atau dalam penamaan
semula beberapa komponen, atau malah dalam penempatan semula dua kategori terakhir. Perbezaan
utama terletak pada penambahan yang lebih berguna dan menyeluruh tentang cara taksonomi bersilang
dan bertindak ke atas pelbagai jenis dan tahap pengetahuan ÿ fakta, konseptual, prosedural dan
metakognitif.
(a) Pengetahuan fakta merujuk kepada fakta, istilah, butiran atau elemen penting yang pelajar mesti tahu
atau biasa dengannya untuk memahami sesuatu disiplin atau menyelesaikan masalah dengannya;
(b) Pengetahuan konseptual ialah pengetahuan tentang klasifikasi, prinsip, generalisasi, teori, model
atau struktur yang berkaitan dengan bidang disiplin tertentu;
(c) Pengetahuan prosedur merujuk kepada maklumat atau pengetahuan yang membantu pelajar
melakukan sesuatu yang khusus untuk sesuatu disiplin, mata pelajaran atau bidang pengajian. Ia
juga merujuk kepada kaedah inkuiri, kemahiran yang sangat khusus atau terhingga, algoritma,
teknik dan metodologi tertentu; dan
(d) Metakognisi hanyalah memikirkan tentang pemikiran seseorang. Lebih tepat lagi, ia merujuk kepada
proses yang digunakan untuk merancang, memantau dan menilai pemahaman dan prestasi
seseorang. Aktiviti seperti merancang cara mendekati tugasan pembelajaran yang diberikan,
memantau kefahaman dan menilai kemajuan ke arah menyiapkan tugasan adalah bersifat
metakognitif.
Matlamat Bloom adalah untuk menggalakkan bentuk pemikiran yang lebih tinggi dalam pendidikan seperti
menganalisis, mencipta dan menilai daripada hanya mengajar pelajar untuk mengingati fakta
(pembelajaran hafalan). Pemikiran aras tinggi (HOT) membawa pemikiran ke tahap yang lebih tinggi
selain daripada menyatakan semula fakta dan memerlukan pelajar melakukan sesuatu dengan fakta
seperti memahaminya, membuat kesimpulan daripadanya, menghubungkannya dengan fakta dan konsep
lain, mengkategorikannya, memanipulasinya, meletakkannya. mereka bersama-sama dengan cara
baharu atau baharu, dan gunakannya semasa kami mencari penyelesaian baharu kepada masalah baharu.
AKTIVITI 2.2
1. Adakah anda bersetuju bahawa Taksonomi Bloom adalah satu hierarki kognitif
kebolehan? Mewajarkan.
Kongsi semua jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
(a) Kepercayaan bahawa pembangunan perasaan yang sesuai adalah tugas keluarga dan
agama.
(b) Kepercayaan bahawa perasaan yang sesuai berkembang secara automatik daripada
pengetahuan dan pengalaman dengan kandungan dan tidak memerlukan perhatian
pedagogi khusus.
(c) Arahan sikap dan berorientasikan nilai sukar dibangunkan dan dinilai kerana:
(iii) Ciri-ciri afektif dianggap sebagai perkara peribadi dan bukannya perkara awam; dan
(iv) Tiada kaedah yang kukuh untuk mengumpul maklumat tentang ciri-ciri afektif.
Walau bagaimanapun, matlamat afektif tidak lebih tidak ketara daripada matlamat kognitif. Ada
yang mendakwa bahawa tingkah laku afektif boleh dibangunkan secara automatik apabila
pengetahuan khusus diajar manakala yang lain berpendapat bahawa tingkah laku afektif perlu
dikembangkan secara eksplisit di sekolah. Matlamat afektif tidak semestinya mengambil masa yang
lebih lama untuk dicapai di dalam bilik darjah berbanding matlamat kognitif. Apa yang diperlukan
ialah menyatakan matlamat dengan lebih konkrit dan berorientasikan tingkah laku supaya ia boleh
dinilai dan dipantau.
Terdapat juga kepercayaan bahawa ciri-ciri afektif adalah peribadi dan tidak boleh didedahkan
kepada umum. Walaupun orang ramai menghargai privasi mereka, orang ramai juga mempunyai
hak untuk mendapatkan maklumat. Jika maklumat yang dikumpul diperlukan untuk membuat
keputusan, maka pengumpulan maklumat tersebut secara amnya tidak dianggap sebagai pencerobohan privasi.
Sebagai contoh, jika penilaian digunakan untuk menentukan sama ada pelajar memerlukan
perhatian lanjut seperti pendidikan khas, maka pengumpulan maklumat tersebut bukanlah
pencerobohan privasi. Sebaliknya, jika maklumat yang dicari tidak berkaitan dengan tujuan yang
dinyatakan, maka pengumpulan maklumat tersebut berkemungkinan menjadi pencerobohan privasi.
Begitu juga, maklumat tentang ciri afektif boleh digunakan untuk kebaikan atau keburukan.
Sebagai contoh, jika guru matematik mendapati seorang pelajar mempunyai sikap negatif terhadap
matematik dan mengejek pelajar itu di hadapan kelas, maka maklumat tersebut telah disalahgunakan.
Walau bagaimanapun, jika guru menggunakan maklumat untuk mengubah kaedah pengajarannya
supaya dapat membantu pelajar mengembangkan sikap yang lebih positif terhadap matematik,
maka maklumat tersebut telah digunakan dengan bijak.
Krathwohl, Bloom dan Bertram serta rakan-rakan mereka membangunkan domain afektif pada
tahun 1973 yang memperkatakan perkara-perkara secara emosi seperti perasaan, nilai,
penghargaan, semangat, motivasi dan sikap. Lima kategori utama yang menyenaraikan tingkah
laku yang paling mudah kepada tingkah laku yang paling kompleks ialah menerima, bertindak balas,
menilai, organisasi dan pencirian (rujuk Rajah 2.4).
Rajah 2.4: Taksonomi Krathwohl, Bloom dan BertramÊs hasil pembelajaran afektif
(a) Menerima
Tingkah laku di peringkat menerima memerlukan pelajar untuk menyedari, bersedia untuk
mendengar dan menumpukan perhatiannya. Contoh kata kerja yang menerangkan tingkah laku
pada peringkat penerima ialah tanya, pilih, huraikan, ikut, beri, pegang, cari, nama, tunjuk,
balas dan sebagainya.
(iii) Mempersoalkan cita-cita, konsep dan model baharu untuk memahaminya sepenuhnya.
(c) Menghargai
Tahap ini berkaitan dengan nilai atau nilai seseorang yang melekat pada objek, fenomena atau tingkah
laku tertentu. Ia terdiri daripada penerimaan mudah kepada keadaan komitmen yang lebih kompleks.
Penilaian adalah berdasarkan penghayatan set nilai tertentu manakala petunjuk kepada nilai ini
dinyatakan dalam pelajar sebagai tingkah laku terang-terangan dan selalunya boleh dikenal pasti.
Contoh kata kerja yang menerangkan tingkah laku pada peringkat menilai ialah menunjukkan,
membezakan, menerangkan, mengikut, membentuk, memulakan, menjemput, menyertai, mewajarkan,
mencadangkan, membaca, melaporkan, memilih, berkongsi, mengkaji dan bekerja.
(d) Organisasi
Pada peringkat ini, seseorang menyusun nilai ke dalam keutamaan dengan membezakan nilai yang
berbeza, menyelesaikan konflik antara mereka dan mewujudkan sistem nilai yang unik.
Penekanan adalah untuk membandingkan, menghubungkait dan mensintesis nilai. Contoh kata kerja
yang menerangkan tingkah laku pada peringkat organisasi ialah mematuhi, mengubah, menyusun,
menggabungkan, membanding, melengkapkan, mempertahankan, menerangkan, merumus,
menggeneralisasi, mengenal pasti, menyepadukan, mengubah suai, menyusun, menyusun,
menyediakan, mengaitkan dan mensintesis.
(v) Mencipta rancangan hidup yang selaras dengan kebolehan, minat dan kepercayaan; dan
(vi) Mengutamakan masa dengan berkesan untuk memenuhi keperluan organisasi, keluarga
dan diri sendiri.
(e) Perwatakan
Pada tahap ini, sistem nilai seseorang mengawal tingkah lakunya. Tingkah laku itu meresap,
konsisten, boleh diramal dan yang paling penting, mencirikan pelajar. Contoh kata kerja yang
menerangkan tingkah laku pada tahap ini ialah bertindak, mendiskriminasi, memaparkan,
mempengaruhi, mendengar, mengubah suai, melaksanakan, berlatih, mencadangkan,
melayakkan, menyoal, menyemak, melayani, menyelesaikan. dan mengesahkan
(v) Menyemak pertimbangan dan mengubah tingkah laku berdasarkan bukti baharu; dan
(vi) Menghargai orang kerana apa yang mereka ada, bukan penampilan mereka.
Jadual 2.3 menunjukkan bagaimana taksonomi afektif boleh digunakan pada nilai seperti
kejujuran. Ia mengesan perkembangan sifat afektif seperti kejujuran daripada peringkat
„menerima‰ sehingga ke peringkat „pencirian‰ di mana nilai menjadi sebahagian daripada
perwatakan individu.
Menerima (Menghadiri) Sedar bahawa perkara tertentu adalah jujur atau tidak jujur
Pencirian oleh nilai atau kompleks Jujur dalam kebanyakan situasi, mengharapkan orang lain bersikap jujur
nilai dan berinteraksi dengan orang lain dengan penuh kejujuran
AKTIVITI 2.3
1. Peranan Kesan dalam Pendidikan
„Ada yang mengatakan sekolah hanya perlu mementingkan kandungan.‰
„Adalah mustahil untuk mengajar kandungan tanpa memberi kesan pengajaran juga.
‰ „Sejauh manakah, jika ada, kita harus prihatin dengan
penilaian hasil afektif?‰ Bincangkan tiga
pernyataan dalam konteks rakyat Malaysia
sistem pendidikan.
2. Pilih mana-mana dua nilai daripada senarai 16 nilai universal dan reka bentuk
taksonomi afektif bagi setiap nilai seperti yang ditunjukkan dalam Jadual 2.3.
Kongsi semua jawapan anda dengan rakan kursus anda dalam forum dalam talian myINSPIRE.
Marilah kita membaca lebih lanjut untuk mengetahui lebih lanjut tentang pembelajaran psikomotor.
(a) Persepsi
Persepsi adalah keupayaan untuk menggunakan isyarat deria untuk membimbing aktiviti
motor. Ini terdiri daripada rangsangan deria melalui pemilihan isyarat kepada terjemahan.
Contoh kata kerja yang menerangkan jenis tingkah laku ini ialah memilih, menerangkan, mengesan,
membezakan, membezakan, mengenal pasti, mengasingkan, mengaitkan dan memilih..
(ii) Anggaran di mana bola akan mendarat selepas ia dibaling dan kemudian bergerak ke
lokasi yang betul untuk menangkap bola;
(iii) Melaraskan haba dapur pada suhu yang betul melalui bau dan rasa makanan; dan
(b) Tetapkan
Ia termasuk set mental, fizikal dan emosi. Ketiga-tiga set ini ialah kecenderungan yang
menentukan terlebih dahulu tindak balas seseorang terhadap situasi yang berbeza
(kadangkala dipanggil minda). Contoh kata kerja yang menerangkan „set‰ ialah mula,
paparkan, terangkan, gerakkan, teruskan, gerak balas, tunjukkan, nyatakan dan sukarela.
(i) Mengetahui dan bertindak mengikut urutan langkah dalam proses pembuatan;
(d) Mekanisme
Ini adalah peringkat pertengahan dalam mempelajari kemahiran yang kompleks. Tindak balas
yang dipelajari telah menjadi kebiasaan dan pergerakan boleh dilakukan dengan sedikit keyakinan
dan kemahiran. Contoh kata kerja yang menerangkan „mekanisme‰ termasuk memasang,
menentukur, membina, membongkar, memaparkan, mengikat, membetulkan, mengisar,
. menyusun
memanaskan, memanipulasi, mengukur, membaiki, mencampur dan
• Perhatikan bahawa kebanyakan kata kerja adalah sama dengan „mekanisme‰, tetapi
akan mempunyai kata adverba atau kata adjektif yang menunjukkan bahawa
prestasinya lebih cepat, lebih baik dan lebih tepat.
(f) Penyesuaian
Kemahiran berkembang dengan baik dan individu boleh mengubah suai corak pergerakan agar sesuai
dengan keperluan khas. Contoh kata kerja yang menerangkan „penyesuaian‰ ialah menyesuaikan,
.
mengubah, mengubah, menyusun semula, menyusun semula, menyemak dan mengubah
(i) Bertindak balas secara berkesan kepada pengalaman yang tidak dijangka;
(iii) Melaksanakan tugas dengan mesin yang pada asalnya tidak direka untuk
dilakukan (dengan andaian mesin itu tidak rosak dan tidak ada bahaya dalam
melaksanakan tugas baru).
(g) Asal
Asal ialah tentang mencipta pergerakan atau corak baharu agar sesuai dengan situasi
atau masalah tertentu. Hasil pembelajaran menekankan kreativiti berdasarkan kemahiran
yang sangat maju. Contoh kata kerja yang menerangkan „asal‰ ialah menyusun,
membina, menggabungkan, mengarang, membina, mencipta, mereka bentuk, memulakan,
.
membuat dan mengasal.
AKTIVITI 2.4
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
Sebagai panduan, Jadual 2.5 menunjukkan peruntukan masa bagi setiap jenis soalan.
Setelah soalan anda dibangunkan, pastikan anda memasukkan arahan yang jelas untuk pelajar.
Untuk item objektif, nyatakan bahawa mereka harus memilih satu jawapan untuk setiap item dan
nyatakan nilai mata bagi setiap soalan, terutamanya jika anda memperuntukkan pemberat yang
berbeza kepada bahagian ujian yang berbeza. Untuk item esei, nyatakan nilai mata dan masa yang
dicadangkan untuk dibelanjakan untuk item tersebut. Kami akan membincangkan pelbagai jenis
soalan dengan lebih terperinci dalam Topik 3 dan 4. Jika anda mengajar kelas besar dengan susunan
tempat duduk yang rapat dan memberikan ujian objektif, anda mungkin ingin mempertimbangkan
untuk mentadbir beberapa versi ujian anda untuk meminimumkan peluang untuk menipu. Ini
dilakukan dengan mencipta versi ujian anda dengan penomboran item yang berbeza.
• Penilaian hasil kognitif kekal menjadi tumpuan kebanyakan sistem penilaian di seluruh dunia
kerana ia lebih mudah untuk diperhatikan dan
mengukur.
• Setiap domain pembelajaran terdiri daripada subbahagian, bermula daripada tingkah laku yang
paling mudah kepada yang paling kompleks sekali gus membentuk taksonomi hasil pembelajaran.
• Apabila kita menilai atau menilai seseorang manusia, kita sedang menilai atau menilai tingkah laku
seseorang.
• Setiap bidang mata pelajaran mempunyai repertoir unik fakta, konsep, prinsip, generalisasi, teori,
undang-undang, prosedur dan kaedah yang dihantar kepada pelajar.
• Terdapat enam tahap dalam taksonomi BloomÊs hasil pembelajaran kognitif dengan tahap paling
rendah dipanggil pengetahuan diikuti oleh lima tahap kebolehan mental yang semakin sukar,
iaitu kefahaman, aplikasi, analisis, sintesis dan penilaian.
• Enam peringkat dalam versi taksonomi Bloom yang disemak semula ialah mengingat, memahami,
mengaplikasi, menganalisis, menilai dan mencipta.
• Ciri afektif melibatkan perasaan atau emosi seseorang. Sikap, nilai, harga diri, lokus kawalan,
efikasi kendiri, minat, aspirasi dan kebimbangan adalah contoh ciri afektif.
• Lima kategori utama domain afektif daripada tingkah laku yang paling mudah kepada tingkah laku
yang paling kompleks ialah menerima, bertindak balas, menilai, organisasi dan perwatakan.
• Tujuh kategori utama domain psikomotor daripada tingkah laku yang paling mudah kepada yang
paling kompleks ialah persepsi, set, gerak balas terpandu, mekanisme, respons terang-terangan
kompleks, penyesuaian dan asalan.
Topik ÿ Merancang
Ujian Bilik Darjah
3
HASIL PEMBELAJARAN
Pada akhir topik ini, anda seharusnya dapat:
spesifikasi ujian ujian bilik darjah; Pilih jenis item terbaik ujian bilik
4. darjah;
5. Tentukan rubrik atau skema pemarkahan ujian bilik darjah; 6. Menyediakan item
ujian untuk ujian bilik darjah; dan 7. Huraikan pertimbangan dalam menyediakan
ÿ PENGENALAN
Dalam topik ini kita akan memberi tumpuan kepada kaedah merancang ujian bilik darjah. Pengujian
adalah sebahagian daripada proses pengajaran dan pembelajaran. Kepentingan merancang dan
menulis ujian yang boleh dipercayai, sah dan adil tidak boleh dipandang remeh. Mereka bentuk ujian
adalah bahagian penting dalam menilai pemahaman pelajar tentang kandungan kursus dan tahap
kecekapan mereka dalam mengaplikasikan apa yang telah mereka pelajari. Sama ada anda
menggunakan kuiz berkepentingan rendah atau peperiksaan pertengahan dan akhir semester
berkepentingan tinggi, reka bentuk ujian yang teliti akan membantu memberikan keputusan yang lebih
ditentukur. Penilaian harus mendedahkan sejauh mana pelajar telah belajar berdasarkan apa yang guru mahu mereka belajar
arahan memudahkan pembelajaran mereka. Oleh itu, hanya menjalankan penilaian sumatif pada akhir
program pengajaran adalah tidak mencukupi. Adalah berguna untuk memikirkan tentang menilai pelajar
pada setiap peringkat proses perancangan. Mengenal pasti cara untuk menilai pelajar mereka
membantu menentukan aktiviti pembelajaran yang paling sesuai.
Dalam topik ini kita akan membincangkan garis panduan umum yang digunakan untuk kebanyakan alat
penilaian. Topik 4 dan 5 akan membincangkan secara terperinci tentang objektif dan ujian esei. Alat
penilaian tulen seperti projek dan portfolio akan dibincangkan dalam topik masing-masing.
(a) Ujian kertas dan pensel tradisional atau berasaskan komputer dalam bentuk berbilang
pilihan, jawapan pendek atau ujian esei; dan
(b) Penilaian prestasi seperti projek, temu bual, pembentangan atau lain-lain
penilaian alternatif.
Ujian memberikan guru maklum balas objektif tentang sejauh mana pelajar telah belajar dan memahami
subjek yang diajar. Ujian pencapaian yang diterbitkan secara komersil boleh memberikan, sedikit
sebanyak, penilaian tahap pengetahuan pelajar individu tetapi hanya bimbingan pengajaran yang
terhad dalam menilai pelbagai kemahiran yang diajar dalam mana-mana bilik darjah.
Guru mengenali pelajar mereka. Ujian yang dibangunkan oleh setiap guru untuk digunakan dalam kelas
mereka sendiri adalah yang paling relevan dari segi pengajaran. Guru boleh menyesuaikan ujian untuk
menekankan maklumat yang mereka anggap penting dan sepadan dengan tahap keupayaan pelajar
mereka. Jika dibina dengan teliti, ujian bilik darjah boleh memberikan guru maklumat yang tepat dan
berguna tentang pengetahuan yang disimpan oleh pelajar mereka.
Kunci kepada proses ini ialah soalan ujian yang digunakan untuk mendapatkan bukti pembelajaran.
Soalan dan tugasan ujian bukan sekadar alat perancangan; mereka juga membentuk bahagian penting
dalam urutan pengajaran. Menggabungkan tugasan ke dalam pengajaran dan menggunakan bukti
pembelajaran pelajar untuk menentukan apa yang berlaku seterusnya dalam pelajaran adalah benar-
benar penilaian formatif tertanam.
„Perkongsian soalan berkualiti tinggi mungkin merupakan perkara paling penting yang boleh kita
lakukan untuk meningkatkan kualiti pembelajaran pelajar,‰ (William, D., 2011).
Kami akan melihat perkara ini secara terperinci dalam subtopik berikut.
Satu lagi tujuan penting ujian ialah pemilihan. Ujian ini digunakan untuk membuat keputusan sama ada
calon akan diterima, lulus atau gagal atau tidak. Ujian yang membawa kepada penilaian dan memberikan
bukti bahawa tahap pengetahuan atau kemahiran tertentu telah dikuasai (contohnya dengan pemberian
kredit kursus) dirujuk sebagai ujian sumatif.
Ujian juga boleh berfungsi untuk tujuan diagnostik. Dalam kes sedemikian, ujian digunakan untuk
menyediakan pelajar dengan cerapan tentang jurang dalam pengetahuan dan set kemahiran semasa mereka.
Sebagai alternatif, ujian juga boleh digunakan untuk memotivasikan pelajar untuk mempamerkan tingkah
laku belajar yang berkesan.
Objektif pembelajaran yang ingin ditekankan oleh guru akan menentukan bukan sahaja bahan yang perlu
dimasukkan dalam ujian tetapi juga bentuk ujian yang khusus. Sebagai contoh, jika penting bagi pelajar
untuk dapat menyelesaikan masalah pembahagian panjang dengan cepat, pertimbangkan untuk
memberikan ujian kelajuan. Jika penting untuk pelajar memahami bagaimana peristiwa sejarah
mempengaruhi satu sama lain, jawapan pendek atau soalan esei mungkin sesuai. Jika penting untuk
pelajar mengingati tarikh, soalan aneka pilihan atau isikan-kosong mungkin sesuai.
Jadual Spesifikasi ialah pelan yang disediakan oleh guru kelas sebagai asas pembinaan ujian. Ia
adalah jadual dua hala yang menerangkan topik yang akan diliputi dalam ujian dan bilangan item yang
dikaitkan dengan setiap topik. Jadual memastikan bahawa sampel soalan yang adil dan mewakili
muncul dalam ujian. Guru tidak boleh mengukur setiap topik atau objektif dan tidak boleh menanyakan
setiap soalan yang mereka ingin tanya. Jadual Spesifikasi membolehkan guru membina ujian yang
memfokuskan kepada bidang utama dan wajaran (dalam peratusan) yang diberikan dalam bahagian
ujian yang berbeza berdasarkan kepentingannya. Jadual Spesifikasi menyediakan bukti kepada guru
bahawa sesuatu ujian mempunyai kesahan kandungan dan ia meliputi perkara yang perlu diliputi.
Satu sampel Jadual Spesifikasi yang ditunjukkan dalam Jadual 3.1 mempunyai kandungan pada satu
lajur dan tahap kognitif di bahagian atas. Walau bagaimanapun, guru juga boleh menyusun kandungan
merentas bahagian atas dan peringkat bawah lajur. Dalam sampel ini, guru yang menyediakan jadual
mengumpulkan tahap „Mengingat‰ dan „Memahami‰ bersama-sama. Kemungkinan besar dia
percaya ingatan terus adalah terlalu mudah untuk dianggap sebagai pembelajaran sebenar.
Tahap
Kandungan Jumlah
Mengingati dan Memohon Menganalisis, Menilai dan
Pemahaman (%) (%) Mencipta (%) (%)
Topik 1 15 15 30 60
Topik 2 10 20 10 40
Jumlah 25 35 40 100
Untuk Jadual Spesifikasi berguna, ia biasanya mengandungi lebih banyak butiran daripada sampel
yang ditunjukkan dalam Jadual 3.1. Bilangan soalan yang akan dimasukkan ke dalam sesuatu ujian
adalah berdasarkan kepentingan objektif, jenis soalan, subjek dan jumlah masa yang ada untuk ujian.
Jadual Spesifikasi yang lebih terperinci ditunjukkan dalam Jadual 3.2.
Dalam contoh yang ditunjukkan dalam Jadual 3.2, lajur menegak di sebelah kiri jadual
2 hala menunjukkan senarai topik yang diliputi dalam kelas dan jumlah masa yang
dibelanjakan untuk topik tersebut. Topik juga boleh dibahagikan lagi kepada subtopik
seperti „Tolak dua nombor tanpa mengumpul semula nombor 2 digit daripada nombor
2 digit‰ di bawah topik „Penolakan dalam lingkungan 1000‰.
Jumlah masa yang dihabiskan dalam topik seperti yang ditunjukkan dalam lajur „Jam
Interaksi‰ boleh digunakan sebagai asas untuk mengira wajaran atau peratusan dan
bilangan soalan atau item bagi setiap topik. Sebagai contoh, guru telah menghabiskan
20 jam mengajar tiga topik yang mana 6 jam diperuntukkan untuk „Tambahan dengan
jumlah tertinggi 1000‰. Maka, 6 jam daripada jumlah 20 jam berjumlah 30% atau 9
item daripada jumlah 30 item seperti yang dirancang oleh guru.
Guru mungkin mempunyai sebab untuk memperuntukkan 25%, 35% dan 40% untuk
tahap „Mengingat‰, „Memahami‰ dan „Mengaplikasi‰ masing-masing. Mungkin dia
cuba melatih pelajar Tahun 2nya untuk memberi lebih perhatian kepada soalan „berfikir‰.
25% daripada tahap „Mengingat‰ sebenarnya ialah 7.5 soalan, 35% daripada tahap
„Pemahaman‰ ialah 10.5 soalan dan 40% daripada tahap „Mengaplikasi‰ ialah 12
soalan. Jumlah 30 tidak terjejas kerana nombor 7.5 dan 10.5 mudah dibundarkan
kepada 8 dan 10.
Sel dalam # lajur boleh diisi atau dikira sewenang-wenangnya menggunakan formula
mudah. Dalam # lajur pertama, topik „Tambahan ...‰ di bawah tahap „Mengingat‰
hendaklah 25% ÿ 9 = 2.25, topik „Penolakan ...‰ di bawah „Mengingat‰ ialah 25% ÿ
9 = 2.25 dan topik „Pendaraban ...‰ di bawah „Mengingat‰ ialah 25% ÿ 12 = 3. Guru
boleh sama ada membundarkan nombor 2.25, 2.25, 3 hingga 3, 2, 3 atau 2, 3, 3.
Guru, terutamanya yang baru dilatih, dinasihatkan supaya Jadual Spesifikasi ini
bersama-sama sukatan pelajaran disemak oleh pakar mata pelajaran atau Ketua
Jabatan mata pelajaran untuk mengesahkan sama ada rancangan ujian itu benar-benar
mengukur apa yang ditetapkan untuk diukur. . Apabila item ujian telah digubal dan
dipasang, adalah dinasihatkan supaya sekali lagi menyerahkan draf kertas ujian dan
Jadual Spesifikasi kepada Ketua Jabatan atau pakar mata pelajaran yang diiktiraf untuk
menilai sama ada item ujian itu, sebenarnya, menilai. kandungan yang ditentukan.
Kesahan kandungan berbeza dengan kesahan muka. Kesahan muka menilai sama
ada ujian „kelihatan sah‰ kepada pemeriksa yang menduduki ujian manakala kesahan
kandungan memerlukan pakar subjek yang diiktiraf untuk menilai sama ada item ujian
menilai kandungan yang ditentukan.
Jelas sekali bahawa Jadual Spesifikasi memberi manfaat kepada pelajar dalam dua cara:
Jadual Spesifikasi membantu memastikan terdapat padanan antara apa yang diajar dan apa
yang diuji. Daripada contoh tersebut, kita dapat melihat bahawa pentaksiran bilik darjah
didorong oleh pengajaran bilik darjah yang seterusnya didorong oleh objektif pembelajaran.
Penentuan apa yang guru ingin ukur dengan ujian harus mendahului penentuan bagaimana
mereka akan mengukurnya.
Guru harus membiasakan diri untuk menulis model jawapan yang mudah difahami oleh orang lain.
Jawapan model ini boleh digunakan oleh guru lain yang bertindak sebagai pemeriksa luar, jika perlu.
Selain itu, rubrik juga boleh menjadi alat yang berkesan untuk membantu guru atau pemeriksa luar.
Penyelarasan perlu dilakukan setelah skrip ujian dikumpul. Guru hendaklah cuba membaca beberapa
jawapan daripada skrip dan menyemak jawapan yang betul dalam skema pemarkahan. Guru
kadangkala mendapati bahawa pelajar telah mentafsir soalan ujian dengan cara yang berbeza daripada
apa yang dihasratkan.
Pelajar mungkin menghasilkan jawapan yang sangat baik yang mungkin sedikit di luar apa yang
ditanya. Pertimbangkan untuk memberi markah yang sewajarnya kepada pelajar ini.
Guru hendaklah membuat catatan dalam skema pemarkahan untuk sebarang kesilapan yang dibuat
sebelum ini tetapi dibawa melalui jawapan. Markah hendaklah ditolak jika selebihnya respons adalah
baik.
Skim pemarkahan boleh meningkatkan kecekapan penggredan ujian tetapi selalunya ia hanya memberikan
maklumat terhad untuk menggalakkan pembelajaran. Selain skema pemarkahan, rubrik boleh disediakan
untuk bertindak sebagai alat tambahan untuk membantu guru atau pemeriksa luar. Banyak batasan skema
pemarkahan boleh diatasi dengan mempunyai rubrik yang mengandungi huraian tahap prestasi yang
dipertimbangkan dengan teliti dan dinyatakan dengan jelas.
Rubrik ialah skema pemarkahan deskriptif yang dibangunkan oleh guru, dan kadangkala berunding dengan
pelajar, untuk membimbing pertimbangan berkenaan dengan produk atau proses tugas penilaian pelajar.
Dalam istilah yang lebih mudah, rubrik ialah senarai semak dua dimensi lanjutan tentang perkara yang
dijangkakan dalam kriteria penilaian yang dipadankan dengan huraian tentang seberapa baik kerja itu
membentangkan setiap kriteria. Ia amat berguna untuk menilai tugas penilaian seperti portfolio dan projek.
Rubrik umum boleh membantu pelajar membina konsep tentang maksud melaksanakan sesuatu kemahiran
dengan baik. Rubrik umum tidak „memberi jawapan‰ kepada soalan. Sebaliknya, ia mengandungi huraian
seperti „Penjelasan penaakulan adalah jelas dan disokong oleh perincian yang sesuai.‰ Penerangan
seperti ini membantu pelajar memberi tumpuan kepada sasaran pembelajaran mereka sepatutnya. Mereka
memberikan penjelasan kepada pelajar tentang cara mendekati projek. Rubrik akan dibincangkan dengan
lebih terperinci dalam Topik 6 modul ini.
(a) Gunakan arahan yang ringkas dan ringkas untuk setiap jenis soalan;
(c) Tulis item yang memerlukan pemahaman atau kebolehan khusus yang dibangunkan di dalamnya
sudah tentu, bukan hanya kecerdasan am atau kebijaksanaan ujian;
(d) Jangan berikan petunjuk atau cadangkan jawapan kepada satu soalan dalam kandungan
soalan lain;
(e) Elakkan menulis soalan secara negatif. Jika anda mesti menggunakan negatif, serlahkannya kerana ia
boleh mengelirukan pelajar untuk menjawab dengan salah;
(g) Cuba, seboleh-bolehnya, untuk membina soalan anda sendiri. Semak untuk memastikan soalan sesuai
dengan objektif dan keperluan pembelajaran dalam Jadual Spesifikasi jika anda perlu menggunakan
soalan daripada sumber lain; dan
Garis panduan untuk menyediakan dan menulis aneka pilihan, jawapan pendek, benar-salah, padanan, esei,
portfolio dan tugasan projek akan dibincangkan masing-masing dalam Topik 4, 5, 6 dan 7.
(a) Adakah saya menguji apa yang saya fikir saya sedang menguji?
Jika anda ingin tahu sama ada pelajar boleh menggunakan konsep pada situasi baharu tetapi
kebanyakannya bertanya soalan yang memerlukan pelajar melabel bahagian atau mentakrifkan istilah,
itu bermakna anda telah menguji untuk mengingat semula dan bukannya aplikasi.
(c) Adakah Saya Menguji Apa yang Saya Tekankan dalam Kelas?
Pastikan anda telah bertanya kebanyakan soalan berkenaan dengan bahan yang anda rasa paling
penting, terutamanya jika anda telah menekankannya di dalam kelas. Elakkan soalan mengenai bahan
kabur yang berwajaran sama dengan soalan mengenai bahan penting.
(d) Adakah Bahan yang Saya Uji Benar-Benar Apa yang Saya Inginkan Pelajar Belajar?
Contohnya, jika anda mahu pelajar menggunakan kemahiran analitikal seperti kebolehan mengenal
corak atau membuat inferens tetapi hanya menggunakan soalan benar-salah yang memerlukan
ingatan bukan inferens, anda boleh cuba membina soalan benar-salah atau aneka pilihan yang lebih
kompleks .
Pelajar harus tahu apa yang diharapkan daripada mereka. Mereka seharusnya dapat mengenal
pasti ciri-ciri jawapan yang memuaskan dan memahami kepentingan relatif ciri-ciri tersebut. Ini
boleh dicapai dalam pelbagai cara. Contohnya, anda boleh memberikan maklum balas tentang
ujian, menerangkan jangkaan anda dalam kelas atau menyiarkan penyelesaian model pada blog
kelas. Guru digalakkan membuat nota pada skrip ujian.
Apabila skrip ujian dikembalikan kepada pelajar, nota akan membantu mereka memahami
kesilapan mereka dan membetulkannya.
• Langkah pertama dalam perancangan ujian ialah menentukan tujuan ujian. Ujian boleh
digunakan untuk pelbagai tujuan.
• Objektif pembelajaran yang ingin ditekankan oleh guru akan menentukan bukan sahaja bahan
apa yang perlu dimasukkan dalam ujian tetapi juga format khusus ujian.
• Membuat rangka tindakan ujian atau Jadual Spesifikasi adalah langkah penting seterusnya
yang perlu dilakukan oleh guru.
• Jadual Spesifikasi menerangkan kandungan, tingkah laku pelajar, bilangan soalan dalam ujian
yang sepadan dengan bilangan jam yang ditumpukan kepada objektif pembelajaran di
dalam kelas.
• Jadual Spesifikasi membantu memastikan terdapat padanan antara apa yang diajar dengan apa
yang diuji. Pentaksiran bilik darjah didorong oleh pengajaran bilik darjah yang seterusnya
didorong oleh objektif pembelajaran.
• Format ujian yang digunakan adalah salah satu faktor pendorong utama dalam pembelajaran pelajar
tingkah laku.
• Ujian objektif ialah ujian bertulis yang terdiri daripada item atau soalan yang memerlukan
responden memilih daripada senarai jawapan yang mungkin.
• Menyediakan rubrik atau skema pemarkahan lebih awal daripada tarikh ujian akan memberi guru
masa yang mencukupi untuk menyemak soalan mereka dan membuat perubahan kepada
jawapan apabila perlu.
Topik ÿ Membina
Ujian Objektif
4 barang
HASIL PEMBELAJARAN
Pada akhir topik ini, anda seharusnya dapat:
1. Tentukan ujian objektif;
2. Bezakan antara jenis ujian objektif yang berbeza;
3. Bincangkan kelebihan menggunakan pelbagai jenis ujian objektif; 4.
Mengenal pasti kelemahan menggunakan pelbagai jenis ujian objektif;
dan
ÿ PENGENALAN
Dalam topik ini kita akan memberi tumpuan kepada menggunakan ujian objektif untuk
menilai pelbagai jenis tingkah laku dalam bilik darjah. Pertama, perbincangan akan
dihadkan kepada bentuk mudah item ujian objektif, iaitu item jawapan pendek, item
benar-salah dan item padanan. Tiga jenis ujian objektif diperiksa dan garis panduan
untuk pembinaan setiap jenis ujian dibincangkan. Kelebihan dan batasan setiap jenis
ujian objektif ini dijelaskan. Kedua, kita akan membincangkan item aneka pilihan, bentuk
item ujian objektif yang lebih kompleks. Perbincangan akan memberi tumpuan kepada
ciri dan kegunaan item aneka pilihan, kelebihan dan batasannya dan beberapa cadangan
untuk pembinaan item tersebut.
Apakah ujian objektif? Ujian objektif ialah ujian bertulis yang terdiri daripada item atau
soalan yang memerlukan responden menjawabnya dengan membekalkan perkataan,
frasa atau simbol atau dengan memilih daripada senarai jawapan yang mungkin. Item
ujian yang terdahulu sering dirujuk sebagai item ujian jenis bekalan manakala item ujian
yang kedua dirujuk sebagai item ujian jenis pemilihan. Perkataan objektif bermaksud
„tepat‰. Item atau soalan objektif adalah „tepat‰ kerana ia tidak boleh dipengaruhi oleh
keutamaan peribadi dan prasangka penanda. Dalam erti kata lain, ia bukan „subjektif‰
dan tidak terbuka kepada tafsiran yang berbeza-beza. Ini adalah salah satu sebab
mengapa ujian objektif popular dalam mengukur kebolehan manusia, kecekapan dan
banyak lagi sifat psikologi seperti personaliti, minat dan sikap. Antara item ujian objektif
biasa adalah seperti yang ditunjukkan dalam Rajah 4.1.
Anda boleh merujuk kepada Linn dan Gronlund (1995) untuk lebih banyak contoh.
Sekarang, mari kita lihat kelebihan dan batasan jenis soalan ini.
Soalan jawapan pendek biasanya digunakan untuk mengukur hasil pembelajaran yang mudah.
Ia digunakan hampir secara eksklusif untuk mengukur maklumat yang dihafal (kecuali untuk hasil
penyelesaian masalah yang diukur dalam Matematik dan Sains). Ini sebahagiannya telah menjadikan
soalan jawapan pendek sebagai salah satu yang paling mudah untuk dibina.
Satu lagi kelebihan soalan jawapan pendek ialah kemungkinan meneka yang sering berlaku dalam item
jenis bekalan dapat dikurangkan. Dalam kes ini, pelajar mesti memberikan jawapan yang betul apabila
mereka menjawab soalan jawapan pendek.
Mereka mesti sama ada mengingat maklumat yang diminta atau membuat pengiraan yang diperlukan untuk
mendapatkan jawapan. Mereka tidak boleh bergantung pada pengetahuan separa mereka untuk memilih
jawapan yang betul daripada senarai alternatif.
Banyak soalan jawapan pendek boleh ditetapkan untuk tempoh masa tertentu. Kertas ujian yang
mengandungi soalan jawapan pendek dengan itu mampu merangkumi kandungan kursus yang akan dinilai
yang agak luas. Liputan kandungan yang luas meningkatkan kesahan kandungan ujian.
Satu had utama soalan jawapan pendek ialah ia tidak boleh digunakan untuk mengukur hasil
pembelajaran yang kompleks seperti menyusun idea, mengemukakan hujah atau menilai maklumat.
Apa yang diperlukan pelajar ialah menyediakan perkataan, frasa, nombor atau simbol.
Pemarkahan jawapan kepada soalan jawapan pendek juga boleh menimbulkan masalah. Melainkan
soalan itu diutarakan dengan teliti, pelajar boleh memberikan jawapan dengan pelbagai tahap
ketepatan. Sebagai contoh, jawapan kepada soalan seperti „Bilakah Malaysia ditubuhkan?‰ boleh
sama ada „Pada 1963‰ atau „Pada 16 September 1963‰. Guru perlu memutuskan sama ada pelajar
yang memberikan jawapan separa mempunyai tahap pengetahuan yang sama dengan mereka yang
memberikan jawapan lengkap. Selain itu, jawapan pelajar juga boleh dicemari oleh kesilapan ejaan.
Jika ejaan diambil kira, markah ujian pelajar akan mencerminkan tahap pengetahuan mereka tentang
kandungan yang dinilai serta keupayaan mengeja mereka. Jika ejaan tidak dipertimbangkan dalam
pemarkahan, guru perlu memutuskan sama ada perkataan yang salah ejaan itu benar-benar mewakili
jawapan yang betul.
Walaupun pembinaan soalan jawapan pendek adalah lebih mudah berbanding jenis soalan lain, ia
mempunyai pelbagai kecacatan yang harus dielakkan untuk memastikan ia berfungsi seperti yang
diharapkan. Berikut adalah beberapa garis panduan untuk pembinaan soalan jawapan pendek:
(a) Katakan soalan supaya jawapan yang dimaksudkan adalah ringkas dan spesifik
Seboleh-bolehnya, soalan itu hendaklah diutarakan dengan cara yang hanya
satu jawapan betul.
Sebagai contoh:
Item yang lebih baik: Haiwan yang memakan daging haiwan lain dikelaskan sebagai
___________.
(b) Gunakan soalan langsung dan bukannya pernyataan yang tidak lengkap
Soalan langsung adalah lebih semula jadi dan biasanya lebih berstruktur.
Sebagai contoh:
Item yang lebih baik: Pada tahun berapa Columbus menemui Amerika? (1492)
Jawapan yang mungkin untuk item pertama: bot, abad ke-15, pencarian untuk India
(c) Jika masalah memerlukan jawapan berangka, nyatakan unit di mana jawapan itu hendak
dinyatakan
Sebagai contoh:
Item yang lebih baik: Pada tahun berapa Columbus menemui Amerika? (1492)
Jawapan yang mungkin untuk item pertama: bot, abad ke-15, pencarian untuk India
(d) Jangan masukkan terlalu banyak tempat kosong untuk item pelengkap
Kosong untuk jawapan hendaklah sama panjangnya. Untuk item pelengkap, letakkan tempat
kosong berhampiran hujung ayat.
Sebagai contoh:
Item yang lebih baik: Pada tahun berapa Columbus menemui Amerika? (1492)
Jawapan yang mungkin untuk item pertama: bot, abad ke-15, pencarian untuk India
AKTIVITI 4.1
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
Sebagai contoh:
betul Salah
Soalan benar-salah boleh ditulis dengan cepat dan boleh merangkumi banyak kandungan. Soalan
palsu benar sangat sesuai untuk menguji ingatan atau pemahaman pelajar. Pelajar secara amnya
boleh menjawab banyak soalan, merangkumi banyak kandungan dalam masa yang agak singkat. Dari
perspektif guru, soalan-soalan ini boleh ditulis dengan cepat dan mudah untuk dijaringkan. Kerana
mereka boleh dijaringkan secara objektif, markah adalah lebih dipercayai daripada item yang sekurang-
kurangnya sebahagiannya bergantung pada pertimbangan guru. Secara amnya, ia lebih mudah untuk
dibina berbanding dengan soalan aneka pilihan kerana tidak ada keperluan untuk membangunkan
distraktor. Oleh itu, mereka kurang memakan masa berbanding dengan membina soalan aneka pilihan.
(a) Meneka ÿ Seorang pelajar mempunyai peluang satu dalam dua untuk meneka jawapan yang
betul bagi sesuatu soalan. Markah pada item benar-salah cenderung tinggi kerana mudah
meneka jawapan yang betul apabila jawapannya tidak diketahui. Dengan hanya dua
pilihan (benar atau salah) pelajar boleh mengharapkan untuk meneka dengan betul pada
separuh daripada item yang jawapan yang betul tidak diketahui. Oleh itu, jika pelajar
mengetahui jawapan yang betul kepada 10 daripada 20 soalan dan meneka 10 yang lain,
pelajar boleh menjangkakan skor 15. Guru boleh menjangkakan markah antara kira-kira
50 peratus untuk pelajar yang tidak melakukan apa-apa selain meneka pada semua item
kepada 100 peratus untuk pelajar yang mengetahui bahan tersebut.
(b) Oleh kerana item ini dalam bentuk pernyataan, kadangkala terdapat kecenderungan untuk
mengambil petikan daripada teks, mengharapkan pelajar mengenali petikan yang betul
atau mencatat perubahan (kadang-kadang kecil) dalam perkataan. Mungkin juga terdapat
kecenderungan untuk memasukkan bahan remeh atau tidak penting daripada teks. Kedua-
dua amalan ini tidak digalakkan.
(c) Ia boleh menjadi sukar untuk menulis pernyataan yang jelas benar atau salah, terutamanya
untuk bahan yang kompleks
(d) Item benar-salah memberikan sedikit maklumat diagnostik. Guru selalunya boleh mendapatkan
maklumat berguna tentang kesilapan dan miskonsepsi pelajar dengan memeriksa jawapan
pelajar yang salah tetapi item benar-salah tidak memberikan maklumat diagnostik tersebut.
(e) Item benar-salah mungkin menghasilkan kesan cadangan negatif. Sesetengah pakar ujian
merasakan bahawa mendedahkan kenyataan palsu mungkin menggalakkan pembelajaran
maklumat palsu.
(f) Pernyataan palsu tidak memberikan bukti bahawa pelajar tahu perkara yang betul
jawab.
Sebagai contoh:
Item buruk: Kajian biologi membantu kita memahami organisma hidup dan meramalkan
cuaca.
Item yang lebih baik: Kajian biologi membantu kita memahami organisma hidup.
(b) Gunakan pernyataan negatif dengan berhati-hati tetapi elakkan negatif berganda. Negatif
berganda cenderung menyumbang kepada kekaburan pernyataan. Pernyataan dengan
perkataan seperti tiada, tidak dan tidak hendaklah dielakkan sejauh mungkin.
Sebagai contoh:
Item yang lebih baik: Semua langkah dalam percubaan adalah perlu.
(c) Elakkan pernyataan umum yang luas. Kebanyakan generalisasi luas adalah palsu melainkan
berkelayakan.
Sebagai contoh:
Item lemah: Soalan jawapan pendek adalah lebih baik daripada soalan esei dalam ujian.
Item yang lebih baik: Soalan jawapan pendek adalah lebih baik daripada soalan esei dalam
menguji maklumat fakta.
(d) Elakkan ayat kompleks yang panjang. Ayat sebegini juga menguji kefahaman bacaan selain
pencapaian yang hendak diukur.
Sebagai contoh:
Item buruk: Walaupun terdapat kesukaran teori dan eksperimen untuk menentukan nilai pH
yang tepat bagi sesuatu larutan, adalah mungkin untuk menentukan sama
ada larutan itu berasid oleh warna merah yang terbentuk pada kertas litmus
apabila dimasukkan ke dalam larutan.
Item yang lebih baik: Kertas litmus menjadi merah dalam larutan berasid.
(e) Cuba gunakan dalam kombinasi dengan bahan lain seperti graf, peta dan bahan bertulis. Gabungan
ini membolehkan ujian pembelajaran yang lebih maju.
(f) Elakkan mengeluarkan kenyataan terus daripada bacaan yang diberikan, nota atau bahan kursus lain
supaya ingat sahaja tidak akan membenarkan jawapan yang betul.
(g) Secara umum, elakkan penggunaan perkataan yang akan memberi isyarat tindak balas yang betul
kepada pelajar yang bijak dalam ujian. Mutlak seperti „tiada‰, „tidak pernah‰, „selalu‰, „semua‰
dan „mustahil‰ cenderung palsu manakala kelayakan seperti „biasa‰, „umum‰, „kadang-
kadang‰ dan „kerap‰ berkemungkinan benar .
(h) Situasi yang sama berlaku dengan penggunaan "can" dalam pernyataan benar-salah. Jika pelajar
mengetahui satu kes di mana sesuatu „boleh‰ dilakukan, ia adalah benar.
(i) Pernyataan dan istilah yang samar-samar atau samar-samar seperti "besar", "lama", "biasa",
"sesetengah" dan "biasanya" sebaiknya dielakkan demi kejelasan.
(j) Sesetengah istilah mempunyai lebih daripada satu makna dan boleh ditafsir secara berbeza oleh
individu.
(k) Pernyataan benar hendaklah lebih kurang sama panjangnya dengan pernyataan palsu (terdapat
kecenderungan untuk menambah butiran dalam pernyataan benar untuk menjadikannya lebih tepat).
(l) Katakan pernyataan itu dengan tepat sehingga ia boleh dinilai dengan jelas benar atau
salah.
AKTIVITI 4.2
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
Soalan padanan digunakan dalam mengukur keupayaan pelajar untuk mengenal pasti
hubungan antara dua senarai istilah, frasa, pernyataan, definisi, tarikh, peristiwa, orang dan
sebagainya.
Contohnya:
Arahan: Lajur A mengandungi pernyataan yang menerangkan bandar-bandar Asia terpilih.
Untuk setiap huraian cari bandar yang sesuai dalam Lajur B. Setiap bandar dalam Lajur B
boleh digunakan sekali sahaja.
Lajur A Lajur B
Pelajar membaca premis (Lajur A) dan mencari jawapan yang betul daripada antara yang
terdapat dalam Lajur B. Pelajar kemudian mencetak huruf jawapan yang betul di tempat
kosong di sebelah premis dalam Lajur A. Alternatifnya ialah meminta pelajar melukis garisan
daripada respons yang betul kepada premis tetapi ini lebih memakan masa untuk
menjaringkan gol. Salah satu cara untuk mengurangkan kemungkinan meneka jawapan
yang betul adalah dengan menyenaraikan bilangan respons yang lebih besar (Lajur B)
daripada premis (Lajur A) seperti yang dilakukan dalam contoh. Satu lagi cara untuk
mengurangkan kemungkinan meneka adalah dengan membenarkan respons digunakan
lebih daripada sekali. Arahan kepada pelajar hendaklah sangat jelas tentang penggunaan respons.
Sesetengah pakar psikometrik mencadangkan tidak lebih daripada lima hingga lapan premis
(Lajur A) dalam satu set. Untuk setiap premis, pelajar perlu membaca keseluruhan senarai
respons (atau yang masih tidak digunakan) untuk mencari respons yang sepadan.
Atas sebab ini, elemen yang lebih pendek harus berada dalam Lajur B dan bukannya Lajur
A untuk meminimumkan jumlah bacaan yang diperlukan untuk setiap item (Jabatan
Pendidikan Alabama, 2001). Respons (Lajur B) hendaklah disenaraikan dalam susunan
logik, jika ada (contohnya, susunan kronologi, mengikut saiz). Jika tiada susunan yang jelas,
jawapan hendaklah disenaraikan mengikut abjad. Premis (Lajur A) tidak boleh disenaraikan
dalam susunan yang sama dengan respons. Penjagaan mesti diambil untuk memastikan
bahawa kunci perkaitan sebagai respons yang betul adalah betul dan item bernombor itu
tidak boleh dikaitkan dengan mana-mana pilihan lain.
(a) Soalan memadankan amat baik untuk menilai pemahaman pelajar tentang perhubungan.
Mereka boleh menguji ingatan semula dengan memerlukan pelajar untuk memadankan
elemen berikut (McBeath, 1992):
(b) Mereka juga boleh menilai keupayaan pelajar untuk menggunakan pengetahuan dengan menghendaki
pengambil ujian untuk memadankan perkara berikut:
(c) Soalan padanan adalah benar-benar variasi daripada format aneka pilihan. Jika anda mendapati
bahawa anda sedang menulis soalan aneka pilihan yang berkongsi pilihan jawapan yang
sama, anda boleh mempertimbangkan untuk mengumpulkan soalan ke dalam item yang
sepadan.
(d) Soalan padanan umumnya mudah ditulis dan diberi markah apabila kandungan
yang diuji dan objektif sesuai untuk soalan padanan.
(e) Sangat cekap kerana sejumlah besar pengetahuan boleh dijadikan sampel dalam tempoh
masa yang singkat.
(a) Soalan padanan adalah terhad kepada bahan yang boleh disenaraikan dalam
dua lajur dan mungkin tidak banyak bahan yang sesuai dengan format
sedemikian;
(b) Jika terdapat empat item dalam soalan padanan dan pelajar tahu jawapan
untuk tiga daripadanya, item keempat ialah pemberian melalui penyingkiran;
(c) Sukar untuk membezakan antara item berkesan dan tidak berkesan;
(d) Selalunya membawa kepada ujian fakta atau cebisan maklumat yang remeh; dan
(a) Berikan arahan yang jelas. Mereka harus menerangkan berapa kali respons
boleh digunakan;
(c) Sertakan lebih banyak respons daripada premis atau benarkan respons digunakan lebih daripada sekali;
(e) Jawapan yang betul tidak sepatutnya jelas kepada mereka yang tidak mengetahui kandungannya
sedang diajar;
(f) Seharusnya tidak ada kata kunci yang muncul dalam premis dan respons,
memberikan petunjuk kepada jawapan yang betul; dan
(g) Semua jawapan dan premis untuk item yang sepadan hendaklah dipaparkan pada
muka surat yang sama.
AKTIVITI 4.3
2. Pilih lima soalan benar-salah dalam bidang subjek anda dan analisis setiap soalan
item menggunakan garis panduan yang dibincangkan.
3. Pilih lima soalan yang sepadan dalam bidang subjek anda dan analisis setiap satu
item menggunakan garis panduan yang dibincangkan.
4. Cadangkan bagaimana anda akan menambah baik item yang lemah untuk setiap jenis
soalan yang telah anda kenal pasti.
Bincangkan jawapan anda dengan rakan kursus anda dalam forum dalam talian
myINSPIRE.
MCQ adalah yang paling sukar untuk disediakan. Soalan-soalan ini mempunyai dua bahagian iaitu
batang yang mengandungi soalan dan empat atau lima pilihan yang mengandungi jawapan yang
betul. Jawapan yang betul dipanggil respons berkunci dan pilihan yang salah dipanggil distraktor.
Batang boleh dikemukakan sebagai soalan, arahan atau pernyataan manakala pilihan boleh berupa
perkataan, frasa, nombor, simbol dan sebagainya. Walaupun kelihatan kejam, peranan distraktor
adalah untuk menarik perhatian responden yang tidak pasti jawapan yang betul.
Sekarang, mari kita lihat apakah MCQ terdiri daripada. Ia mempunyai batang dan juga pilihan.
(a) Batang
Batang hendaklah:
(ii) Dinyatakan dengan jelas dan padat, mengelakkan tatabahasa yang buruk, kompleks
sintaks, kekaburan dan negatif berganda;
(iii) Umumnya mengemukakan soalan yang positif. (Jika negatif digunakan, ia sepatutnya
ditekankan dengan huruf condong atau garis bawah);
(iv) Umumnya minta satu jawapan sahaja (jawapan yang betul atau terbaik); dan
(v) Sertakan seberapa banyak perkataan yang biasa kepada semua alternatif yang mungkin.
(i) Mempunyai sama ada empat atau lima alternatif, yang kesemuanya harus saling
eksklusif dan tidak terlalu lama;
(iv) Mengandungi jawapan yang dimaksudkan atau jawapan yang dikunci dan ia
sepatutnya kelihatan jelas betul kepada yang dimaklumkan tetapi ia semestinya
tidak betul tetapi boleh diterima oleh pengganggu.
Seperti yang dinyatakan sebelum ini, MCQ adalah yang paling sukar untuk disediakan. Kita
perlu memberi tumpuan kepada menulis batang serta menyediakan pilihan atau alternatif.
Semua pilihan dalam item aneka pilihan perlu munasabah tetapi ia juga perlu mengasingkan
pelajar yang berbeza tahap keupayaan. Jadual 4.1 menunjukkan beberapa pertimbangan
yang perlu diambil kira semasa membina MCQ, khususnya batang.
(a) Kemukakan satu Perang Dunia Kedua Dalam tempoh masa yang
pernyataan yang pasti ialah: A. Akibat kegagalan Liga manakah Perang Dunia II
untuk dilengkapkan atau Bangsa-Bangsa. berlaku?
dijawab oleh salah satu B. Mengerikan. A. 1914ÿ1917
daripada beberapa pilihan B. 1929ÿ1934
yang diberikan. C. Berjuang di Eropah, Asia dan Afrika.
C. 1939ÿ1945
Nota: Dalam item yang lemah, tidak ada makna apa yang ditanyakan oleh
soalan daripada batang. Item yang lebih baik lebih jelas mengenal pasti
soalan dan menawarkan pelajar satu set pilihan homogen.
(b) Elakkan bahan yang Selama hampir satu abad, Sungai Rhine Manakah di antara Sungai
tidak perlu dan tidak berikut telah digunakan oleh orang Eropah akan
untukmenjadi keputusan
pelbagai tujuan. yang
relevan. Walau bagaimanapun, dalam beberapa tahun paling dramatik jika,
kebelakangan ini,kerana
peningkatan trafik sungai telah mengakibatkan peningkatan
pencemaran tahap
diesel dari kapal,
Sungai
pencemaran diesel di laluan air. Antara berikut, Rhine
yang ditutupakan
manakah kepada
menjadi hasil yang paling dramatik jika, disebabkan pencemaran, Majlis
semua penghantaran?
Menteri-menteri Komuniti Eropah memutuskan untuk menutup
A. Kenaikan Sungai
harga untuk
Rhine kepada semua penghantaran? produk Ruhr.
B. Kekurangan air untuk
industri Itali.
C. Mengurangkan
daya saing Industri
Aeroangkasa Perancis.
Nota: Item yang lemah terlalu banyak perkataan dan mengandungi bahan yang tidak
diperlukan.
Sumber: McKenna dan Bull (1999). Mereka bentuk objektif yang berkesan
soalan. Universiti Loughborough.
(c) Gunakan bahasa yang Apabila tahap kesuburan Penurunan besar dalam kesuburan
jelas dan lurus ke menghampiri nadirnya, apakah kesan di negara membangun
hadapan dalam batang yang paling mungkin untuk warga negara berkemungkinan menghasilkan
item. Soalan yang membangun? A. penurunan dalam kadar
dibina menggunakan A. Pengurangan dalam buruh penyertaan tenaga buruh
perkataan yang kadar penyertaan paksa sebanyak daripada wanita.
kompleks mungkin perempuan. B. arah aliran menurun dalam
menjadi ujian kefahaman B. Arah aliran menurun dalam nisbah
nisbah tanggungan belia.
bacaan dan bukannya
tanggungan belia.
penilaian sama ada C. Pangkalan yang lebih luas C. asas yang lebih luas dalam
pelajar mengetahui
perkara tersebut. dalam piramid penduduk. piramid penduduk.
D. Kadar kematian bayi D. peningkatan kadar
meningkat. kematian bayi.
Nota: Dalam item yang ditambah baik, perkataan „nadir‰ digantikan dengan
„penurunan‰ dan „ramifikasi‰ digantikan dengan „menghasilkan‰ yang
merupakan perkataan yang lebih lurus ke hadapan.
(d) Gunakan negatif Antara berikut, yang manakah bukan Antara berikut, yang manakah
dengan berhati-hati. simptom osteoporosis? merupakan simptom osteoporosis?
Jika negatif mesti A. Ketumpatan tulang berkurangan. A. Rambut gugur.
digunakan, gunakan huruf
B. Kerap patah tulang. B. Sakit sendi.
besar, garis bawah atau
tebalkan.
C. Suhu badan meningkat. C. Suhu badan
D. Sakit pinggang. meningkat.
D. Ketumpatan tulang berkurangan.
Nota: Item yang lebih baik dinyatakan dalam positif untuk mengelakkan
penggunaan negatif „tidak‰.
(e) Letakkan seberapa Ahli teori pluralisme telah Ahli teori pluralisme telah
banyak soalan dalam menegaskan yang manakah antara berikut?menegaskan bahawa pengekalan
batang yang mungkin, A. Pengekalan demokrasi demokrasi memerlukan A. kelas
bukannya menduplikasi pertengahan yang besar.
memerlukan kelas pertengahan
bahan dalam setiap yang besar.
pilihan.
B. Pengekalan demokrasi B. pengasingan kuasa
memerlukan pusat kerajaan.
autonomi kuasa imbang. C. pusat autonomi kuasa
pengimbang.
C. Penyelenggaraan D. wujudnya kepelbagaian
demokrasi memerlukan kumpulan agama.
kewujudan kumpulan agama yang
berbilang.
D. Penyelenggaraan
demokrasi memerlukan
pengasingan kuasa kerajaan.
D. polder. D. polder.
Nota: Item yang lemah menggunakan artikel „an‰ yang mengenal pasti
pilihan C sebagai respons yang betul. Menamatkan batang dengan „a/an‰
menambah baik item.
(g) Seboleh-bolehnya Manakah antara lelaki berikut
elakkan bertanya yang paling banyak menyumbang
pendapat. ke arah kekalahan Jerman Hitler
dalam Perang Dunia II?
AFD Roosevelt
B. George Patton C.
Josef Stalin D.
Winston Churchill
(h) Elakkan menggunakan SENTIASA dan JANGAN SEKALI-KALI dalam stem kerana pelajar yang bijak dalam ujian mungkin akan memerintah
kenyataan sejagat tersebut di luar pertimbangan.
AKTIVITI 4.4
1. Pilih sepuluh MCQ dalam bidang subjek anda dan analisis punca setiap MCQ
item menggunakan garis panduan yang dibincangkan.
Bincangkan jawapan anda dengan rakan kursus anda dalam forum dalam talian myINSPIRE.
Sekarang, mari kita lihat Jadual 4.2 yang menunjukkan beberapa pertimbangan semasa
membina distraktor untuk MCQ.
(a) Untuk MCQ respons Apakah punca utama pencemaran Apakah punca utama pencemaran
tunggal, pastikan hanya sungai Malaysia? sungai Malaysia?
terdapat satu respons A. Pembersihan
yang betul. A. Pembakaran
tanah B. Pembakaran
terbuka B. Hakisan pantai
terbuka C. Pembuangan sisa
pepejal D. Hakisan pantai C. Lambakan sisa pepejal D.
Karbon dioksida
pelepasan
Nota: Dalam item yang lemah, kedua-dua pilihan A dan C boleh dianggap
betul.
(b) Gunakan hanya alternatif Siapakah Perdana Menteri Siapakah Perdana Menteri
yang munasabah dan Malaysia yang ketiga? Malaysia yang ketiga?
menarik sebagai pengalih A. Hussein Onn A. Hussein Onn
perhatian.
B. Ghafar Baba B. Abdullah Badawi
C. Mahathir Mohamad C. Mahathir Mohamad
D. Musa Hitam D. Abdul Razak Hussein
Nota: Dalam item yang lemah, B dan D bukanlah pengacau yang serius.
(c) Apabila menulis distraktor, jika boleh, elakkan pilihan „Semua di atas‰ dan „Tiada di atas‰. Jika anda
memasukkannya, pastikan ia muncul sebagai jawapan yang betul pada bila-bila masa.
Ia menggoda untuk menggunakan alternatif ini tetapi penggunaannya boleh menjadi cacat. Sebagai
permulaan, mereka sering muncul sebagai alternatif yang bukan tindak balas yang betul. Jika anda
menggunakannya, pastikan ia merupakan jawapan yang betul dari semasa ke semasa. Alternatif
„semua di atas‰ boleh dieksploitasi oleh pelajar bijak ujian yang akan mengenalinya sebagai pilihan
yang betul dengan mengenal pasti hanya dua alternatif yang betul. Begitu juga, pelajar yang boleh
mengenal pasti satu alternatif yang salah boleh juga menolak respons ini. Jelas sekali, peluang pelajar
untuk meneka jawapan yang betul bertambah baik apabila mereka menggunakan teknik ini. Walaupun
proses penghapusan yang serupa tidak boleh dilakukan dengan „tiada satu pun di atas‰, ia adalah kes
apabila pilihan ini digunakan sebagai jawapan yang betul, soalan itu hanya menguji keupayaan pelajar
untuk menolak jawapan yang salah tetapi ini tidak menjamin bahawa mereka tahu yang betul. (Gronlund,
1988).
(d) Pengganggu berdasarkan kesilapan pelajar biasa atau miskonsepsi adalah sangat berkesan.
Satu teknik untuk menyusun distraktor ialah meminta pelajar menjawab soalan jawapan pendek
terbuka, mungkin sebagai penilaian formatif. Kenal pasti jawapan yang salah yang paling kerap
muncul dan gunakannya sebagai pengacau untuk versi aneka pilihan soalan.
(e) Jangan cipta pengacau yang begitu hampir dengan jawapan yang betul sehingga boleh
mengelirukan pelajar yang benar-benar tahu jawapan kepada soalan itu. „Pengganggu harus
berbeza daripada kunci dengan cara yang ketara, bukan hanya dalam beberapa nuansa kecil
frasa atau penekanan.‰ (Isaacs, 1994)
Anda mungkin akan memilih untuk menggunakan tiga, empat atau lima alternatif dalam MCQ. Sehingga baru-
baru ini, ia dianggap bahawa tiga atau empat pengacau diperlukan untuk item itu menjadi sesuai sukar. Walau
bagaimanapun kajian oleh Owen dan Freeman mencadangkan bahawa tiga pilihan adalah mencukupi (Brown,
1987). Jelas sekali semakin tinggi bilangan pengacau, semakin kecil kemungkinan untuk jawapan yang betul
dipilih melalui meneka (dengan syarat semua alternatif mempunyai kesukaran yang sama).
AKTIVITI 4.5
1. Adakah anda bersetuju bahawa guru tidak boleh menggunakan negatif dalam batang
MCQ? Wajarkan jawapan anda.
2. Adakah anda bersetuju bahawa guru-guru harus mengelak daripada menggunakan distraktor seperti
„Semua di atas‰ dan „Tiada satu pun di atas‰? Wajarkan jawapan anda.
3. Pilih sepuluh MCQ dalam bidang subjek anda dan analisis gangguan
setiap item menggunakan garis panduan yang dibincangkan. Cadangkan cara anda
memperbaiki perkara yang lemah.
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
(f) Markah lebih dipercayai daripada item yang dijaringkan secara subjektif (seperti esei);
(h) Analisis item boleh mendedahkan betapa sukarnya setiap item dan sejauh mana ia membezakan
antara pelajar yang kuat dan lemah dalam kelas;
(i) Prestasi boleh dibandingkan dari kelas ke kelas dan tahun ke tahun;
(j) Boleh meliputi banyak bahan dengan sangat cekap (kira-kira satu item seminit
masa ujian); dan
(k) Item boleh ditulis supaya pelajar mesti mendiskriminasi antara pilihan yang berbeza dalam tahap
ketepatan.
Walaupun terdapat banyak kelebihan menggunakan MCQ, terdapat juga banyak batasan dalam
menggunakan item tersebut, iaitu:
(c) MCQ tidak berkesan untuk mengukur kemahiran menyelesaikan masalah serta keupayaan untuk
menyusun dan menyatakan idea;
(e) Terdapat kekurangan maklum balas tentang proses pemikiran individu. Sukar untuk menentukan
sebab pelajar individu memilih respons yang salah;
(f) Pelajar kadangkala boleh membaca lebih banyak soalan daripada yang dimaksudkan;
(g) Ia sering memberi tumpuan kepada menguji maklumat fakta dan gagal untuk menguji tahap pemikiran
kognitif yang lebih tinggi;
(h) Kadangkala terdapat lebih daripada satu jawapan „betul‰ yang boleh dipertahankan;
(i) Ia meletakkan tahap kebebasan yang tinggi pada keupayaan membaca pelajar dan keupayaan
menulis pembina;
Sekarang, mari kita lihat Jadual 4.3 yang meringkaskan peraturan prosedur untuk pembinaan MCQ.
Jadual 4.3: Peraturan Prosedur untuk Membina Soalan Aneka Pilihan (MCQ)
• Uji maklumat penting atau penting. • Elakkan memberi petunjuk melalui penggunaan
binaan tatabahasa yang salah.
• Elakkan perkara helah. • Elakkan penggunaan jenaka apabila
Contohnya:
Baca ulasan berikut yang dibuat oleh seorang guru tentang ujian dan kemudian jawab soalan.
„Pelajar pergi ke sekolah untuk belajar, bukan untuk mengambil ujian. Selain itu, ujian tidak boleh
digunakan untuk menunjukkan pembelajaran mutlak pelajar. Semua ujian yang boleh dilakukan
adalah untuk menilai pelajar mengikut urutan pencapaian dan kedudukan relatif ini dipengaruhi oleh
Antara jenis ujian berikut, yang manakah paling utama diperkatakan oleh guru ini?
A. Ujian bakat
B. Ujian diagnostik
C. Ujian formatif
D. Ujian sumatif*
Diadaptasi
daripada: https://www.learningsolutionsmag.com/articles/804/writing
multiple-choice-questions-for-higher-level-thinking
Sebagai contoh:
Dua pesakit lelaki berumur 60 tahun (P#1 dan P#2) menghidap diabetes Jenis 2. Masing-masing
mempunyai BMI 27. Rawatan utama bagi setiap pesakit adalah diet untuk mengurangkan tahap glukosa
darah.
Apakah sebab yang paling mungkin mengapa P#2 tidak menunjukkan penurunan paras glukosa
selepas tiga bulan?
C. P#2 mungkin menjalani kehidupan yang lebih tidak aktif daripada P#1.*
D. P#1 kehilangan lebih banyak berat badan pada diet pengurangan glukosa.
Diadaptasi
daripada: http://digitalcommons.hsc.unt.edu/cgi/viewcontent.cgi?article=100
9&context=test_item
(c) Pengganggu dan Sebab Konteks Utama dalam MCQ Kompleks Satu lagi
pendekatan untuk mengukur pemikiran kritis atau kreatif ialah meminta pelajar mensintesis apa yang
telah mereka pelajari ke dalam penjelasan. Jawapan yang mungkin termasuk jawapan dan pelbagai
sebab yang menyokong jawapan. Sudah tentu, hanya satu alasan yang logik dan betul, berdasarkan
pengetahuan dan kemahiran yang dinilai. Konteks juga disediakan apabila teknik ini digunakan.
Contohnya: Su
dan Ramya mahu menurunkan berat badan. Su mengamalkan diet rendah karbohidrat manakala
Ramya mengamalkan diet vegan. Selepas enam bulan, Su kehilangan 30 paun dan Ramya
kehilangan 15 paun.
Berhubung dengan penurunan berat badan, yang manakah daripada kesimpulan berikut disokong?
D. Diet vegan mengandungi lebih banyak kalori daripada diet rendah karbohidrat.
Diadaptasi
daripada: http://digitalcommons.hsc.unt.edu/cgi/viewcontent.cgi?article=100
9&context=test_item
Nitko (2004) merujuk kepada jenis soalan ini sebagai item yang bergantung kepada konteks.
Konteks dipersembahkan dalam beberapa bentuk bahan pengenalan yang mungkin termasuk graf,
carta, lukisan, formula, cabutan daripada bahan bacaan, peta dan senarai perkataan. Dalam
membuat soalan jenis ini, adalah penting bagi pelajar untuk memikirkan dan menggunakan
maklumat dalam bahan pengenalan untuk menjawab soalan untuk menyelesaikan masalah atau
menyelesaikan tugasan penilaian. Contoh yang diberikan sebelum ini merujuk kepada item aneka
pilihan. Walau bagaimanapun, item bergantung konteks boleh digunakan dengan apa-apa jenis
format item seperti esei, item benar-salah dan padanan.
AKTIVITI 4.6
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
• Ujian objektif ialah ujian bertulis yang terdiri daripada item atau soalan yang memerlukan
responden memilih jawapan daripada senarai jawapan yang mungkin.
• Item atau soalan objektif adalah „tepat‰ kerana ia tidak boleh dipengaruhi oleh
keutamaan peribadi dan prasangka penanda.
• Ujian objektif berbeza-beza bergantung kepada cara soalan dikemukakan. Empat jenis soalan
yang biasa digunakan dalam kebanyakan ujian objektif ialah soalan jawapan pendek, soalan
padanan, soalan benar-salah dan soalan aneka pilihan (MCQ).
• Dua bentuk soalan jawapan pendek ialah soalan langsung dan penyelesaian
soalan.
• Soalan benar-salah ialah soalan di mana pernyataan dikemukakan dan pelajar menunjukkan
dalam beberapa cara sama ada pernyataan itu benar atau salah.
• Soalan benar-salah boleh ditulis dengan cepat dan mudah untuk diberi markah. Kerana mereka
boleh dijaringkan secara objektif, markah adalah lebih dipercayai daripada item yang sekurang-
kurangnya sebahagiannya bergantung pada pertimbangan guru.
• Elakkan mengangkat kenyataan terus daripada bacaan yang diberikan, nota atau bahan kursus
lain supaya ingat sahaja tidak akan membenarkan jawapan yang betul.
• Soalan padanan digunakan untuk mengukur keupayaan pelajar untuk mengenal pasti hubungan
antara dua senarai istilah, frasa, pernyataan, definisi, tarikh, peristiwa, orang dan sebagainya.
• Untuk mengurangkan kemungkinan meneka jawapan yang betul dalam soalan padanan,
senaraikan bilangan respons yang lebih besar daripada premis dan benarkan respons
digunakan lebih daripada sekali.
• MCQ mempunyai dua bahagian: batang yang mengandungi soalan dan empat atau lima pilihan
yang mengandungi jawapan yang betul dipanggil respons berkunci dan pilihan yang salah
dipanggil distraktor.
• MCQ digunakan secara meluas kerana ia boleh digunakan untuk mengukur hasil
pembelajaran, daripada mudah kepada kompleks. Mereka sangat berstruktur dengan
tugas yang jelas disediakan dan dapat menguji sampel pencapaian yang luas.
• MCQ sukar dibina, cenderung mengukur hasil pembelajaran tahap rendah, meneka dan
tidak mengukur kebolehan menulis.
• Tidak mustahil untuk membina MCQ kemahiran berfikir aras tinggi (KBAT).
Meneka Jawapan
Topik ÿ Membina
Esei
5 Soalan
HASIL PEMBELAJARAN
Pada akhir topik ini, anda seharusnya dapat:
5. Bina soalan esei yang ditulis dengan baik yang menilai pembelajaran
hasil.
ÿ PENGENALAN
Dalam Topik 4, kami membincangkan secara terperinci penggunaan ujian objektif dalam menilai
pelajar. Dalam topik ini, kita akan mengkaji ujian esei. Ujian esei ialah teknik popular untuk
menilai pembelajaran dan digunakan secara meluas di semua peringkat pendidikan. Ia juga
digunakan secara meluas dalam menilai hasil pembelajaran dalam peperiksaan perniagaan dan profesional.
Soalan esei digunakan kerana ia mencabar pelajar untuk mencipta respons mereka sendiri
dan bukannya hanya memilih jawapan. Soalan esei berpotensi untuk mendedahkan
keupayaan pelajar untuk menaakul, mencipta, menganalisis dan mensintesis. Kemahiran
ini mungkin tidak dinilai dengan berkesan menggunakan ujian objektif.
Menghuraikan definisi ini, Reiner, Bothell, Sudweeks dan Wood (2002), berpendapat bahawa
untuk melayakkan diri sebagai soalan esei ia harus memenuhi empat kriteria berikut:
(a) Pelajar perlu mengarang dan bukannya memilih jawapan atau jawapannya. Dalam soalan
esei, pelajar perlu membina jawapan mereka sendiri dan memutuskan bahan apa yang
perlu disertakan dalam respons mereka. Soalan ujian objektif (MCQ, benar-salah,
padanan) memerlukan pelajar memilih jawapan daripada senarai kemungkinan.
(b) Respons atau jawapan yang diberikan oleh pelajar terdiri daripada satu atau lebih ayat.
Pelajar tidak menjawab dengan jawapan „ya‰ atau „tidak‰ sebaliknya perlu memberikan
respons dalam bentuk ayat. Secara teori tidak ada had untuk panjang jawapan. Walau
bagaimanapun, dalam kebanyakan kes panjangnya ditentukan terlebih dahulu oleh
tuntutan soalan dan had masa yang diperuntukkan untuk soalan itu.
(c) Tiada satu pun jawapan atau jawapan yang betul. Dalam erti kata lain, soalan itu harus
disusun supaya ia tidak meminta satu jawapan yang betul. Sebagai contoh, soalan, „Siapa
yang membunuh JWW Birch?‰ menilai ingatan atau ingatan secara verbatim dan
bukannya keupayaan untuk berfikir. Oleh itu, ia tidak boleh layak sebagai soalan esei.
Anda boleh mengubah suai soalan itu kepada „Kenal pasti siapa yang membunuh JWW
Birch dan terangkan faktor-faktor yang membawa kepada pembunuhan itu.‰ Kini, ia
adalah soalan esei yang menilai keupayaan pelajar untuk berfikir dan memberi sebab
untuk pembunuhan itu disokong dengan bukti yang relevan.
(d) Ketepatan dan kualiti jawapan atau jawapan pelajar terhadap esei mesti dinilai secara
subjektif oleh pakar dalam perkara tersebut. Sifat soalan esei adalah sedemikian rupa
sehingga hanya pakar dalam perkara yang boleh menilai sejauh mana respons (atau
jawapan) kepada esei adalah lengkap, tepat dan relevan.
Soalan esei yang baik menggalakkan pelajar berfikir secara mendalam tentang jawapan
mereka yang hanya boleh dinilai oleh seseorang yang mempunyai pengalaman dan
kepakaran yang sesuai dalam bidang kandungan. Oleh itu, kepakaran kandungan adalah
penting untuk kedua-dua penulisan dan penggredan soalan esei. Sebagai contoh, soalan
„Senaraikan tiga sebab pembukaan Pulau Pinang oleh British pada tahun 1789‰
memerlukan pelajar mengingat semula senarai set item. Orang yang menanda atau menggred esei tidak
perlu menjadi pakar subjek untuk mengetahui sama ada pelajar telah menyenaraikan tiga sebab
dengan betul asalkan senarai tiga sebab tersedia sebagai kunci jawapan. Bagi soalan „Sejauh
manakah perdagangan menjadi sebab utama pembukaan Pulau Pinang oleh British pada tahun
1789?‰ pakar mata pelajaran diperlukan untuk menilai atau menanda jawapan kepada soalan
esei ini.
Secara umumnya, terdapat dua jenis esei yang digunakan di institusi pendidikan iaitu esei kerja kursus
dan esei peperiksaan.
Esei kerja kursus bertujuan untuk menilai keupayaan pelajar untuk menyelidik topik dengan teliti
dan teliti, dan untuk mengendalikan jisim bahan. Ia menilai keupayaan mereka untuk menjawab
dengan panjang lebar apabila „diberikan tali yang cukup‰ pada topik yang dipilih. Kebimbangan
khusus ialah perkara yang pelajar sampaikan, cara dia memahaminya, cara eseinya disusun
dan nilai yang dia letakkan pada pelbagai aspek topik. Esei kerja kursus ialah respons bertulis
dan pelajar diharapkan, sebahagian besarnya, menggunakan perkataan mereka sendiri dan
menyampaikan idea mereka dengan jelas dan meyakinkan.
AKTIVITI 5.1
Pilih beberapa soalan esei yang telah digunakan dalam ujian atau peperiksaan.
Sejauh manakah soalan-soalan ini memenuhi kriteria soalan esei
seperti yang ditakrifkan oleh Stalnaker (1951) dan dihuraikan oleh Reiner, Bothell,
Sudweeks dan Wood (2002)?
Kongsi jawapan anda dengan rakan kursus anda dalam forum dalam talian
myINSPIRE.
(a) Soalan esei menyediakan cara yang berkesan untuk menilai pembelajaran kompleks Ia
hasil . membolehkan penilaian keupayaan pelajar untuk mensintesis idea,
menyusun dan menyatakan idea, dan menilai nilai idea. Kebolehan ini tidak boleh
dinilai secara berkesan secara langsung dengan item ujian kertas dan pensel yang lain.
(b) Soalan esei membolehkan pelajar menunjukkan penaakulan mereka. Soalan esei bukan
sahaja membenarkan pelajar membentangkan jawapan kepada soalan tetapi juga
menjelaskan bagaimana mereka sampai pada kesimpulan mereka. Ini membolehkan guru
mendapatkan pandangan tentang cara pelajar melihat dan menyelesaikan masalah.
Dengan pandangan sedemikian, guru dapat mengesan masalah yang mungkin dihadapi
oleh pelajar dengan proses penaakulan mereka dan membantu mereka mengatasi masalah tersebut.
(c) Soalan esei memberikan pengalaman yang sahih. „Membina respons‰ lebih dekat dengan
kehidupan sebenar daripada memilih respons (seperti dalam kes ujian objektif).
Penyelesaian masalah dan membuat keputusan adalah kecekapan hidup penting yang
memerlukan keupayaan untuk membina penyelesaian atau keputusan daripada memilih
penyelesaian atau keputusan daripada satu set kemungkinan yang terhad. Dalam persekitaran
kerja, tidak mungkin majikan akan memberikan senarai „empat pilihan‰ untuk dipilih oleh pekerja
apabila diminta menyelesaikan masalah! Dalam kebanyakan kes, pekerja akan dikehendaki
membina respons. Oleh itu, item esei lebih dekat dengan kehidupan sebenar daripada soalan
ujian objektif kerana dalam kehidupan sebenar pelajar biasanya membina respons, bukan
memilihnya.
SOALAN OBJEKTIF
Soalan esei harus berusaha untuk kemahiran berfikir aras tinggi.
Keputusan sama ada untuk menggunakan soalan esei atau soalan objektif dalam peperiksaan boleh
menjadi masalah bagi sesetengah pendidik. Dalam keadaan sedemikian seseorang itu perlu kembali
kepada objektif penilaian. Apakah hasil pembelajaran yang anda ingin capai?
Soalan esei biasanya sesuai untuk tujuan berikut:
(b) Untuk menilai kemahiran berfikir yang memerlukan lebih daripada mengingat kembali maklumat
secara verbatim dengan mencabar pelajar untuk menaakul pengetahuan mereka.
Adalah mencabar untuk menulis item ujian untuk memanfaatkan pemikiran aras tinggi. Walau
bagaimanapun, pemahaman pelajar tentang kandungan subjek dan banyak lagi kemahiran berfikir aras
tinggi yang lain juga boleh dinilai melalui item objektif. Apabila ragu-ragu sama ada hendak menggunakan
soalan esei atau soalan objektif, ingatlah bahawa soalan esei digunakan untuk menilai keupayaan
pelajar untuk membina.
daripada memilih jawapan.
Untuk menentukan jenis ujian (esei atau objektif) yang hendak digunakan, adalah berguna untuk anda
memeriksa kata kerja yang paling menggambarkan keupayaan yang dikehendaki untuk dinilai. Kami
telah membincangkan kata kerja ini dalam Topik 2. Kata kerja ini menunjukkan apa yang pelajar dijangka
lakukan dan bagaimana mereka harus bertindak balas. Kata kerja ini berfungsi untuk menyalurkan dan
memfokuskan respons pelajar terhadap pelaksanaan tugasan tertentu. Beberapa kata kerja jelas
menunjukkan bahawa pelajar perlu membina daripada memilih jawapan mereka (contohnya, untuk menerangkan).
Kata kerja lain menunjukkan bahawa hasil pembelajaran yang dimaksudkan tertumpu pada keupayaan
pelajar untuk mengingat maklumat (contohnya, untuk menyenaraikan). Mungkin, ingatan paling baik
dinilai melalui item yang dijaringkan secara objektif. Kata kerja yang menguji pemahaman tentang subjek
kandungan atau bentuk lain pemikiran aras tinggi tetapi tidak menyatakan sama ada pelajar membina
atau memilih respons (contohnya, untuk mentafsir) boleh dinilai sama ada dengan soalan esei atau item
objektif.
AKTIVITI 5.2
Antara senarai kata kerja di atas yang manakah paling baik dinilai oleh soalan esei atau
ujian objektif atau kedua-duanya?
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
(a) Satu tujuan ujian adalah untuk menilai penguasaan pelajar terhadap perkara tersebut.
Dalam kebanyakan kes, adalah tidak mungkin untuk menilai penguasaan pelajar terhadap domain
subjek yang lengkap dengan hanya beberapa soalan. Oleh kerana masa yang diambil untuk
pelajar menjawab soalan esei dan untuk penanda untuk menandakan jawapan pelajar, bilangan
soalan esei yang boleh dimasukkan dalam ujian adalah terhad. Oleh itu, menggunakan soalan
esei akan mengehadkan sejauh mana ujian mewakili domain subjek, dengan itu mengurangkan
kesahan kandungan. Sebagai contoh, ujian 80 soalan aneka pilihan kemungkinan besar akan
merangkumi lebih banyak domain kandungan daripada ujian 3 atau 4 soalan esei.
.
(b) Soalan esei mempunyai had kebolehpercayaanSementara soalan esei membenarkan pelajar sedikit
fleksibiliti dalam merumuskan respons mereka, kebolehpercayaan pemarkahan atau penggredan
dipersoalkan. Penanda atau penggred yang berbeza mungkin berbeza dalam pemarkahan atau
penggredan bagi respons yang sama atau serupa (kebolehpercayaan antara penjaring) dan satu
penanda boleh berbeza dengan ketara dalam ketekalan pemarkahan atau penggredannya
merentas soalan bergantung pada banyak faktor (kebolehpercayaan intra-skor). Oleh itu, jawapan
esei dengan kualiti yang sama mungkin menerima markah yang berbeza. Ciri-ciri pelajar, panjang
dan kebolehbacaan respons dan keutamaan peribadi penanda atau penggred berkenaan dengan
kandungan dan struktur respons adalah beberapa faktor yang boleh membawa kepada
pemarkahan atau penggredan yang tidak boleh dipercayai.
(c) Soalan esei memerlukan lebih masa untuk menandakan respons pelajar. Guru perlu
meluangkan banyak masa untuk membaca dan menandakan jawapan pelajar
terhadap soalan esei. Sebaliknya, agak sedikit atau tiada masa yang diperlukan oleh
guru untuk menskor item ujian objektif seperti item aneka pilihan dan latihan padanan.
(d) Seperti yang dinyatakan sebelum ini, salah satu kekuatan soalan esei ialah ia
memberikan pelajar pengalaman autentik kerana pelajar dicabar untuk membina
dan bukannya memilih jawapan mereka. Sejauh manakah masa singkat yang
diberikan mempengaruhi tindak balas pelajar? Pelajar mempunyai masa yang agak
sedikit untuk membina respons mereka dan ia tidak membenarkan mereka memberi
perhatian yang sewajarnya kepada proses yang kompleks untuk menyusun, menulis,
dan menyemak respons mereka. Malah, dalam menjawab soalan esei, pelajar
menggunakan proses penulisan yang agak berbeza daripada proses biasa yang
menghasilkan penulisan yang cemerlang (seperti draf, menyemak, menyemak dan
menilai). Di samping itu, pelajar biasanya tidak mempunyai sumber untuk membantu
penulisan mereka semasa menjawab soalan esei (seperti kamus dan tesaurus). Had
ini mungkin mengimbangi apa jua kelebihan yang diperoleh daripada fakta bahawa
respons kepada soalan esei adalah lebih sahih daripada respons kepada item aneka pilihan.
(a) Mengikut Sifat Mereka Soalan Esei Menilai Pemikiran Aras Tinggi (HOT)
Sama ada item esei menilai HOT bergantung pada reka bentuk soalan dan cara
jawapan pelajar dijaringkan. Soalan esei tidak secara automatik menilai kemahiran
berfikir aras tinggi (KBAT). Adalah mungkin untuk menulis soalan esei yang hanya
menilai ingatan. Selain itu, jika seorang guru mereka bentuk soalan esei yang
bertujuan untuk menilai HOT tetapi kemudian menskor respons pelajar dalam cara
yang hanya memberi ganjaran kepada keupayaan mengingat, ini bermakna guru
tidak menilai HOT. Guru mesti terlatih untuk mereka bentuk dan menulis item KBAT.
(d) Soalan Esei Memberi Manfaat kepada Semua Pelajar dengan Menekankan Kepentingan
Kemahiran Komunikasi Bertulis
Komunikasi bertulis adalah kecekapan hidup yang diperlukan untuk prestasi yang
berkesan dan berjaya dalam banyak kerjaya. Soalan esei mencabar pelajar untuk
mengatur dan menyatakan perkara dan penyelesaian masalah dengan perkataan mereka
sendiri, dengan itu memberi mereka peluang untuk mempraktikkan kemahiran komunikasi
bertulis yang akan membantu mereka dalam tanggungjawab vokasional masa depan.
Pada masa yang sama, tumpuan kepada kemahiran komunikasi bertulis juga merupakan
kelemahan yang serius bagi pelajar yang mempunyai kemahiran menulis marginal tetapi
mengetahui perkara yang dinilai. Bagi pelajar yang berpengetahuan dalam mata pelajaran
tetapi memperoleh markah rendah kerana ketidakupayaan mereka untuk menulis dengan
baik, kesahan markah ujian terjejas.
AKTIVITI 5.3
2. Bandingkan dua soalan esei berikut dan tentukan yang mana satu
menilai kemahiran berfikir aras tinggi. Bincangkan jawapan anda dengan
rakan kursus anda.
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
Berikut ialah garis panduan khusus yang boleh membantu anda menambah baik soalan esei sedia
ada atau mencipta soalan baharu:
(a) Tentukan Dengan Jelas Hasil Pembelajaran Yang Diinginkan untuk Ditaksir oleh
soalan
Mengetahui hasil pembelajaran yang dimaksudkan adalah penting untuk mereka bentuk
soalan esei. Dalam menentukan hasil pembelajaran yang dimaksudkan, guru menjelaskan
prestasi yang sepatutnya dapat ditunjukkan oleh pelajar hasil daripada apa yang telah
mereka pelajari. Hasil pembelajaran yang dimaksudkan biasanya bermula dengan kata
kerja yang menerangkan tingkah laku, tindakan atau hasil yang boleh diperhatikan yang
harus ditunjukkan oleh pelajar. Tumpuan adalah pada perkara yang pelajar sepatutnya boleh lakukan dan
bukan pada proses pembelajaran atau pengajaran. Menyemak senarai kata kerja boleh
membantu untuk menjelaskan keupayaan yang perlu ditunjukkan oleh pelajar dan untuk
mentakrifkan dengan jelas hasil pembelajaran yang ingin dinilai (rujuk Subtopik 5.8).
(b) Elakkan Menggunakan Soalan Esei untuk Hasil Pembelajaran yang Diniatkan yang Boleh
Ditaksir Lebih Baik dengan Jenis Penilaian Lain Beberapa jenis hasil pembelajaran boleh
dinilai dengan lebih cekap dan lebih dipercayai dengan ujian objektif berbanding dengan
soalan esei. Memandangkan soalan esei mencontohi julat kandungan perkara yang terhad,
memakan masa yang lebih lama untuk menskor dan melibatkan subjektiviti yang lebih besar
dalam pemarkahan, penggunaan soalan esei harus dikhaskan untuk hasil pembelajaran
yang tidak boleh dinilai dengan lebih baik melalui kaedah lain.
Sebagai contoh:
Hasil pembelajaran: Untuk dapat membezakan tabiat pembiakan burung dan amfibia
Soalan esei: Apakah perbezaan ciri bertelur antara burung dan amfibia?
Nota: Hasil pembelajaran ini boleh dinilai dengan lebih baik dengan menggunakan objektif
ujian.
burung amfibia
A Bertelur beberapa biji pada satu masa Bertelur banyak pada satu masa
B Bertelur Melahirkan
(i) Masalah tindak balas pelajar yang mengandungi idea yang tidak dimaksudkan untuk
dinilai; dan
(ii) Masalah subjektiviti yang melampau semasa menskor jawapan pelajar atau
maklum balas.
Walaupun lebih banyak struktur membantu mengelakkan masalah ini, berapa banyak dan jenis struktur
dan fokus yang perlu disediakan adalah bergantung kepada hasil pembelajaran yang dimaksudkan yang
akan dinilai oleh soalan esei. Proses menulis soalan esei yang berkesan melibatkan penentuan tugas dan
mengehadkan skop isi dalam usaha untuk mencipta soalan berkesan yang sejajar dengan hasil
pembelajaran yang ingin dinilai (diilustrasikan dalam Rajah 5.1).
Rajah 5.1: Penjajaran antara kandungan, aktiviti pembelajaran dan tugas penilaian
Sumber: Phillips, Ansary Ahmed & Kuldip Kaur (2005)
Penjajaran yang ditunjukkan dalam Rajah 5.1 adalah mutlak diperlukan untuk mendapatkan respons pelajar yang
boleh diterima sebagai bukti bahawa pelajar telah mencapai hasil pembelajaran yang diharapkan. Oleh itu, soalan
esei mesti ditulis dengan teliti dan bernas sedemikian rupa sehingga ia menimbulkan respons pelajar yang
memberikan guru bukti yang sah dan boleh dipercayai tentang pencapaian pelajar terhadap hasil pembelajaran
yang diharapkan. Kegagalan untuk menetapkan had yang mencukupi dan berkesan untuk jawapan pelajar kepada
soalan esei boleh menyebabkan pelajar menetapkan sempadan mereka sendiri untuk respons mereka. Ini
bermakna bahawa pelajar mungkin memberikan jawapan yang berada di luar tugasan yang dimaksudkan atau
menangani hanya sebahagian daripada tugasan yang dimaksudkan. Apabila ini berlaku, guru ditinggalkan dengan
maklumat yang tidak boleh dipercayai dan tidak sah tentang pencapaian pelajar terhadap hasil pembelajaran
yang dimaksudkan. Selain itu, tiada asas untuk menanda atau menggred jawapan pelajar. Oleh itu, adalah
menjadi tanggungjawab guru untuk menulis soalan esei dengan cara yang memberikan pelajar sempadan yang
jelas untuk jawapan atau respons mereka.
Sebagai contoh:
Kata kerja ialah „evaluate‰ iaitu tugas yang sepatutnya dilakukan oleh pelajar. Skop persoalan
ialah kesan Revolusi Perindustrian ke atas England. Sangat sedikit bimbingan yang diberikan
kepada pelajar tentang tugas menilai dan skop tugas. Seorang pelajar yang membaca soalan
mungkin bertanya:
(a) Kesan terhadap apakah di England? Ekonomi? Perdagangan Luar Negeri? Sekumpulan orang
tertentu? [Skopnya tidak jelas].
(b) Menilai berdasarkan kriteria apa? Kepentingan revolusi? Kualiti hidup di England? Kemajuan
dalam kemajuan teknologi? [Tugas tidak jelas].
(c) Apakah sebenarnya yang anda mahu saya lakukan dalam penilaian saya? [Tugasnya tidak
jelas]
Soalan yang dipertingkatkan mengehadkan tugas untuk pelajar dengan menyatakan unit
masyarakat tertentu di England yang terjejas oleh Revolusi Perindustrian (keluarga). Tugas itu
juga dihadkan dengan memberi pelajar kriteria untuk menilai kesan Revolusi Perindustrian (sama
ada keluarga mampu menyediakan pendidikan anak-anak mereka atau tidak). Pelajar lebih jelas
tentang apa yang perlu dilakukan untuk „menilai.‰ Mereka perlu menerangkan bagaimana
keluarga telah berubah dan menilai sama ada perubahan itu adalah peningkatan untuk anak-anak
mereka.
1. Bilakah anda akan membuat keputusan untuk menggunakan item objektif dan bukannya item
soalan esei untuk menilai pembelajaran?
Satu lagi elemen penting ialah mengelak daripada menggunakan soalan tidak tentu. Sesuatu
soalan adalah tidak tentu jika ia sangat tidak berstruktur sehingga pelajar boleh mentakrifkan
semula masalah dan menumpukan pada beberapa aspek yang mereka sudah biasa atau jika
pakar dalam subjek tidak bersetuju bahawa satu jawapan adalah lebih baik daripada yang lain.
Salah satu cara untuk mengelakkan soalan tidak tentu adalah dengan menjauhi perbendaharaan
kata yang samar-samar. Sebagai contoh, guru hendaklah mengelak daripada menggunakan
kata kerja „bincang‰ dalam soalan esei. Kata kerja ini terlalu luas dan kabur.
Selain itu, guru juga harus mengelak daripada memasukkan kosa kata yang terlalu maju untuk
pelajar.
(e) Nyatakan Anggaran Had Masa dan Markah Yang Diperuntukkan bagi setiap Soalan Menentukan
anggaran had masa membantu pelajar memperuntukkan masa mereka dalam menjawab
beberapa soalan esei. Tanpa garis panduan sedemikian, pelajar mungkin bingung tentang
berapa banyak masa yang perlu diluangkan untuk soalan. Apabila memutuskan garis panduan
untuk berapa banyak masa yang perlu dibelanjakan untuk soalan, ingatkan pelajar yang lebih
perlahan dan pelajar yang mempunyai ketidakupayaan tertentu. Di samping itu, pastikan
bahawa pelajar boleh dijangka secara realistik untuk memberikan jawapan yang mencukupi
dalam masa yang diberikan atau yang dicadangkan. Begitu juga, nyatakan markah yang
diperuntukkan untuk setiap soalan supaya pelajar boleh memutuskan berapa banyak yang
mereka perlu tulis untuk soalan itu.
(f) Gunakan Beberapa Soalan Esei Relatif Pendek Daripada Satu Esei Panjang
Soalan
Hanya bilangan soalan esei yang sangat terhad boleh dimasukkan ke dalam ujian kerana
masa yang diambil untuk pelajar menjawabnya dan masa yang diambil oleh guru untuk menilai
jawapan pelajar. Ini mewujudkan cabaran berkenaan dengan mereka bentuk soalan esei yang
sah. Soalan esei yang lebih pendek adalah lebih sesuai untuk menilai kedalaman pembelajaran
pelajar dalam sesuatu mata pelajaran manakala soalan esei yang lebih panjang lebih sesuai
untuk menilai keluasan pembelajaran pelajar dalam sesuatu mata pelajaran. Oleh itu, terdapat
pertukaran apabila memilih antara beberapa soalan esei pendek dan satu soalan esei panjang.
Fokus pada
(i) Pelajar boleh membuang masa membuat keputusan tentang sesuatu pilihan; dan
(ii) Sesetengah soalan mungkin lebih sukar yang boleh menjadikan penilaian perbandingan
kebolehan pelajar tidak adil.
Salah satu cara untuk menulis soalan esei HOT adalah untuk membentangkan pelajar
dengan situasi yang belum pernah mereka temui sebelum ini supaya mereka mesti
menaakul dengan pengetahuan mereka dan memberikan penilaian yang sahih tentang
pemikiran kompleks. Sebagai contoh, kemukakan sesuatu dalam bentuk teks pengenalan,
visual, senario, bahan sumber atau beberapa masalah untuk difikirkan oleh pelajar.
Kelebihan mengemukakan situasi masalah tertentu yang belum pernah dihadapi sebelum
ini ialah pelajar belajar untuk menggunakan pemikiran mereka dalam kehidupan sebenar.
konteks.
Guru tidak seharusnya menuntut kepakaran kandungan yang tidak munasabah di pihak
pelajar.
Langkah berikut boleh membantu anda menambah baik item esei sebelum dan
selepas anda mentadbirkannya kepada pelajar anda.
• Minta Rakan Sekerja Yang Berpengetahuan Mengkaji Secara Kritis Soalan Esei,
Jawapan Model dan Hasil Pembelajaran yang Diniatkan untuk Semak
Penyelarasan Sebelum mentadbir soalan esei dalam ujian, minta orang yang
berpengetahuan dalam subjek untuk menyemak soalan esei secara kritis,
jawapan model dan hasil pembelajaran yang dimaksudkan untuk menentukan
sejauh mana ia sejajar antara satu sama lain.
1. Mengapakah anda perlu menyatakan masa yang akan diperuntukkan bagi setiap soalan?
4. Apakah yang perlu anda lakukan sebelum dan selepas mentadbir ujian?
Menggunakan senarai yang dicadangkan oleh Moss and Holder (1988) dan Anderson dan Krathwohl
(2001), Reiner, Bothell, Sudweeks and Wood (2002) mencadangkan senarai kata kerja berikut yang
menerangkan tugas mental yang perlu dilakukan (rujuk Jadual 5.1). Takrifan menentukan proses pemikiran
yang mesti dilakukan oleh seseorang untuk menyelesaikan tugas mental. Ambil perhatian bahawa senarai
ini tidak lengkap dan contoh tempatan telah diperkenalkan untuk menggambarkan tugas mental yang
diperlukan untuk setiap soalan esei.
Jadual 5.1: Definisi Kata Kerja dan Contoh Tugas Mental yang Perlu Dilaksanakan
Kata kerja
Definisi dan Contoh
Menganalisis • Pecahkan bahan kepada bahagian-bahagian konstituennya dan tentukan bagaimana bahagian-
bahagian itu berkaitan antara satu sama lain dan dengan struktur atau tujuan keseluruhan.
• Contoh: Cerakinkan maksud baris „Dia ternampak seekor burung gagak mati, dalam longkang,
berhampiran pejabat pos‰ dalam sajak. Gagak Mati .
Mohon • Tentukan abstraksi (konsep, prinsip, peraturan, undang-undang, teori dan generalisasi) yang
relevan dalam situasi masalah. • Contoh: Mengaplikasikan prinsip penawaran dan
permintaan untuk menjelaskan mengapa indeks harga pengguna (IHP) di Malaysia telah
meningkat sejak tiga bulan lalu.
Atribut • Tentukan sudut pandangan, berat sebelah, nilai atau niat yang mendasari bahan yang
dibentangkan. • Contoh: Tentukan sudut pandangan pengarang dalam rencana
atau unsur. • Contoh: Karang satu rancangan yang berkesan untuk menyelesaikan masalah
banjir di Kuala Lumpur.
Bezakan sumbangan Tun Hussein Onn dan Tun Abdul Razak Hussein terhadap kestabilan
politik Malaysia.
Buat • Letakkan elemen bersama-sama untuk membentuk keseluruhan yang koheren atau
berfungsi, menyusun semula elemen menjadi corak atau struktur baharu. • Contoh: Cipta
Kritikan • Mengesan konsistensi dan ketidakkonsistenan antara produk dan kriteria luaran yang
berkaitan; mengesan kesesuaian prosedur untuk masalah yang diberikan. • Contoh:
Berdasarkan pertimbangan anda, antara dua kaedah yang manakah merupakan cara
Pertahankan
• Membangunkan dan mengemukakan hujah untuk menyokong cadangan, untuk mengekalkan
atau menyemak dasar, program atau mencadangkan tindakan. • Contoh: Mempertahankan
takrifkan • Memberi maksud perkataan atau konsep; letakkannya dalam kelas di mana ia berada;
membezakannya daripada item lain dalam kelas yang sama.
Contoh: Reka satu eksperimen untuk membuktikan bahawa 21 peratus udara terdiri daripada
oksigen.
Membangunkan • Membawa ke keadaan yang lebih maju, berkesan atau boleh digunakan;
menghasilkan. • Contoh: Bina soalan esei dengan menambah baik soalan yang kurang
soalan esei yang berkesan.
Membezakan • Membezakan bahagian yang relevan daripada bahagian yang tidak berkaitan atau penting daripada
bahagian yang tidak penting dalam bahan yang dibentangkan.
Terangkan • Jelaskan sebab atau sebab sesuatu; membina model sebab-akibat sistem; beritahu „bagaimana‰
lakukan; memberitahu maksud.
nilaikan • Membuat pertimbangan berdasarkan kriteria dan piawaian; menentukan kepentingan, nilai, kualiti
atau kaitan; berikan perkara yang baik dan yang buruk; mengenal pasti dan menghuraikan
kelebihan dan batasan. • Contoh: Nilaikan sumbangan cip mikro dalam telekomunikasi.
Kenal pasti • Mengiktiraf sebagai orang atau benda tertentu. • Contoh: Mengenal
Gambarkan • Gunakan gambar perkataan, rajah, carta atau contoh konkrit untuk menjelaskan
satu titik.
Buat kesimpulan
• Membuat kesimpulan yang logik daripada maklumat yang dikemukakan. • Contoh:
Mewajarkan • Tunjukkan alasan yang baik untuk; berikan bukti anda; kemukakan fakta untuk menyokong
pendirian anda.
Menjangkakan
• Tahu atau beritahu terlebih dahulu dengan ketepatan pengiraan, pengetahuan atau
inferens yang bijak daripada fakta atau pengalaman tentang apa yang akan berlaku.
Mengenali • Cari pengetahuan dalam ingatan jangka panjang yang konsisten dengan bahan yang
dibentangkan. • Contoh: Menyedari peristiwa penting yang berlaku dalam perjalanan
Ingat kembali
• Mendapat semula pengetahuan yang berkaitan daripada ingatan
jangka panjang. • Contoh: Mengimbas kembali tarikh peristiwa penting dalam sejarah Islam.
Jejak • Ikuti kursus; ikut jejak; memberi penerangan tentang kemajuan. • Contoh: Mengesan
AKTIVITI 5.4
1. Pilih beberapa soalan esei dalam bidang subjek anda dan periksa
sama ada kata kerja yang digunakan adalah serupa dengan senarai dalam Jadual 5.1. Adakah awak
fikirkan tugasan yang diperlukan oleh kata kerja yang digunakan adalah sesuai?
3. Adakah guru dapat menerangkan kepada pelajar tugas-tugas yang diperlukan oleh ini
kata kerja?
Wajarkan semua jawapan anda kepada rakan kursus anda dalam forum dalam talian myINSPIRE.
1. Pilih beberapa soalan esei dalam bidang subjek anda dan periksa
sama ada kata kerja yang digunakan adalah serupa dengan senarai dalam Jadual 5.1. Adakah awak
fikirkan tugasan yang diperlukan oleh kata kerja yang digunakan adalah sesuai?
3. Adakah guru dapat menerangkan kepada pelajar tugas-tugas yang diperlukan oleh ini
kata kerja?
Bolehkah item itu dinilai dengan lebih baik dengan jenis penilaian yang berbeza?
Adakah panjang soalan esei itu sesuai atau perlu dipecahkan kepada soalan esei pendek?
Adakah soalan esei mengandungi tugasan yang jelas dan skop yang ditetapkan?
Adakah anda mempunyai seseorang yang berpengetahuan dalam subjek untuk menyemak
soalan?
Dua bentuk panduan pemarkahan yang paling biasa digunakan ialah kaedah analitik dan holistik.
Contohnya:
Jelaskan lima faktor yang menentukan lokasi sesebuah kilang pembuatan.
1. Pengenalan mata
lokasi) • Contoh 1
3. Buruh
Contoh 1
Contoh 1
5. Sistem pengangkutan
• Penerangan (akses ke pelabuhan, penduduk) • 3
Contoh 1
6. Kemahiran keusahawanan
• Penerangan (jenis kemahiran) • 3
Contoh 1
JUMLAH 25
Kenal pasti terlebih dahulu apa yang akan bernilai mata dan berapa banyak mata yang tersedia untuk
setiap soalan. Pastikan pelajar menyedari perkara ini supaya mereka tidak memberi lebih (atau kurang)
daripada yang diperlukan dan mereka tahu dengan tepat apa yang anda cari. Jika pelajar menghasilkan
contoh yang tidak dijangka tetapi betul, berikan mereka mata dengan segera dan tambahkan titik itu
pada kunci jawapan anda supaya pelajar seterusnya juga akan mendapat mata.
Anda boleh membangunkan penerangan tentang jenis respons yang akan menggambarkan setiap
kategori sebelum anda memulakan dan mencuba versi draf ini menggunakan beberapa kertas sebenar.
Selepas membaca dan mengkategorikan semua kertas kerja, adalah idea yang baik untuk menyemak
semula kertas dalam kategori untuk melihat sama ada ia cukup serupa dalam kualiti untuk menerima
mata atau gred yang sama. Mungkin lebih cepat untuk membaca esei secara holistik dan hanya
memberikan markah atau gred keseluruhan tetapi pelajar tidak menerima banyak maklum balas tentang
kekuatan dan kelemahan mereka. Sesetengah pengajar yang menggunakan pemarkahan holistik juga
menulis ulasan ringkas pada setiap kertas untuk menunjukkan satu atau dua kekuatan dan/atau
kelemahan supaya pelajar akan mempunyai idea yang lebih baik tentang sebab respons mereka
menerima skor sedemikian.
Tahap
Persembahan Umum Penaakulan, Hujah
Pencapaian
Tiada jawapan
(0 mata)
AKTIVITI 5.5
Kongsi jawapan anda dengan rakan kursus anda dalam forum dalam talian myINSPIRE.
Akhir sekali sebelum kita mengakhiri topik, mari kita lihat beberapa cadangan untuk menanda atau
menskor esei:
(a) Gred kertas secara tanpa nama. Ini akan membantu mengawal pengaruh kita
jangkaan mengenai pelajar yang dinilai.
(b) Baca dan skor jawapan untuk satu soalan sebelum pergi ke soalan seterusnya. Dalam erti kata
lain, skor semua jawapan pelajar kepada Soalan 1 sebelum melihat Soalan 2. Ini membantu
untuk mengekalkan satu kerangka rujukan dan satu set kriteria dalam fikiran sepanjang semua
kertas, yang juga akan menghasilkan penggredan yang lebih konsisten. Ia juga menghalang
tanggapan yang kita bentuk semasa membaca satu soalan daripada dibawa ke pembacaan
jawapan pelajar seterusnya. Jika pelajar tidak melakukan kerja yang baik pada soalan pertama,
sebagai contoh, kami mungkin membenarkan tanggapan ini mempengaruhi penilaian kami
terhadap jawapan kedua pelajar. Walau bagaimanapun, jika kertas pelajar lain datang di antara,
kita kurang berkemungkinan dipengaruhi oleh tanggapan asal.
(c) Jika boleh, cuba gred semua jawapan kepada satu soalan tertentu tanpa gangguan. Piawaian
kami mungkin berbeza dari pagi ke malam atau dari satu hari ke hari berikutnya.
(d) Kocok kertas selepas setiap item dijaringkan dalam semua kertas.
Menukar susunan mengurangkan kesan konteks dan kemungkinan skor pelajar adalah hasil
daripada lokasi kertas berhubung dengan kertas lain. Contohnya, jika kerja „B‰ RakeshÊs
sentiasa diikuti oleh kerja „A‰ JamalÊs, maka ia mungkin kelihatan lebih seperti kerja „C‰ dan
grednya akan lebih rendah berbanding jika kertasnya berada di tempat lain dalam timbunan.
(e) Tentukan terlebih dahulu bagaimana anda akan mengendalikan faktor luar dan konsisten
dalam menggunakan peraturan. Pelajar harus dimaklumkan tentang cara anda menangani
perkara seperti perkataan yang salah eja, kekemasan, tulisan tangan, tatabahasa dan
seterusnya.
(f) Berwaspada terhadap gertakan. Sesetengah pelajar yang tidak mengetahui jawapannya
boleh menulis esei yang koheren tersusun dengan baik yang mungkin mengandungi
bahan yang tidak berkaitan dengan soalan. Tentukan cara untuk menangani maklumat
yang tidak relevan atau tidak tepat yang terkandung dalam jawapan pelajar. Kita tidak
sepatutnya memberi kredit untuk bahan yang tidak berkaitan. Ia tidak adil kepada pelajar
lain yang mungkin juga lebih suka menulis mengenai topik lain tetapi sebaliknya menulis
pada soalan yang diperlukan.
(g) Tulis ulasan tentang skrip ujian pelajar. Komen guru menjadikan ujian esei sebagai
pengalaman pembelajaran yang baik untuk pelajar. Ia juga berfungsi untuk menyegarkan
ingatan anda tentang penilaian anda sekiranya pelajar mempersoalkan gred yang
diterimanya.
(h) Berhati-hati dengan susunan kertas yang ditanda kerana ia boleh memberi kesan kepada
gred yang diberikan. Penanda mungkin menjadi lebih kritikal (atau lebih lembut) selepas
membaca beberapa kertas, oleh itu kertas awal menerima markah yang lebih rendah (atau
lebih tinggi) daripada kertas dengan kualiti serupa yang dijaringkan kemudian.
(i) Apabila pelajar diarahkan untuk mengambil pendirian dalam isu kontroversi, penanda mesti
berhati-hati untuk memastikan bahawa bukti dan cara ia dipersembahkan dinilai, BUKAN
kedudukan yang diambil oleh pelajar. Jika pelajar mengambil kedudukan yang bertentangan
dengan penanda, penanda mesti menyedari kecenderungannya sendiri dalam menandakan
karangan kerana kedudukan pelajar berbeza daripada penanda.
• Esei ialah item ujian yang memerlukan respons yang dikarang oleh pemeriksa biasanya dalam
bentuk satu atau lebih ayat yang tidak ada satu pun respons atau corak respons boleh
disenaraikan sebagai betul, dan ketepatan dan kualitinya boleh dinilai secara subjektif hanya
oleh orang yang mahir atau berpengetahuan dalam perkara itu.
• Soalan esei menyediakan cara yang berkesan untuk menilai pembelajaran yang kompleks
hasil.
• Tidak mungkin dengan menggunakan beberapa soalan esei sahaja untuk menilai penguasaan
pelajar terhadap domain subjek yang lengkap.
• Soalan esei mempunyai dua elemen pembolehubah, iaitu sejauh mana tugasan distrukturkan dan
sejauh mana skop kandungan difokuskan.
• Sama ada item esei menilai pemikiran aras tinggi (HOT) bergantung pada reka bentuk soalan dan
cara jawapan pelajar dijaringkan.
• Menentukan anggaran had masa membantu pelajar memperuntukkan masa mereka dalam
menjawab beberapa soalan esei semasa ujian.
• Elakkan menggunakan soalan esei untuk hasil pembelajaran yang diharapkan yang boleh menjadi lebih baik
dinilai dengan jenis penilaian lain.
• Penandaan analitikal merupakan sistem yang paling kerap digunakan dalam peperiksaan awam
berskala besar dan juga oleh guru di dalam bilik darjah. Ciri asasnya ialah skema pemarkahan
dan markah yang diperuntukkan untuk elemen dalam jawapan.
• Pendekatan holistik untuk menskor soalan esei melibatkan membaca keseluruhan respons dan
memberikannya kepada kategori yang dikenal pasti oleh skor atau gred.
Penggredan Rubrik
Topik Sahih ÿ
Penilaian
6
HASIL PEMBELAJARAN
Pada akhir topik ini, anda seharusnya dapat:
1. Tentukan penilaian autentik;
ÿ PENGENALAN
Ramai guru menggunakan alat penilaian tradisional seperti ujian aneka pilihan dan esei untuk
menilai pelajar mereka. Sejauh manakah ujian aneka pilihan atau ujian esei ini benar-benar
menilai pemahaman dan pencapaian pelajar? Alat penilaian tradisional ini memainkan peranan
dalam penilaian hasil pelajar. Namun begitu, penilaian tidak semestinya melibatkan ujian
kertas dan pensel. Ia juga boleh menjadi projek, pemerhatian atau tugas selagi ia dapat
menunjukkan pelajar telah mempelajari bahan tersebut. Adakah alat penilaian alternatif ini
lebih berkesan daripada yang tradisional?
Sesetengah guru bilik darjah menggunakan strategi ujian yang tidak menumpukan sepenuhnya
kepada mengingat fakta. Sebaliknya, mereka meminta pelajar untuk menunjukkan kemahiran
dan konsep yang telah mereka pelajari. Guru mungkin ingin meminta pelajar menggunakan
kemahiran mereka pada tugasan dan projek tulen atau meminta pelajar menunjukkan
pengetahuan mereka dengan cara yang lebih sesuai untuk kehidupan di luar bilik darjah. Pelajar mesti
kemudian dilatih untuk melaksanakan tugas bermakna yang meniru cabaran dunia sebenar.
Dalam erti kata lain, guru-guru ini cuba menilai kebolehan pelajar dalam konteks „dunia sebenar‰.
Untuk melakukan ini, pelajar diminta untuk melaksanakan tugas seperti menerangkan peristiwa
sejarah atau menyelesaikan masalah matematik daripada memilih jawapan daripada senarai sedia.
Strategi meminta pelajar melaksanakan tugas dunia sebenar yang menunjukkan aplikasi bermakna
pengetahuan dan kemahiran penting dipanggil penilaian autentik. Penilaian autentik adalah untuk
meminta pelajar menunjukkan pengetahuan mereka dengan cara yang lebih sesuai untuk kehidupan
di luar bilik darjah.
Peningkatan prestasi pelajar dan sekolah dicapai melalui semakan keputusan yang kerap diikuti
dengan pelarasan yang disasarkan kepada kurikulum dan pengajaran.
Penilaian autentik, berbeza dengan penilaian yang lebih tradisional, menggalakkan penyepaduan
pengajaran, pembelajaran dan penilaian. Dalam model pentaksiran tradisional, pengajaran dan
pembelajaran sering dipisahkan daripada pentaksiran di mana ujian ditadbirkan selepas pengetahuan
atau kemahiran diperoleh.
Penilaian autentik biasanya merangkumi tugasan untuk pelajar lakukan dan rubrik yang mana
prestasi tugasan mereka akan dinilai. Oleh itu, melaksanakan eksperimen sains, menulis cerita dan
laporan, menyelesaikan masalah matematik yang mempunyai aplikasi dunia sebenar boleh
dianggap sebagai penilaian yang sahih.
Data pencapaian berguna boleh diperoleh melalui penilaian autentik.
Guru boleh mengajar pelajar bagaimana untuk melakukan matematik, membuat sejarah dan
melakukan sains, bukan hanya mengetahui mereka. Seterusnya, untuk menilai apa yang telah
dipelajari oleh pelajar, guru boleh meminta pelajar melaksanakan tugasan yang meniru cabaran
yang dihadapi dengan menggunakan prinsip matematik, menjalankan penyiasatan sejarah atau saintifik.
Pentaksiran bilik darjah tradisional yang direka dengan baik seperti ujian dan kuiz boleh
menentukan dengan berkesan sama ada pelajar telah memperoleh pengetahuan atau tidak.
Sebaliknya, penilaian autentik memerlukan pelajar untuk menunjukkan pemahaman dengan
melaksanakan tugas yang lebih kompleks biasanya mewakili aplikasi yang lebih bermakna.
Tugasan ini memerlukan pelajar menganalisis, mensintesis dan menggunakan apa yang
telah mereka pelajari dengan cara yang besar dan pelajar mencipta makna baharu dalam
proses itu juga. Ringkasnya, penilaian autentik membantu menjawab soalan „Sejauh
manakah anda boleh menggunakan apa yang anda tahu?‰ manakala ujian tradisional
membantu menjawab soalan „Adakah anda tahu?‰
Penilaian bilik darjah biasa atau tradisional seperti ujian aneka pilihan dan ujian jawapan
pendek adalah sama pentingnya dengan penilaian autentik. Penilaian autentik melengkapi
penilaian tradisional. Pentaksiran autentik telah mendapat penerimaan dalam kalangan guru
awal kanak-kanak dan sekolah rendah di mana penilaian tradisional mungkin tidak sesuai.
(f) Alat ICT: halaman web, video, foto, gambaran bingkai beku;
(h) Menilai: maklum balas guru-pembelajar, maklum balas rakan sebaya, pengajaran rakan sebaya; dan
(i) Tugas tidak berstruktur: tugas menyelesaikan masalah, soalan terbuka, formal
dan pemerhatian tidak formal.
tugas dunia yang memerlukan kemahiran tersebut, bukannya dengan menjawab soalan
yang bertanyakan bagaimana untuk melakukannya‰ (Ark, 2013). Pembelajaran
berasaskan projek (PBL) dan tugasan portfolio adalah contoh penilaian prestasi. Dengan
penilaian prestasi, guru memerhati pelajar semasa mereka membuat persembahan di
dalam bilik darjah dan menilai tahap kecekapan yang ditunjukkan.
Tugasan tulen berakar umbi dalam kurikulum dan guru boleh membangunkan tugasan
berdasarkan perkara yang telah berfungsi untuk mereka. Melalui proses ini, lebih banyak
tugasan berasaskan bukti seperti portfolio menjadi lebih sahih dan lebih bermakna kepada
pelajar.
(a) Aktiviti tulen mempunyai perkaitan dunia sebenar: Penilaian bertujuan untuk memberi tumpuan
kepada kesan kerja seseorang dalam konteks sebenar atau realistik.
(b) Aktiviti tulen memerlukan pelajar untuk mentakrifkan tugasan dan sub-tugas yang
diperlukan untuk menyelesaikan aktiviti: Masalah yang wujud dalam aktiviti terbuka
kepada pelbagai tafsiran dan bukannya diselesaikan dengan mudah dengan
menggunakan algoritma sedia ada.
(c) Aktiviti tulen terdiri daripada tugas yang kompleks untuk disiasat oleh pelajar dalam
tempoh masa yang berterusan: Aktiviti diselesaikan dalam hari, minggu dan bulan
berbanding minit atau jam. Mereka memerlukan pelaburan masa dan sumber intelek
yang besar.
(d) Aktiviti autentik memberi peluang kepada pelajar untuk memeriksa tugasan dari perspektif
yang berbeza, menggunakan pelbagai sumber: Penggunaan pelbagai sumber dan
bukannya bilangan rujukan yang telah dipilih yang terhad memerlukan pelajar untuk
mengesan relevan daripada maklumat yang tidak relevan.
(e) Aktiviti tulen memberi peluang untuk bekerjasama: Kerjasama adalah penting kepada
tugas, baik dalam kursus dan dunia sebenar, dan bukannya boleh dicapai oleh pelajar
individu.
(f) Aktiviti autentik memberi peluang untuk membuat refleksi: Aktiviti perlu membolehkan
pelajar membuat pilihan dan merenung pembelajaran mereka, baik secara individu
mahupun sosial.
(g) Aktiviti tulen boleh disepadukan dan diaplikasikan merentasi bidang mata pelajaran yang
berbeza dan mendahului hasil khusus domain: Aktiviti menggalakkan perspektif antara
disiplin dan membolehkan pelajar memainkan peranan yang pelbagai, dengan itu
membina kepakaran yang mantap dan bukannya pengetahuan terhad kepada satu
bidang atau domain yang jelas. .
(h) Aktiviti tulen disepadukan dengan lancar dengan penilaian: Penilaian aktiviti disepadukan
dengan lancar dengan tugas utama dalam cara yang mencerminkan penilaian dunia
sebenar dan bukannya penilaian buatan berasingan yang dialih keluar daripada sifat
tugasan.
(i) Aktiviti tulen mencipta produk yang digilap berharga dengan hak mereka sendiri dan
bukannya sebagai persediaan untuk sesuatu yang lain.
(j) Aktiviti tulen membolehkan penyelesaian bersaing dan kepelbagaian hasil: Aktiviti
membenarkan julat dan kepelbagaian hasil terbuka kepada pelbagai penyelesaian
yang bersifat asal dan bukannya satu tindak balas betul yang diperoleh melalui
penggunaan peraturan dan prosedur.
Apakah nama lain yang digunakan untuk merujuk kepada penilaian autentik? kenapa?
AKTIVITI 6.1
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
(a) Kenal pasti standard yang anda mahu pelajar capai melalui penilaian ini. Piawaian, seperti matlamat,
adalah pernyataan tentang perkara yang perlu diketahui dan boleh dicapai oleh pelajar. Piawaian
mesti boleh diperhatikan dan boleh diukur.
Guru boleh memerhati sesuatu persembahan tetapi tidak memahami. Oleh itu pernyataan seperti
„Pelajar akan memahami cara menambah nombor dua digit‰ tidak boleh diperhatikan manakala
pernyataan seperti „Pelajar akan menambah nombor dua digit dengan betul‰ boleh diperhatikan
dan boleh diukur.
(b) Pilih tugasan yang relevan untuk standard atau set standard supaya pelajar dapat menunjukkan
bagaimana mereka telah atau tidak memenuhi standard tersebut. Dalam langkah ini, guru
mungkin ingin mencari cara di mana pelajar boleh menunjukkan bagaimana mereka mampu
memenuhi standard sepenuhnya. Untuk standard seperti „Fahami cara menambah nombor dua
digit‰, tugasnya mungkin meminta pelajar menerangkan situasi, cerita atau masalah dalam
kehidupan sebenar. Guru boleh mendapatkan strategi daripada pelajar, meminta mereka untuk
menunjukkan dan menerangkan alasan mereka kepada rakan sekelas mereka. Itu mungkin
dalam bentuk persembahan multimedia yang dibangunkan oleh pelajar (secara individu atau
secara kolaboratif), menggunakan Sepuluh Bingkai dengan beberapa kaunter.
(c) Tentukan ciri-ciri prestasi yang baik untuk tugas. Ini akan memberikan maklumat berguna
mengenai sejauh mana pelajar telah memenuhi piawaian.
Untuk langkah ini, guru mengenal pasti kriteria untuk melaksanakan tugasan ini dengan baik.
Mereka mungkin menulis beberapa ciri untuk menyelesaikan tugas dengan jayanya.
(d) Cipta satu rubrik atau set garis panduan untuk diikuti oleh pelajar supaya mereka dapat menilai
kerja mereka semasa mereka melaksanakan tugasan yang diberikan.
AKTIVITI 6.2
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
Penilaian autentik membantu pelajar melihat diri mereka sebagai peserta aktif yang menjalankan
tugas yang berkaitan dan bukannya penerima pasif fakta yang tidak jelas. Ia membantu guru dengan
menggalakkan mereka untuk merenung tentang kaitan apa yang mereka ajar dan memberikan hasil
yang berguna untuk menambah baik pengajaran.
Penilaian autentik memberi tumpuan kepada proses pembelajaran, amalan pengajaran yang mantap
dan kemahiran berfikir aras tinggi serta kecekapan yang diperlukan untuk berjaya dalam dunia
sebenar. Akibatnya, mereka menawarkan kelebihan yang besar untuk pelajar yang telah terdedah
kepada mereka berbanding mereka yang tidak.
Penilaian autentik mempunyai banyak faedah, faedah utama ialah ia memastikan kejayaan
pelajar. Penilaian autentik memberi tumpuan kepada kemajuan dan bukannya mengenal
pasti kelemahan.
(a) Ia mempunyai kelebihan untuk menyediakan ibu bapa dan ahli komuniti produk yang
boleh diperhatikan secara langsung dan bukti yang boleh difahami mengenai prestasi
pelajar mereka. Kualiti kerja pelajar lebih dapat dilihat oleh orang awam berbanding
dengan pergantungan pada angka statistik abstrak;
(b) Menggunakan tugasan yang mencerminkan aktiviti bilik darjah biasa atau pembelajaran kehidupan
sebenar. Tugas-tugas tersebut adalah cara untuk menambah baik pengajaran, membolehkan guru
merancang kurikulum yang komprehensif dan berorientasikan perkembangan berdasarkan
pengetahuan mereka tentang setiap kanak-kanak;
(c) Memberi tumpuan kepada kemahiran berfikir aras tinggi seperti mengaplikasi,
menganalisis, menilai dan mencipta dalam taksonomi Bloom;
(e) Memerlukan prestasi aktif untuk menunjukkan pemahaman. Pelajar kinestetik lebih suka
terlibat dalam aktiviti. Mereka perlu mengaplikasi maklumat dan menjadikannya
sendiri dengan membina sesuatu atau mempraktikkan teknik atau kemahiran;
Rubrik adalah komponen penting dalam penilaian autentik. Ia adalah alat yang hebat untuk memastikan
penilaian yang lebih tulen terhadap kerja pelajar. Walau bagaimanapun, membuat rubrik memakan
masa pada peringkat awal tetapi bernilai pelaburan.
Kohn (2006) memerhatikan bahawa rubrik yang digunakan untuk menyeragamkan cara kita berfikir
tentang tugasan pelajar mempunyai banyak kesalahan. Pelajar yang mungkin sudah terbiasa dengan
rubrik di bilik darjah lain kini kelihatan tidak dapat berfungsi melainkan
setiap item yang diperlukan dinyatakan untuk mereka. Walau bagaimanapun, ini tidak bermakna rubrik
tersebut rosak. Selagi rubrik hanyalah salah satu daripada beberapa sumber dan tidak mendorong
arahan, ia boleh dibayangkan memainkan peranan yang membina.
Berdasarkan nilai penilaian autentik kepada hasil pelajar, kelebihan penilaian autentik mengatasi
kebimbangan ini. Sebagai contoh, sebaik sahaja garis panduan penilaian dan rubrik penggredan
dibuat, ia boleh disimpan dalam fail dan digunakan tahun demi tahun.
Tiada perkara baharu tentang metodologi penilaian autentik ini. Ia bukanlah sejenis ciptaan radikal
yang baru-baru ini direka oleh penentang ujian tradisional untuk mencabar industri ujian. Sebaliknya
ia adalah kaedah yang terbukti untuk menilai ciri-ciri manusia dan telah digunakan selama beberapa
dekad (Linquist, 1951).
Jadual 6.1 meringkaskan perbezaan utama antara yang tulen dan tradisional
penilaian.
Dicipta untuk • Pelajar diminta untuk • Ujian menawarkan cara yang direka-
kehidupan sebenar
menunjukkan kecekapan dengan reka (Contoh: pilih satu daripada
melakukan sesuatu. empat pilihan dalam MCQ) penilaian
untuk meningkatkan bilangan kali
anda boleh diminta untuk
menunjukkan kecekapan dalam
tempoh masa yang singkat.
Berstruktur guru kepada • Penilaian autentik • Apa yang seseorang pelajar boleh dan akan
berstruktur pelajar membenarkan lebih banyak demonstrasi telah disusun
pilihan dan pembinaan pelajar dengan teliti oleh orang yang
dalam menentukan apa yang membangunkan ujian.
dikemukakan sebagai bukti
kecekapan. • Perhatian pelajar akan
• Walaupun pelajar tidak boleh memilih boleh difahami tertumpu pada,
topik atau format mereka sendiri, dan terhad kepada, apa yang ada
biasanya terdapat pelbagai laluan dalam ujian.
yang boleh diterima ke arah
membina produk atau prestasi.
Bukti tidak langsung • Tawaran penilaian tulen • Bukti adalah tidak langsung
kepada bukti langsung lebih banyak bukti langsung terutamanya untuk tuntutan aplikasi
aplikasi dan pembinaan yang bermakna dalam situasi dunia
pengetahuan. • Contoh: Meminta sebenar yang kompleks.
Sumber: Diadaptasi daripada Authentic Assessment Toolbox oleh Jon Mueller di http://
jfmueller.faculty.noctrl.edu/toolbox/
Kualiti maklumat yang diperoleh melalui penggunaan senarai semak, skala penarafan dan
rubrik sangat bergantung kepada kualiti deskriptor yang dipilih untuk penilaian. Faedah
mereka juga bergantung kepada penglibatan langsung pelajar dalam penilaian dan
pemahaman tentang maklum balas yang diberikan.
(c) Menyediakan sampel kriteria untuk pelajar sebelum mengumpul dan menilai data tentang kerja
mereka merekodkan perkembangan kemahiran, strategi, sikap dan tingkah laku tertentu yang
diperlukan untuk menunjukkan pembelajaran; dan
(d) Menjelaskan keperluan pengajaran pelajar dengan membentangkan rekod pencapaian semasa.
Walau bagaimanapun, ia boleh digunakan untuk menjaringkan sebarang bentuk prestasi pelajar.
Rubrik pemarkahan telah menjadi kaedah biasa untuk menilai pelajar. Rubrik pemarkahan ialah
skema pemarkahan deskriptif yang dibangunkan oleh guru atau penilai lain untuk membimbing
analisis produk atau proses usaha pelajar (Brookhart, 1999). Sebagai alat pemarkahan, rubrik ialah
satu cara untuk menerangkan kriteria penilaian berdasarkan hasil yang diharapkan dan prestasi
pelajar. Setiap rubrik terdiri daripada satu set kriteria pemarkahan dan nilai mata yang dikaitkan
dengan kriteria ini.
Dalam kebanyakan rubrik kriteria dikelompokkan ke dalam kategori supaya guru dan pelajar boleh
mendiskriminasikan antara kategori mengikut tahap prestasi.
Rubrik telah diperkenalkan ke dalam bilik darjah hari ini untuk memberi pelajar pemahaman yang
lebih baik tentang perkara yang dinilai, kriteria gred yang berdasarkan serta piawaian produk yang
jelas dan menarik sedang ditangani.
Fokus rubrik dan panduan pemarkahan adalah untuk memantau dan menyesuaikan kemajuan dan
bukannya hanya menilai hasil akhir.
Sebagai panduan untuk perancangan, rubrik dan panduan pemarkahan memberi pelajar sasaran
kecekapan yang jelas. Dengan penilaian ini di tangan, mereka tahu rupa kualiti sebelum mereka
mula bekerja. Apabila pelajar menggunakan penilaian sedemikian secara kerap untuk menilai kerja
mereka sendiri, mereka mula menerima lebih banyak tanggungjawab untuk produk akhir.
Rubrik dan panduan pemarkahan menawarkan beberapa kelebihan untuk penilaian:
Prestasi LearnersÊ dipertingkatkan dengan menunjukkan dengan jelas cara kerja mereka dinilai dan apa
yang diharapkan;
(a) Pelajar menjadi hakim yang lebih baik terhadap kualiti kerja mereka sendiri;
(b) Pelajar mempunyai maklum balas yang lebih bermaklumat tentang kekuatan mereka dan bidang yang
memerlukan penambahbaikan;
(c) Pelajar menyedari tentang kriteria untuk digunakan dalam memberikan maklum balas rakan sebaya;
(f) Jumlah masa yang dihabiskan untuk menilai kerja pelajar dikurangkan;
Rubrik berikut ditunjukkan dalam Jadual 6.2 merangkumi bahagian penyelidikan sesuatu projek.
Jumlah
Satu rubrik mengandungi dua komponen iaitu kriteria dan tahap prestasi. Setiap rubrik mempunyai
sekurang-kurangnya dua kriteria dan sekurang-kurangnya dua tahap prestasi. Kriteria, yang merupakan
ciri prestasi yang baik pada tugasan dalam contoh ini, disenaraikan di lajur sebelah kiri dalam rubrik
(bilangan sumber, ketepatan sejarah, sumber maklumat dan bibliografi).
Rubrik juga mengandungi mekanisme untuk memberikan markah kepada setiap projek. Dalam lajur
kedua terakhir, pemberat (Wt.) diberikan untuk setiap kriteria. Pelajar boleh menerima 1, 2 atau 3 mata
untuk bilangan kriteria sumber. Walau bagaimanapun, kriteria ketepatan sejarah yang dianggap lebih
penting pada pendapat guru, ditimbang tiga kali ganda (ÿ3) lebih berat. Ini bermakna, pelajar boleh
menerima 3, 6 atau 9 mata (iaitu 1 ÿ 3, 2 ÿ 3 atau 3 ÿ 3) untuk tahap ketepatan dalam projek mereka.
Dalam contoh, „banyak ketidaktepatan sejarah‰, „boleh memberitahu dengan susah payah dari mana
maklumat itu datang‰ dan „semua maklumat berkaitan disertakan‰ adalah deskriptor.
Deskriptor membantu guru menjadi lebih tepat dan dapat membezakan antara kerja pelajar secara
konsisten. Walau bagaimanapun, bukan mudah untuk menulis deskriptor yang baik untuk setiap tahap
dan setiap kriteria.
Guru boleh menggunakan skala penilaian untuk merekod pemerhatian dan pelajar boleh
menggunakannya sebagai alat penilaian kendiri. Mengajar pelajar menggunakan perkataan deskriptif
seperti selalu, biasanya, kadangkala dan tidak pernah, membantu mereka menentukan kekuatan dan keperluan tertentu.
Skala penilaian juga menyediakan pelajar dengan maklumat untuk menetapkan matlamat dan
meningkatkan prestasi.
Skala penilaian menyenaraikan pernyataan prestasi dalam satu lajur dan julat pencapaian dalam
perkataan deskriptif, dengan atau tanpa nombor, dalam lajur lain.
Kata keterangan lebih penting daripada nombor yang sepadan. Lebih tepat dan deskriptif
perkataan untuk setiap titik skala, lebih dipercayai alat itu.
Skala penilaian yang berkesan menggunakan deskriptor dengan ukuran yang difahami dengan
jelas seperti kekerapan. Skala yang bergantung pada deskriptor subjektif untuk kualiti seperti
adil, baik atau cemerlang, adalah kurang berkesan kerana kata adjektif tunggal tidak mengandungi
maklumat yang mencukupi tentang kriteria yang ditunjukkan pada setiap titik pada skala ini.
Sebagai contoh, pernyataan prestasi yang menerangkan tingkah laku atau kualiti sebagai 1 =
lemah hingga 5 = cemerlang adalah lebih baik daripada 1 = terendah hingga 5 = tertinggi atau
hanya 1 hingga 5. Julat nombor hendaklah sama untuk semua baris dalam bahagian (seperti
semua daripada 1 hingga 5).
Julat nombor hendaklah sentiasa meningkat atau sentiasa berkurangan. Sebagai contoh, jika
nombor terakhir adalah pencapaian tertinggi dalam satu bahagian, nombor terakhir juga harus
menjadi pencapaian tertinggi dalam semua bahagian lain juga.
Rajah 6.1 ialah contoh skala penarafan yang digunakan untuk penilaian kemahiran interpersonal.
Senarai semak biasanya menawarkan format „ya‰ atau „tidak‰ berhubung dengan pelajar yang
menunjukkan kriteria tertentu. Senarai semak penilaian mengambil setiap objektif pencapaian dan
mengubahnya menjadi satu atau lebih penyataan „pembelajar boleh lakukan‰. Senarai semak
boleh digunakan untuk merekod pemerhatian individu, kumpulan atau keseluruhan kelas.
(d) Mempunyai mata tanda keluar yang menghalang pelajar daripada meneruskan tanpa kelulusan,
jika perlu;
(e) Ditulis dengan perkataan yang jelas dan terperinci untuk meminimumkan risiko
salah tafsir; dan
(f) Mempunyai ruang untuk memasukkan maklumat lain seperti nama pelajar,
tarikh, kursus, pemeriksa dan keputusan keseluruhan.
nama:
Tarikh:
Kelas
Pencapaian
barang Ya tidak Komen
Objektif
3. Apakah persamaan dan perbezaan antara rubrik, senarai semak dan skala penilaian?
AKTIVITI 6.3
2. Berikan satu contoh penilaian autentik bagi subjek yang anda ada
mengajar.
Kongsi jawapan anda dengan rakan kursus anda dalam forum dalam talian myINSPIRE.
• Strategi meminta pelajar melaksanakan tugas dunia sebenar yang menunjukkan aplikasi bermakna
pengetahuan dan kemahiran penting dipanggil autentik.
penilaian.
• Penilaian autentik kadangkala dipanggil penilaian prestasi, penilaian alternatif atau penilaian langsung.
ÿ PENGENALAN
Selain ujian objektif dan esei, terdapat jenis penilaian lain yang secara kolektif boleh
dikategorikan sebagai penilaian berasaskan prestasi. Menurut definisi yang disediakan
oleh Piawaian (AERA et al., dipetik dalam Reynold, Livingston & Willson, 2006), penilaian
prestasi memerlukan pengambil ujian untuk menyelesaikan tugas dalam konteks atau
persekitaran yang hampir menyerupai situasi kehidupan sebenar. Sebagai contoh, untuk
menilai kemahiran komunikasi lisan, penilaian mungkin memerlukan peserta ujian untuk
mengambil bahagian dalam sesi dialog kumpulan. Begitu juga, untuk menilai keupayaan
pengajaran guru pelatih, pelatih mungkin dikehendaki menjalankan pengajaran dengan
sekumpulan pelajar. Penekanan penilaian berasaskan prestasi adalah dengan melakukan,
bukan sekadar mengetahui, pada proses dan juga produk. Dalam konteks ini, ujian esei
yang digunakan untuk menilai kemahiran menulis dalam pembelajaran bahasa boleh
dianggap sebagai satu jenis penilaian prestasi. Memandangkan soalan esei telah dibincangkan lebih awal, kam
akan memberi tumpuan kepada jenis penilaian lain dalam topik ini, iaitu projek dan portfolio.
Penilaian projek yang memerlukan pelajar melaksanakan tugas praktikal untuk mengatur atau
mencipta sesuatu dengan pantas menjadi amalan biasa dalam pentaksiran berasaskan sekolah.
Portfolio, yang dianggap sebagai bentuk khusus penilaian prestasi yang berguna dalam menilai
pembelajaran pelajar dari semasa ke semasa melibatkan pengumpulan sistematik kerja pelajar
yang dihasilkan dalam tempoh masa tertentu mengikut set garis panduan tertentu (Reynold,
Livingston & Willson, 2006 ).
Secara teknikal terdapat perbezaan antara projek dan pembelajaran berasaskan projek (PBL).
Walaupun PBL turut menampilkan projek, tumpuan lebih kepada proses pembelajaran dan interaksi
pelajar-rakan-kandungan berbanding produk akhir itu sendiri. PBL hampir menyerupai kerja yang
dilakukan di dunia nyata. Senario atau simulasi adalah nyata manakala projek biasanya berdasarkan
peristiwa yang telah diselesaikan.
AKTIVITI 7.1
Lihat carta yang disediakan oleh Amy Mayer untuk perbezaan antara
projek dan pembelajaran berasaskan projek. Bincangkan penemuan anda dengan anda
rakan kursus dalam forum dalam talian myINSPIRE.
Projek adalah satu aktiviti di mana kekangan masa telah banyak dibuang dan boleh dilaksanakan
secara individu atau kumpulan dan biasanya melibatkan elemen penting kerja yang dilakukan di
rumah atau di luar sekolah (Firth & Mackintosh, 1987).
Kerja projek berakar umbi dalam pendekatan konstruktivisme yang berkembang daripada kerja ahli
psikologi dan pendidik seperti Lev Vygotsky, Jerome Bruner, Jean Piaget dan John Dewey.
Konstruktivisme memandang pembelajaran sebagai hasil pembinaan mental di mana pelajar belajar
dengan membina idea atau konsep baharu berdasarkan pengetahuan semasa dan sebelumnya.
Kebanyakan projek mempunyai ciri pentakrifan tertentu (Katz & Chard, 1989) seperti
sebagai:
(c) Kandungan bermakna kepada pelajar dan boleh diperhatikan secara langsung dalam mereka
persekitaran;
(h) Produk ketara yang boleh dikongsi dengan khalayak yang dimaksudkan;
(j) Peluang untuk pemikiran reflektif dan penilaian kendiri pelajar; dan
(k) Pelbagai jenis dan penilaian autentik (portfolio, jurnal, rubrik dan
lain).
Dalam kerja projek, keseluruhan proses kerja adalah sama pentingnya dengan hasil akhir atau produk.
Proses kerja merujuk kepada pelajar memilih bidang pengetahuan, membatasinya dan merumuskan
masalah atau mengemukakan soalan. Ia juga melibatkan pelajar menyiasat dan menerangkan apa
yang diperlukan untuk menyelesaikan masalah tertentu atau menjawab soalan khusus melalui kerja
lanjut, pengumpulan bahan dan pengetahuan.
Kerja projek dirancang supaya dapat dilaksanakan dalam masa yang ada.
Sebaik-baiknya, tugasan itu hendaklah diambil daripada bidang pengetahuan dalam kurikulum semasa.
Kerja projek ialah pengalaman pembelajaran bersepadu yang menggalakkan pelajar untuk melepaskan
diri daripada pembahagian pengetahuan dan sebaliknya melibatkan penggunaan pelbagai aspek
pengetahuan. Sebagai contoh, membuat sesuatu objek bukan sahaja memerlukan kemahiran
kraftangan tetapi juga pengetahuan tentang bahan, kaedah kerja dan kegunaan objek tersebut.
Sokongan teknologi juga akan meningkatkan pembelajaran pelajar. Kemahiran berfikir adalah penting
untuk kerja projek.
Begitu juga, menulis laporan projek memerlukan kemahiran menulis yang dipelajari dalam bilik darjah
bahasa dan mengaplikasikannya semasa menganalisis dan membuat kesimpulan untuk projek sains.
Secara umumnya, terdapat dua jenis projek iaitu projek berasaskan penyelidikan dan projek berasaskan
produk.
(a) Projek berasaskan penyelidikan lebih bersifat teori dan mungkin terdiri daripada
mengemukakan soalan, merumuskan masalah atau menubuhkan beberapa hipotesis.
Untuk menjawab soalan, menyelesaikan masalah atau mengesahkan andaian,
maklumat mesti dicari, dinilai dan digunakan. Maklumat ini boleh sama ada hasil
daripada penyiasatan pelajar sendiri atau diperoleh daripada sumber awam tanpa
menjadi pembiakan tulen. Kerja projek sedemikian biasanya dibentangkan sebagai
laporan penyelidikan.
(b) Projek berasaskan produk ialah penghasilan objek konkrit, perkhidmatan, persembahan
tarian, filem, pameran, drama, program komputer dan sebagainya.
Dalam kerja projek, pelajar melibatkan diri secara aktif sebagai penyelesai masalah,
pembuat keputusan, penyiasat, pendokumentasi dan penyelidik. Kerja projek memberi
peluang kepada pelajar untuk meneroka pendekatan yang berbeza untuk menyelesaikan
masalah. Dalam kerja projek, seorang guru mengikuti, membincangkan dan menilai kerja
dalam semua fasa yang berbeza. Guru adalah penyelia pelajar. Jika kerja melibatkan
kumpulan, input daripada pelajar yang berbeza harus datang dari dalam matlamat program
masing-masing. Paling penting, pelajar harus mencari projek yang menyeronokkan,
bermotivasi dan mencabar kerana mereka memainkan peranan aktif dalam keseluruhan
proses. Pemilihan projek boleh ditentukan oleh guru atau pilihan boleh diserahkan kepada
pelajar, mungkin dengan kelulusan guru (Katz, 1994). Apa yang penting ialah pelajar
mengambil pemilikan projek mereka.
Terdapat banyak jenis projek yang berkesan. Berikut adalah beberapa idea projek:
(e) Membangunkan surat berita, blog atau laman web mengenai isu khusus yang berkaitan dengan
sekolah atau komuniti (seperti keselamatan sekolah, kitar semula dan bagaimana perniagaan
boleh menjimatkan tenaga dan mengurangkan sisa);
(f) Menyusun sejarah lisan kawasan setempat dengan menemu bual penatua masyarakat;
(h) Buat dokumen pada CD pelajar yang lulus dari sekolah rendah atau menengah tempatan;
(i) Buat panduan hidupan liar atau botani untuk kawasan hidupan liar tempatan;
(j) Buat pameran tentang produk tempatan, sejarah tempatan atau personaliti tempatan
menggunakan pita audio, pita video dan gambar; dan
Kemungkinan untuk projek tidak berkesudahan. Bahan utama untuk sebarang idea projek ialah ia
didorong oleh pelajar, mencabar dan bermakna. Adalah penting untuk menyedari bahawa arahan
berasaskan projek melengkapkan kurikulum berstruktur. Arahan berasaskan projek membina dan
meningkatkan apa yang dipelajari oleh pelajar melalui pengajaran yang sistematik. Guru tidak
membiarkan pelajar menjadi pembuat keputusan tunggal tentang projek yang hendak diusahakan,
begitu juga guru tidak duduk diam dan menunggu pelajar memikirkan cara untuk melakukan proses
yang boleh menjadi sangat mencabar (Bryson, 1994). Di sinilah keupayaan guru untuk memudahkan
dan bertindak sebagai jurulatih memainkan peranan penting dalam kejayaan sesuatu projek. Guru
akan bercadang idea dengan pelajar untuk menjana kemungkinan projek, membincangkan
kemungkinan dan pilihan, membantu pelajar membentuk soalan panduan dan bersedia untuk
membantu pelajar sepanjang proses pelaksanaan seperti menetapkan garis panduan, tarikh akhir,
pemilihan sumber dan sebagainya. (Bryson, 1994; Rankin, 1993).
AKTIVITI 7.2
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
kehidupan kerja. Kerja projek menjadikan persekolahan lebih seperti dunia sebenar. Dalam kehidupan
sebenar, kami jarang meluangkan masa beberapa jam mendengar pihak berkuasa yang lebih tahu daripada
kami memberitahu kami dengan tepat apa yang perlu dilakukan dan cara melakukannya. Kami bertanya
soalan kepada orang yang kami belajar. Kami cuba mengaitkan apa yang orang itu beritahu kami dengan
apa yang kami sudah tahu. Kami membawa pengalaman kami dan perkara yang telah kami ketahui yang
berkaitan dengan isu atau tugas dan katakan atau lakukan sesuatu mengenainya.
Anda boleh melihat ini dengan kelas pelajar muda. Apabila guru bercerita, kanak-kanak tadika kecil
mengangkat tangan mereka untuk berkongsi pengalaman mereka tentang sesuatu yang berkaitan dengan
cerita tersebut. Mereka mahu dapat menerapkan kecenderungan semula jadi mereka untuk proses
pembelajaran. Beginilah kehidupan selalunya! Dengan memberikan kerja projek, kami membuka bidang
dalam persekolahan di mana pelajar boleh bercakap tentang perkara yang sudah mereka ketahui.
Kerja projek ialah pengalaman pembelajaran yang membolehkan perkembangan pengetahuan, kemahiran
dan sikap tertentu yang menyediakan pelajar untuk pembelajaran sepanjang hayat dan cabaran yang akan
datang (rujuk Jadual 7.1). Objektif ini mungkin tidak dapat dicapai dengan strategi pengajaran semasa.
Jadual 7.1: Pengetahuan, Kemahiran dan Sikap yang Dicapai dengan Projek
Aplikasi ilmu Pelajar akan dapat membuat perkaitan merentasi bidang pengetahuan
(Menggunakan kemahiran yang berbeza dan menjana, mengembangkan dan menilai idea dan
berfikir secara kreatif dan kritis) maklumat untuk menggunakan kemahiran ini untuk tugas projek. •
Dapat memilih bidang pengetahuan dan mengehadkan tugas atau
masalah.
Kerjasama Pelajar akan memperoleh kemahiran kolaboratif melalui bekerja dalam satu
(Memupuk kemahiran pasukan untuk mencapai matlamat bersama.
pembelajaran kolaboratif)
Pembelajaran berdikari Pelajar akan dapat belajar sendiri, merenung pembelajaran mereka dan
(Membangunkan inkuiri terarah mengambil tindakan yang sesuai untuk menambah baik. • Boleh
kendiri dan kemahiran
menggunakan buku log untuk mendokumentasikan kemajuan kerja mereka
pembelajaran sepanjang hayat)
dan kerap melaporkan proses tersebut. • Dapat menilai sama ada
(a) Membangunkan kemahiran yang diperlukan untuk merancang, menstruktur dan mengambil
tanggungjawab untuk kerja yang lebih besar dan menyediakan pengalaman untuk bekerja dalam
„bentuk projek‰;
(b) Mendalami pengetahuan dalam sesuatu mata pelajaran atau antara mata pelajaran;
(c) Memberi peluang kepada pelajar untuk meneroka perkaitan dan kesalinghubungan topik dalam mata
pelajaran dan antara mata pelajaran; dan
(d) Menggalakkan pelajar untuk mensintesis pengetahuan daripada pelbagai bidang pembelajaran
sambil mengaplikasikannya secara kritis dan kreatif dalam situasi kehidupan sebenar.
Oleh itu, adalah penting bahawa pelajar ditugaskan untuk menjalankan projek tulen kami di mana
pelajar merancang, melaksana dan melaporkan projek yang mempunyai aplikasi dunia sebenar
di luar bilik darjah (Blank & Harwell, 1997).
Apakah pengetahuan, kemahiran dan sikap yang dinilai apabila pelajar berada
diberi projek untuk diusahakan?
AKTIVITI 7.3
Sejauh manakah kerja projek telah digunakan sebagai strategi pentaksiran di sekolah-
sekolah Malaysia?
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
(d) Peraturan
Garis panduan untuk melaksanakan projek termasuk garis masa dan matlamat jangka
pendek seperti temu duga diselesaikan pada tarikh tertentu dan menyatakan tarikh siap
projek.
(f) Penilaian
Bagaimana prestasi pelajar akan dinilai. Dalam kerja projek, proses pembelajaran
sedang dinilai serta produk akhir.
Sebelum mereka bentuk projek, kenal pasti matlamat dan objektif pembelajaran. Apakah kemahiran
atau konsep khusus yang akan dipelajari oleh pelajar? Herman, Aschbacher dan Winters (1992) telah
mengenal pasti lima soalan yang perlu dipertimbangkan semasa menentukan matlamat pembelajaran:
(a) Apakah kemahiran kognitif penting yang saya mahu pelajar saya kembangkan ?
(Sebagai contoh, untuk menggunakan algebra untuk menyelesaikan masalah harian, untuk menulis secara persuasif);
(b) Apakah kemahiran sosial dan afektif yang saya mahu pelajar saya kembangkan ? (Untuk
(c) Apakah kemahiran metakognitif yang saya mahu pelajar saya kembangkan? (Sebagai contoh,
untuk merenung proses penyelidikan, untuk menilai keberkesanannya, untuk menentukan
kaedah penambahbaikan);
(d) Apakah jenis masalah yang saya mahu pelajar saya dapat selesaikan? (Sebagai contoh, untuk
mengetahui cara menjalankan penyelidikan, untuk menggunakan kaedah saintifik); dan
(e) Apakah konsep dan prinsip yang saya mahu pelajar saya boleh gunakan? (Contohnya, untuk
menggunakan prinsip asas biologi dan geografi dalam kehidupan mereka, untuk memahami
sebab-akibat dalam perhubungan)
Steinberg (1998) menyediakan senarai semak untuk reka bentuk projek yang berkesan (rujuk Jadual
7.2). Senarai semak boleh digunakan sepanjang proses untuk membantu kedua-dua guru dan pelajar
merancang dan membangunkan projek serta menilai sama ada projek itu berjaya mencapai matlamat
pengajaran.
Keaslian • Adakah projek berpunca daripada masalah atau persoalan yang bermakna
kepada pelajar?
• Adakah projek itu serupa dengan projek yang dijalankan oleh orang dewasa dalam komuniti atau
tempat kerja? • Adakah projek memberi peluang kepada pelajar untuk menghasilkan sesuatu
yang mempunyai nilai atau makna kepada pelajar di luar persekitaran sekolah?
Ketegasan
• Adakah projek membolehkan pelajar memperoleh dan menggunakan pengetahuan
akademik pusat kepada satu atau lebih bidang disiplin?
• Adakah projek mencabar pelajar untuk menggunakan kaedah inkuiri daripada satu atau lebih
disiplin (contohnya, berfikir seperti saintis)?
• Adakah pelajar membangunkan kemahiran berfikir aras tinggi (contohnya, mencari bukti atau
menggunakan perspektif yang berbeza)?
• Adakah pelajar menyelesaikan masalah yang berasaskan kehidupan sebenar dan/atau kerja
Pembelajaran gunaan (contohnya, mereka bentuk projek atau menganjurkan acara)? • Adakah pelajar perlu
memperoleh dan menggunakan kemahiran yang diharapkan dalam persekitaran kerja berprestasi
tinggi (contohnya, kerja berpasukan, penyelesaian masalah, komunikasi atau teknologi)?
• Adakah pelajar menghabiskan banyak masa melakukan kerja lapangan, di luar sekolah?
Penerokaan aktif
• Adakah projek memerlukan pelajar melibatkan diri dalam kerja penyiasatan sebenar,
menggunakan pelbagai kaedah, media dan sumber?
• Adakah pelajar diharapkan untuk menerangkan apa yang telah dipelajari melalui persembahan
atau persembahan?
• Adakah pelajar bertemu dan memerhati orang dewasa yang mempunyai pengalaman dan
Hubungan dewasa kepakaran yang relevan?
dewasa? • Adakah orang dewasa dan pelajar bekerjasama dalam reka bentuk dan penilaian
projek?
Amalan
• Adakah pelajar membuat refleksi secara kerap tentang pembelajarannya, menggunakan jelas
pentaksiran kriteria projek yang telah dia bantu untuk tetapkan?
• Adakah orang dewasa dari luar komuniti membantu pelajar mengembangkan rasa standard
dunia sebenar daripada jenis kerja ini? • Adakah kerja pelajar dinilai secara berkala melalui
pelbagai kaedah
termasuk portfolio dan pameran?
Sumber: Adaptation of Steinberg (1998). Pembelajaran sebenar, kerja sebenar: Reformasi sekolah dari sebagai
tinggi
sekolah ke tempat kerja
(a) Adakah pelajar mempunyai akses mudah kepada sumber yang mereka perlukan? Ini amat
penting jika pelajar menggunakan teknologi tertentu atau kepakaran subjek-materi daripada
komuniti;
(b) Adakah pelajar tahu cara menggunakan sumber? Pelajar yang mempunyai pengalaman
minimum dengan komputer, sebagai contoh, mungkin memerlukan bantuan tambahan
dalam menggunakannya;
(c) Adakah pelajar mempunyai mentor atau jurulatih untuk menyokong mereka dalam kerja mereka? Ini
boleh menjadi mentor di sekolah atau di luar sekolah; dan
(d) Adakah pelajar jelas tentang peranan dan tanggungjawab setiap orang dalam
kumpulan?
1. Apakah beberapa faktor yang perlu anda pertimbangkan semasa mereka bentuk kerja projek
untuk pelajar dalam bidang subjek anda?
2. Berikan contoh projek yang telah anda sertakan atau boleh sertakan dalam
pengajaran dan penilaian bidang mata pelajaran anda.
(a) Menjajarkan matlamat projek dengan matlamat kurikulum boleh menjadi sukar. Lebih memburukkan
keadaan, ibu bapa tidak sentiasa menyokong projek apabila mereka tidak dapat melihat bagaimana
ia berkaitan dengan penilaian pembelajaran keseluruhan;
(b) Projek selalunya boleh mengambil masa lebih lama daripada jangkaan dan guru memerlukan banyak
masa untuk menyediakan projek tulen yang baik;
(c) Pelajar tidak jelas tentang apa yang diperlukan. Terdapat keperluan untuk struktur, garis panduan dan
panduan yang mencukupi tentang cara melaksanakan projek;
(d) Pembangunan kakitangan yang intensif diperlukan. Ini kerana guru secara tradisinya tidak bersedia
untuk mengintegrasikan kandungan ke dalam aktiviti dunia sebenar;
(e) Sumber yang diperlukan untuk kerja projek mungkin tidak tersedia dan mungkin kekurangan sokongan
pentadbiran; dan
(f) Sesetengah guru mungkin tidak biasa dengan cara mereka harus menilai projek.
Apakah beberapa faedah kerja berkumpulan dalam projek? Mari kita baca yang berikut:
(a) Pembelajaran Rakan Sebaya Dapat Meningkatkan Kualiti Keseluruhan Pembelajaran Pelajar
Kerja kumpulan meningkatkan pemahaman pelajar. Pelajar belajar daripada satu sama lain dan
mendapat manfaat daripada aktiviti yang memerlukan mereka untuk menyatakan dan menguji
pengetahuan mereka. Kerja kumpulan memberi peluang kepada pelajar untuk menjelaskan dan
memperhalusi pemahaman mereka tentang konsep melalui perbincangan dan latihan dengan rakan
sebaya. Ramai, tetapi tidak semua, pelajar mengiktiraf nilai pembangunan peribadi mereka dalam kerja
kumpulan dan dinilai sebagai ahli kumpulan.
Bekerja dengan kumpulan dan untuk faedah kumpulan juga memotivasikan beberapa pelajar. Penilaian
kumpulan membantu sesetengah pelajar mengembangkan rasa tanggungjawab: „Saya merasakan
bahawa kerana seseorang bekerja dalam kumpulan, ia tidak mungkin untuk berlengah atau
menangguhkan sesuatu. Saya perlu terus bekerja jika tidak saya akan mengecewakan orang lain‰.
(b) Kerja Kumpulan Boleh Membantu Membangunkan Kemahiran Generik Khusus yang Diminta oleh Majikan
Sebagai tindak balas langsung kepada objektif menyediakan graduan dengan kapasiti untuk berfungsi
dengan jayanya sebagai ahli pasukan di tempat kerja, terdapat trend dalam beberapa tahun
kebelakangan ini untuk menggabungkan kemahiran generik bersama-sama. pengetahuan khusus mata
pelajaran tradisional dalam hasil pembelajaran yang diharapkan dalam pendidikan tinggi. Kerja
kumpulan boleh memudahkan pembangunan kemahiran yang merangkumi:
(i) Kemahiran kerja berpasukan (kemahiran bekerja dalam dinamik pasukan; kepimpinan
kemahiran);
(ii) Kemahiran analisis dan kognitif (menganalisis keperluan tugasan; menyoal; mentafsir bahan secara
kritis; menilai kerja orang lain);
(iv) Kemahiran mengurus organisasi dan masa: „Melakukan kerja berkumpulan telah
mengubah cara saya bekerja. Saya tidak dapat melakukannya sepanjang malam sebelumnya.
Saya harus lebih teratur dan cekap‰.
(c) Kerja Kumpulan Boleh Mengurangkan Beban Kerja yang Terlibat dalam Menilai, Menggred dan
Memberi Maklum Balas kepada Pelajar
Kerja kumpulan dan penilaian kumpulan khususnya, kadangkala dilaksanakan dengan
harapan untuk memperkemas tugasan penilaian dan penggredan. Secara ringkasnya, jika
pelajar menghantar tugasan kumpulan bilangan kerja yang akan dinilai boleh dikurangkan
dengan ketara. Prospek ini mungkin menarik terutamanya untuk kakitangan yang mengajar
kelas besar.
Jadual 7.3 boleh memberi anda beberapa idea tentang cara menilai dan memberi markah untuk kerja
projek.
Markah Kriteria
90ÿ100% • Kerja yang luar biasa dan terbilang daripada standard profesional. • Kemahiran
teknikal dan ekspresif yang cemerlang. • Kerja menunjukkan kreativiti dan
imaginasi yang luar biasa. • Karya yang mempamerkan bakat dan keaslian
yang hebat.
20ÿ29% • Kerja yang lemah. Kemahiran teknikal atau ekspresif yang tidak memuaskan.
• Kerja yang memaparkan kelemahan penting atau asas dalam kriteria
dinilai.
10ÿ19% • Kerja yang sangat buruk atau kerja yang sangat sedikit percubaan telah dibuat.
• Kurang kemahiran teknikal atau ekspresif. • Kerja
yang memaparkan kelemahan asas dalam kriteria yang dinilai.
1 hingga 9%
• Kerja atau kerja yang sangat teruk di mana tiada percubaan serius telah dibuat.
Apabila menilai kerja projek, anda perlu jelas tentang perkara yang perlu dinilai. Adakah produk,
proses atau kedua-duanya? Menurut Bonthron dan Gordon (1999), dari permulaan anda harus jelas:
(a) Sama ada anda akan menilai produk kerja kumpulan atau kedua-dua produk dan proses.
(b) Jika anda berhasrat untuk menilai proses tersebut, apakah bahagian yang anda akan peruntukkan
untuk proses dan apakah kriteria untuk digunakan dan bagaimana anda akan menilai proses
tersebut?
(c) Apakah kriteria yang anda rancangkan untuk digunakan untuk menilai kerja projek dan bagaimana
markah diedarkan?
Sesetengah pendidik percaya terdapat keperluan untuk menilai proses dalam kumpulan serta produk
atau hasil. Apakah sebenarnya yang dimaksudkan dengan „proses‰? Kedua-dua guru dan pelajar
mesti mempunyai pemahaman yang jelas tentang maksud proses tersebut.
Contohnya, jika anda ingin menilai „'tahap interaksi‰ di kalangan pelajar dalam kumpulan, mereka
harus tahu maksud interaksi „tinggi‰ atau „rendah‰. Perlukah guru melibatkan dirinya dalam kerja
setiap kumpulan atau bergantung kepada penilaian diri atau rakan sebaya? Jelas sekali, terlibat
dalam banyak kumpulan adalah mustahil untuk guru secara fizikal. Akibatnya, sesetengah pendidik
mungkin berkata, „Saya tidak kisah apa yang mereka lakukan dalam kumpulan mereka. Apa yang
saya minati ialah produk akhir dan cara mereka mencapai keputusan adalah perniagaan mereka‰.
Walau bagaimanapun, untuk memberikan penilaian yang lebih seimbang, terdapat minat yang
semakin meningkat dalam kedua-dua proses dan produk kerja kumpulan dan isu yang timbul ialah
„Apakah bahagian penilaian yang harus difokuskan pada produk dan bahagian manakah yang harus
difokuskan pada proses?‰
Kriteria penilaian kerja kumpulan boleh ditentukan oleh guru sahaja atau kedua-duanya oleh guru dan
pelajar melalui perundingan antara kedua-dua pihak. Ahli kumpulan boleh dirujuk tentang perkara yang
perlu dinilai dalam sesuatu projek melalui perundingan dengan guru. Jelas sekali, anda perlu jelas
tentang hasil pembelajaran projek yang dimaksudkan dalam bidang subjek anda. Ia adalah titik permulaan
yang berguna untuk menentukan kriteria penilaian projek. Setelah hasil pembelajaran yang lebih luas ini
difahami, anda boleh menetapkan kriteria untuk menandakan projek. Secara amnya, adalah lebih mudah
untuk mewujudkan kriteria untuk mengukur „produk‰ kerja projek dan lebih sukar untuk mengukur
„proses‰ yang terlibat dalam kerja projek. Walau bagaimanapun, adalah dicadangkan bahawa penilaian
produk dan proses dilakukan secara berasingan dan bukannya cuba melakukan kedua-duanya secara
serentak. Kami akan membincangkan bagaimana proses dalam kerja projek boleh dinilai kemudian.
Satu lagi perkara penting yang perlu diberi perhatian ialah kita perlu jelas siapa yang mendapat markah ÿ
individu atau kumpulan secara keseluruhan? Kebanyakan projek melibatkan lebih daripada seorang
pelajar dan faedah kerja berkumpulan telah dibincangkan lebih awal. Masalah utama menilai projek yang
melibatkan kerja berkumpulan ialah bagaimana memperuntukkan markah secara adil di kalangan ahli
kumpulan. Soalan-soalan berikut adalah yang disebut oleh pelajar: „Saya ingin guru saya memberitahu
saya jumlah kerja dan usaha yang akan saya perolehi membolehkan saya memperoleh markah tertentu‰,
„Adakah semua pelajar memperoleh markah yang sama walaupun tidak semua pelajar dimasukkan ke
dalam usaha yang sama?‰ dan „Adakah markah diberi berdasarkan sumbangan individu ahli pasukan?
‰
Ini adalah soalan yang menyusahkan guru terutamanya apabila perkara biasa untuk mencari pemuat
percuma atau pasangan tidur dalam projek berkumpulan. Berikut adalah beberapa cadangan bagaimana
kerja kumpulan boleh dinilai:
AKTIVITI 7.4
Antara lima kaedah menilai kerja kumpulan yang manakah akan anda gunakan
menilai kerja projek dalam bidang subjek anda? Berikan alasan untuk pilihan anda
dalam forum dalam talian myINSPIRE.
Mempunyai buku log berpotensi memberikan banyak maklumat untuk membentuk asas
penilaian sambil menyimpan minit membantu ahli memberi tumpuan kepada proses yang
merupakan pengalaman pembelajaran itu sendiri. Teknik ini mungkin dianggap sebagai cara
yang adil untuk menangani pemuat percuma dan penyumbang cemerlang. Walau
bagaimanapun, menyemak log boleh memakan masa untuk guru atau pengajar dan pelajar
mungkin memerlukan banyak latihan dan pengalaman untuk menyimpan rekod. Di samping
itu, penekanan pada bukti terpakai mungkin tidak boleh dipercayai.
Rajah 7.1: Senarai semak untuk menilai proses yang terlibat dalam kerja
projek Sumber: Dibangunkan oleh Maggie Sutherland untuk Akademi Bioteknologi di Andrew P.
Hill High School © 2003 East Side Union High School District, San Jose, California
Jenis penilaian kendiri ini berkongsi tema yang sama, yang memerlukan pelajar menyemak kerja mereka untuk
menentukan perkara yang telah mereka pelajari dan kawasan kekeliruan yang mungkin masih wujud. Walaupun
setiap kaedah mungkin berbeza sedikit, semuanya merangkumi masa yang cukup untuk pelajar
mempertimbangkan dengan teliti dan menilai kemajuan mereka sendiri.
Oleh kerana pembelajaran projek adalah didorong oleh pelajar, penilaian harus didorong oleh pelajar juga.
Pelajar boleh menyimpan jurnal dan log untuk menilai kemajuan mereka secara berterusan. Esei atau log
refleksi akhir boleh membolehkan pelajar dan guru memahami proses pemikiran, sebab di sebalik keputusan,
keupayaan untuk membuat kesimpulan dan menyampaikan apa yang telah mereka pelajari.
Menurut Edwards (2000), berikut adalah beberapa soalan yang seseorang pelajar boleh bertanya kepada
dirinya sendiri semasa menjalankan penilaian kendiri:
(b) Apakah yang boleh saya lakukan untuk menambah baik projek itu?
(c) Sejauh manakah saya mencapai matlamat pembelajaran saya? Apakah yang paling sukar untuk mencapai
matlamat?
(d) Apakah yang paling mengejutkan saya tentang mengusahakan projek itu?
(e) Apakah usaha pasukan terbaik kumpulan saya? Usaha pasukan yang paling teruk?
(f) Bagaimanakah saya rasa orang lain yang terlibat dengan projek itu merasakan kemajuan dan
produk akhir projek itu?
(g) Apakah kemahiran yang saya gunakan semasa projek ini? Bagaimana saya boleh terlibat
kemahiran ini pada masa hadapan?
AKTIVITI 7.5
Terangkan jawapan anda kepada rakan kursus anda dalam myINSPIRE dalam talian
forum.
Portfolio pelajar mungkin mempunyai pelbagai bentuk. Tidak mudah untuk menggambarkan
mereka. Portfolio bukanlah timbunan kerja pelajar yang terkumpul selama satu semester
atau tahun. Sebaliknya, portfolio ialah koleksi bermatlamat karya yang dihasilkan oleh
pelajar yang mencerminkan usaha, kemajuan dan pencapaian mereka dalam pelbagai
bidang kurikulum. Menurut Paulson, Paulson dan Meyer (1991), „portfolio menawarkan
cara menilai pembelajaran pelajar yang berbeza daripada kaedah tradisional.
Penilaian portfolio memberi peluang kepada guru untuk memerhati pelajar dalam konteks
yang lebih luas yang melibatkan mengambil risiko, membangunkan penyelesaian kreatif
dan belajar membuat pertimbangan tentang prestasi mereka‰.
Koleksi karya oleh pelajar dinilai dan oleh itu istilah penilaian portfolio. Portfolio
menyediakan penilaian berterusan dan berterusan (penilaian formatif) serta penilaian
pada akhir semester atau setahun (penilaian sumatif). Penekanan lebih kepada memantau
kemajuan pelajar ke arah mencapai hasil pembelajaran mata pelajaran, kursus atau
program tertentu.
Penilaian portfolio mewakili anjakan yang ketara dalam pemikiran tentang peranan
penilaian dalam pendidikan. Guru yang menggunakan strategi ini di dalam bilik darjah
telah mengalihkan falsafah penilaian mereka daripada hanya membandingkan pencapaian
berdasarkan gred, markah ujian dan kedudukan persentil kepada meningkatkan
pencapaian pelajar melalui maklum balas dan refleksi kendiri.
In telah kerap dicadangkan bahawa ujian kertas dan pensel (ujian objektif dan esei) tidak
dapat menilai semua hasil pembelajaran dalam bidang mata pelajaran tertentu.
Sebagai contoh, banyak kemahiran kognitif peringkat tinggi dan domain afektif (perasaan,
emosi, sikap dan nilai) tidak dinilai dengan secukupnya menggunakan kaedah penilaian
tradisional. Penilaian portfolio membolehkan penilaian yang lebih luas
pelbagai kemahiran dan pemahaman dan yang paling penting, ia memberi peluang
kepada guru untuk mengesan atau memantau perubahan dan pertumbuhan dalam satu tempoh
masa. Memandangkan penilaian portfolio adalah proses yang berterusan, ia memberi peluang kepada
pelajar untuk merenung pembelajaran dan pemikiran mereka sendiri. Mereka mempunyai peluang untuk
memantau pemahaman dan pendekatan mereka untuk menyelesaikan masalah dan membuat keputusan
(Paulson, Paulson & Meyer, 1991). Setelah membuat refleksi, pelajar boleh mengenal pasti di mana silap
mereka atau bagaimana mereka boleh memperbaiki diri mereka sendiri.
Epstein (2006) dalam Pengenalan kepada Portfolio, Reka Bentuk Pembelajaran Sinaps, dipetik dalam
(a) Membolehkan guru melihat pelajar sebagai individu, masing-masing dengan sendiri
ciri unik, keperluan dan kekuatan;
(b) Menekankan peningkatan pencapaian pelajar dan bukannya meletakkan kedudukan pelajar mengikut
prestasi mereka berdasarkan ujian;
(f) Menjemput pelajar untuk merenung pertumbuhan dan prestasi mereka sebagai pelajar.
Walau bagaimanapun, Epstein (2006) juga menyebut beberapa masalah dengan penilaian portfolio.
Penilaian portfolio mungkin kurang boleh dipercayai kerana ia cenderung lebih bersifat kualitatif dan
bukannya kuantitatif. Masyarakat masih sangat berorientasikan gred dan markah ujian. Selain itu,
kebanyakan universiti dan kolej masih menggunakan markah dan gred ujian sebagai kriteria kemasukan
utama. Selain itu, penilaian portfolio mungkin memakan masa untuk guru dan data daripada penilaian
portfolio boleh menjadi sukar untuk dianalisis.
(a) Koleksi
Langkah ini hanya memerlukan pelajar untuk mengumpul dan menyimpan semua kerja.
Pelajar perlu membiasakan diri dengan idea untuk mendokumentasikan dan menyimpan kerja mereka,
sesuatu yang mungkin tidak pernah mereka lakukan sebelum ini.
(i) Bagaimanakah kerja-kerja itu harus disusun? Mengikut mata pelajaran atau tema?
(b) Pemilihan
Ini bergantung kepada sama ada ia adalah proses atau portfolio produk dan kriteria yang
ditetapkan oleh guru. Pelajar akan meneliti kerja yang dikumpul dan memilih karya tertentu
untuk portfolio mereka. Ini mungkin termasuk kertas peperiksaan dan kuiz, rakaman audio
dan video, laporan projek, jurnal, kerja komputer, esei, puisi, karya seni dan sebagainya.
Pendek kata,
(c) Refleksi
Ini adalah langkah paling penting dalam proses portfolio. Refleksi yang terlibatlah yang
membezakan portfolio sebagai koleksi karya pelajar semata-mata. Refleksi selalunya
dilakukan secara bertulis tetapi boleh juga dilakukan secara lisan. Pelajar ditanya mengapa
mereka memilih produk atau karya tertentu (contohnya, esei) dan bagaimana ia dibandingkan
dengan karya lain, apakah kemahiran dan pengetahuan tertentu yang digunakan untuk
menghasilkannya dan bagaimana ia boleh dipertingkatkan lagi. Sebagai tambahan,
(i) Pelajar harus memikirkan bagaimana atau mengapa mereka memilih karya tertentu.
(d) Sambungan
Hasil daripada „refleksi‰, pelajar akan mula bertanya kepada diri sendiri, „Mengapa kita
melakukan ini?‰ Mereka digalakkan untuk membuat perkaitan antara kerja sekolah mereka
dan nilai apa yang mereka pelajari. Mereka juga digalakkan untuk membuat perkaitan antara
karya yang termasuk dalam portfolio mereka dengan dunia di luar bilik darjah. Mereka belajar
untuk mempamerkan apa yang telah mereka lakukan di sekolah kepada kejadian dan situasi
dalam masyarakat.
Isu yang perlu dipertimbangkan termasuk:
(iii) Memastikan pelajar bertanggungjawab untuk menguasai standard kandungan dalam bidang
mata pelajaran;
(v) Menyediakan fleksibiliti dalam mengukur bagaimana pelajar mencapai matlamat pembelajaran
mereka;
(vi) Menggalakkan komunikasi antara guru dan pelajar. Membolehkan guru dan pelajar berkongsi
tanggungjawab untuk menetapkan matlamat pembelajaran dan untuk menilai kemajuan
ke arah mencapai matlamat tersebut;
(vii) Memberi peluang kepada pelajar untuk mendapatkan input yang meluas ke dalam
proses pembelajaran; dan
(viii) Memudahkan aktiviti pembelajaran koperatif termasuk penilaian dan tunjuk ajar rakan
sebaya, kumpulan pembelajaran koperatif dan persidangan rakan sebaya.
Selain itu, kelemahan lain penilaian portfolio menurut Venn (2000) adalah seperti berikut:
(i) Memerlukan masa tambahan untuk merancang sistem pentaksiran dan menjalankan
pentaksiran terutamanya untuk kumpulan besar pelajar;
(ii) Mengumpul semua data yang diperlukan dan sampel kerja boleh dibuat
portfolio besar dan sukar diurus;
(iv) Menjadualkan persidangan portfolio individu adalah sukar dan tempoh setiap
persidangan mungkin mengganggu aktiviti pengajaran yang lain.
Jika tujuan penilaian adalah untuk menunjukkan kemajuan, guru boleh membuat
pertimbangan tentang bukti kemajuan dan memberikan pertimbangan tersebut sebagai
maklum balas kepada pelajar. Pelajar juga boleh menilai sendiri kemajuannya untuk
menyemak sama ada matlamatnya telah dicapai atau tidak.
Portfolio adalah lebih daripada sekadar koleksi kerja pelajar. Guru boleh menilai dan
memberikan gred kepada proses memasang dan merenung portfolio kerja pelajar. Pelajar
mungkin juga memasukkan refleksi tentang pertumbuhan, kekuatan dan kelemahan,
tentang matlamat yang telah atau akan ditetapkan, tentang mengapa sampel tertentu
menceritakan kisah tertentu tentang mereka atau tentang sebab kandungan mencerminkan
kemajuan yang mencukupi untuk menunjukkan penyempurnaan piawaian yang ditetapkan.
Sesetengah kemahiran proses juga mungkin menjadi sebahagian daripada standard guru,
sekolah atau daerah. Oleh itu, portfolio menyediakan beberapa bukti pencapaian piawaian
tersebut. Mana-mana atau semua elemen ini boleh dinilai dan/atau digredkan.
Tugasan portfolio juga boleh dinilai atau digredkan dengan rubrik. Rubrik berguna dalam
mengelakkan pertimbangan peribadi yang digunakan untuk menilai produk yang kompleks
seperti portfolio. Rubrik boleh memberikan sedikit kejelasan dan ketekalan dalam menilai
dan menilai kualiti kandungan dan unsur-unsur yang membentuk kandungan tersebut.
Selain itu, penggunaan rubrik meningkatkan kemungkinan konsistensi di kalangan guru
yang menilai portfolio.
Rubrik portfolio berikut boleh digunakan untuk penilaian kendiri dan maklum balas rakan
sebaya (rujuk Rajah 7.3).
Rajah 7.3: Contoh rubrik untuk penilaian kendiri dan maklum balas
rakan sebaya Sumber: Diadaptasi daripada eportfolio (rubrik
portfolio digital di https://www2.uwstout.edu/content/profdev/rubrics/eportfoliorubric.html)
AKTIVITI 7.6
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
• Penilaian berasaskan prestasi memerlukan pengambil ujian untuk menyelesaikan tugasan dalam
konteks atau persekitaran yang hampir menyerupai situasi kehidupan sebenar.
• Projek ialah aktiviti di mana kekangan masa telah banyak dibuang dan boleh dilaksanakan
secara individu atau kumpulan, dan biasanya melibatkan elemen penting kerja yang
dilakukan di rumah atau di luar sekolah.
• Projek berasaskan penyelidikan lebih bersifat teori dan mungkin terdiri daripada
mengemukakan soalan, merumuskan masalah atau menubuhkan beberapa hipotesis.
• Projek yang berkesan harus mengandungi elemen seperti situasi atau masalah, penerangan dan tujuan
projek, spesifikasi prestasi, peraturan, peranan ahli dan penilaian.
• Enam AÊs sesuatu projek ialah ketulenan, ketelitian akademik, pembelajaran gunaan, penerokaan aktif,
perhubungan dewasa dan amalan penilaian.
• Bekerja dalam kumpulan telah menjadi sebahagian daripada pembelajaran yang diterima kerana faedah
yang diiktiraf secara meluas daripada kerja kumpulan kolaboratif untuk pembelajaran pelajar.
• Pelbagai cara untuk memperuntukkan markah kepada kerja projek termasuk markah kumpulan yang
dikongsi, markah yang dikongsi, markah individu, markah individu (peperiksaan) dan gabungan purata
kumpulan dan markah individu.
• Penilaian kendiri ialah satu proses di mana pelajar belajar tentang diri mereka, contohnya, apa yang
mereka telah pelajari tentang projek, bagaimana mereka telah belajar dan bagaimana mereka bertindak
balas dalam situasi tertentu semasa menjalankan projek.
• Portfolio ialah koleksi bermatlamat karya yang dihasilkan oleh pelajar yang mencerminkan usaha, kemajuan
dan pencapaian mereka dalam pelbagai bidang kurikulum.
• Guru perlu mengetahui kebaikan dan kelemahan portfolio untuk menggunakannya untuk membantu
pembelajaran pelajar.
Topik ÿ Kebolehpercayaan
dan Kesahan Ujian
8
HASIL PEMBELAJARAN
Pada akhir topik ini, anda seharusnya dapat:
ÿ PENGENALAN
Dalam topik ini kita akan menangani dua isu penting iaitu kebolehpercayaan dan kesahan sesuatu
penilaian. Bagaimanakah kita memastikan bahawa teknik yang kita gunakan untuk menilai pengetahuan,
kemahiran dan nilai pelajar adalah boleh dipercayai dan sah? Kami sedang membuat keputusan penting
tentang kebolehan dan keupayaan generasi masa depan kami, jadi jelas sekali kami ingin memastikan
bahawa kami membuat keputusan yang betul.
Anda telah memberikan ujian geometri kepada sekumpulan pelajar Tingkatan Empat dan seorang
daripada pelajar anda, Swee Leong, memperoleh markah 66 peratus dalam ujian tersebut. Sejauh
manakah anda pasti bahawa markah itu adalah yang sepatutnya diterima oleh Swee Leong? Dengan
kata lain, adakah itu markah sebenar beliau? Apabila anda membangunkan ujian dan mentadbirkannya
kepada pelajar anda, anda cuba mengukur, sejauh mungkin, markah sebenar pelajar anda. Skor
sebenar adalah konsep hipotesis kebolehan, kecekapan dan kapasiti sebenar
seorang individu. Ujian cuba mengukur markah sebenar seseorang. Apabila mengukur
kebolehan manusia, hampir mustahil untuk membangunkan ujian bebas ralat.
Walau bagaimanapun, hanya kerana terdapat kesilapan, itu tidak bermakna ujian itu
tidak baik. Faktor yang lebih penting ialah saiz ralat.
X,
Secara formal, skor ujian yang diperhatikan, T, .
difikirkan sebagai jumlah skor benar, dan
istilah ralat, berulang
Skorkali
DAN
sebenar
diberikan
ditakrifkan
kepadasebagai
pelajar (dan
purata
pelajar
markah
boleh
ujian
dibuat
jika ujian
untukialah
melupakan kandungan ujian di antara pentadbiran berulang). Memandangkan skor benar
ditakrifkan sebagai purata markah yang diperhatikan, dalam setiap pentadbiran sesuatu
ujian, skor yang diperhatikan berlepas daripada skor sebenar dan perbezaan itu dipanggil
ralat pengukuran. Pemergian ini bukan disebabkan oleh kesilapan terang-terangan yang
dibuat oleh penulis ujian tetapi ia disebabkan oleh beberapa elemen peluang dalam
prestasi pelajar semasa ujian.
Ralat pengukuran kebanyakannya berpunca daripada fakta bahawa kami hanya mencuba
sebahagian kecil daripada keupayaan pelajar. Soalan yang samar-samar dan tanda yang salah
boleh menyumbang kepada ralat pengukuran tetapi ia hanya sebahagian kecil daripada ralat
pengukuran. Bayangkan jika terdapat 10,000 item dan seorang pelajar boleh memperoleh 60
peratus daripada semua 10,000 item yang ditadbir (yang secara praktikalnya tidak boleh
dilaksanakan). Kemudian 60 peratus adalah skor sebenar. Kini apabila anda mencuba hanya 40
item dalam ujian, skor yang dijangkakan untuk pelajar ialah 24 item. Tetapi pelajar mungkin
mendapat 20, 26, 30 dan seterusnya bergantung pada item yang ada dalam ujian. Dalam contoh
ini, ini adalah sumber utama ralat pengukuran. Maksudnya, ralat pengukuran adalah disebabkan
oleh pensampelan item dan bukannya item yang ditulis dengan buruk.
Ralat mungkin datang dari pelbagai sumber seperti dalam pengambil ujian (pelajar),
dalam ujian (soalan tidak jelas), dalam pentadbiran ujian atau semasa pemarkahan (atau
pemarkahan). Sebagai contoh, keletihan, sakit, meniru atau pun perasan yang tidak
disengajakan terhadap jawapan pelajar lain semuanya menyumbang kepada kesilapan
dari dalam pengambil ujian.
Secara amnya, lebih kecil ralat, lebih besar kemungkinan anda lebih dekat untuk mengukur skor
sebenar pelajar. Jika anda yakin bahawa ujian geometri anda (skor yang diperhatikan) mempunyai
ralat kecil, maka anda dengan yakin boleh membuat kesimpulan bahawa skor Swee LeongÊs
sebanyak 66 peratus adalah hampir dengan markah sebenar beliau atau keupayaan sebenar
beliau dalam menyelesaikan masalah geometri, dengan kata lain, apakah dia sebenarnya tahu.
Untuk mengurangkan ralat dalam ujian, anda mesti memastikan bahawa ujian anda boleh
dipercayai dan sah. Semakin tinggi kebolehpercayaan dan kesahan ujian anda, semakin besar
kemungkinan anda akan mengukur skor sebenar pelajar anda.
Kebolehpercayaan dikira sebagai pekali kebolehpercayaan. Simbol yang digunakan untuk menandakan
pekali kebolehpercayaan adalah rdengan
amnyadua
ditakrifkan
subskripsebagai
yang sama
varians
(). Pekali rxxvarians
skor sebenar
kebolehpercayaan
dibahagikan
skor yang
secara
dengan
diperhatikan. Berikut ialah persamaan.
2
Varians Skor Benar ÿ Skor Benar
r xx ÿ ÿ
2
Varians Skor Yang Diperhatikan ÿ Skor Diperhatikan
Sekiranya terdapat ralat yang agak sedikit, nisbah varians skor benar kepada varians skor yang
diperhatikan menghampiri pekali kebolehpercayaan 1.00 yang merupakan kebolehpercayaan yang
sempurna. Sekiranya terdapat jumlah ralat yang agak besar, nisbah varians skor benar kepada varians
skor yang diperhatikan menghampiri 0.00 iaitu jumlah tidak boleh dipercayai.
Kebolehpercayaan yang tinggi bermakna soalan-soalan sesuatu ujian cenderung untuk „menarik bersama‰.
Pelajar yang menjawab soalan yang diberikan dengan betul lebih berkemungkinan menjawab
soalan lain dengan betul. Jika ujian setara atau selari dibangunkan dengan menggunakan item
yang serupa, skor relatif pelajar akan menunjukkan sedikit perubahan. Kebolehpercayaan yang
rendah bermakna soalan-soalan itu cenderung tidak berkaitan antara satu sama lain dari segi
siapa yang menjawabnya dengan betul. Kebolehpercayaan yang rendah bermakna soalan-soalan
itu cenderung tidak berkaitan antara satu sama lain dari segi siapa yang menjawabnya dengan betul. The
markah ujian yang terhasil mencerminkan bahawa ada sesuatu yang tidak kena dengan item atau situasi
ujian dan bukannya pengetahuan pelajar tentang perkara tersebut. Garis panduan berikut boleh digunakan
untuk mentafsir pekali kebolehpercayaan untuk ujian bilik darjah seperti yang ditunjukkan dalam Jadual
8.1.
Kebolehpercayaan Tafsiran
0.90 dan ke atas Kebolehpercayaan yang sangat baik (setanding dengan ujian piawai terbaik).
0.80 hingga 0.90 Sangat bagus untuk ujian bilik darjah.
0.70 hingga 0.80 Baik untuk ujian bilik darjah tetapi mungkin terdapat beberapa item yang boleh diperbaiki.
0.60 hingga 0.70 Agak rendah. Mungkin terdapat beberapa item yang boleh dialih keluar atau diperbaiki.
0.50 dan ke bawah Kebolehpercayaan yang boleh dipersoalkan dan ujian harus diganti atau memerlukan
semakan besar.
Jika anda mengetahui pekali kebolehpercayaan sesuatu ujian, bolehkah anda menganggarkan markah sebenar
pelajar dalam sesuatu ujian? Dalam ujian, kami menggunakan Ralat Standard Pengukuran untuk
menganggarkan skor sebenar.
„ ‰
Catatan: r adalah kebolehpercayaan ujian.
Dengan menggunakan lengkung biasa, anda boleh menganggarkan skor sebenar pelajar dengan
beberapa tahap kepastian berdasarkan skor yang diperhatikan dan Ralat Standard Pengukuran.
Contohnya:
Anda memberikan ujian sejarah kepada kumpulan 40 pelajar. Khairul memperoleh markah 75 dalam ujian
tersebut iaitu markah yang diamatinya. Sisihan piawai ujian anda ialah 2.0.
Sebelum ini anda telah menetapkan bahawa ujian sejarah anda mempunyai pekali kebolehpercayaan 0.7.
Anda berminat untuk mengetahui skor sebenar KhairulÊ.
ÿ ÿÿ2.0
ÿ 1 0.7 2.0 0.55 1.1 ÿ
Oleh itu, berdasarkan keluk taburan normal (rujuk Rajah 8.1), skor sebenar KhairulÊ hendaklah:
(a) Antara 75 ÿ 1.1 dan 75 + 1.1 atau antara 73.9 dan 76.1 untuk 68% masa.
(b) Antara 75 ÿ 2.2 dan 75 + 2.2 atau antara 72.8 dan 77.2 untuk 95% masa.
(c) Antara 75 ÿ 3.3 dan 75 + 3.3 atau antara 71.7 dan 78.3 untuk 99% masa.
AKTIVITI 8.1
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
Sekarang mari kita bincangkan bagaimana kita menganggarkan kebolehpercayaan sesuatu ujian. Rajah 8.2
menyenaraikan tiga kaedah biasa untuk menganggarkan kebolehpercayaan sesuatu ujian. Tidak mungkin untuk mengira
kebolehpercayaan dengan tepat dan oleh itu kita perlu menganggarkan kebolehpercayaan.
Terdapat juga kesan amalan dan ingatan yang mungkin mempengaruhi korelasi.
Semakin pendek jurang masa, semakin tinggi korelasi; semakin lama jurang masa,
semakin rendah korelasi. Ini kerana kedua-dua pemerhatian itu berkaitan dari semasa
ke semasa. Oleh kerana korelasi ini ialah anggaran ujian-uji semula kebolehpercayaan,
anda boleh memperoleh anggaran yang jauh berbeza bergantung pada selang.
oleh pengaruh ingatan. Satu masalah utama dengan pendekatan ini ialah anda
perlu dapat menjana banyak item yang mencerminkan binaan yang sama. Ini
selalunya bukan satu pencapaian yang mudah.
Berikut ialah dua ukuran konsistensi dalaman biasa yang boleh digunakan.
(i) Split-half
Untuk menyelesaikan masalah perlu mentadbir ujian yang sama dua
kali, teknik split-half digunakan. Dalam teknik split-half, ujian diberikan
sekali kepada kumpulan pelajar. Ujian dibahagikan kepada dua
bahagian yang sama selepas pelajar menyelesaikan ujian. Teknik ini
paling sesuai untuk ujian yang merangkumi item aneka pilihan, item
palsu benar dan mungkin esei jawapan pendek. Item dipilih berdasarkan
kaedah ganjil-genap di mana separuh daripada ujian terdiri daripada
item bernombor ganjil manakala separuh lagi terdiri daripada item bernombor genap.
Kemudian, markah yang diperolehi bagi kedua-dua bahagian tersebut dikorelasikan
untuk menentukan kebolehpercayaan keseluruhan ujian menggunakan pekali korelasi
Spearman-Brown.
2r
r ÿ xy
sb
ÿ1ÿ r ÿ
xy
2r 2 0.65 ÿ ÿ 1. 3
r ÿ xy ÿ ÿÿ
0.78
sb 1 ÿ0.65 1.65
ÿ1 ÿ r ÿ
xy
ÿ
k ÿ
k
ÿ ÿ pi ÿ1
ÿ
pi ÿ ÿ
ÿ
i 1
Alpha Cronbach ÿÿ ÿ ÿ
1 ÿ
ÿ
2
k ÿ
1 ÿ
x
ÿ ÿ
• pi merujuk kepada kesukaran item iaitu nisbah pelajar yang menjawab item
dengan betul; dan i
2
• ÿ
x ialah varians sampel untuk jumlah skor.
Sebagai
contoh: Katakan dalam ujian aneka pilihan yang terdiri daripada lima item atau
soalan, indeks kesukaran berikut bagi setiap item diperhatikan: 2 ÿ 0.5, = 0.75
hlm1 = 0.4, hlmdan = 0.85. = 0.6, hlm
hlm3 Varians sampel 4 hlm5
2
(ÿ x ) = 1.84. CronbachÊs alpha akan dikira seperti berikut:
ÿ 5 1.045 0.54
ÿ
ÿ ÿ ÿÿÿÿ1 ÿ
5 ÿ1 ÿ 1.840
Kata Awas!
Apabila anda memperoleh alfa rendah, anda harus berhati-hati untuk tidak membuat kesimpulan
segera bahawa ujian itu adalah ujian yang buruk. Anda harus menyemak untuk menentukan
sama ada ujian mengukur beberapa atribut atau dimensi dan bukannya satu atribut atau
dimensi. Jika ia berlaku, terdapat kemungkinan alfa Cronbach akan dikempiskan. Sebagai
contoh, Ujian Aptitud mungkin mengukur tiga sifat atau dimensi seperti kebolehan kuantitatif,
kebolehan bahasa dan kebolehan analisis. Oleh itu, tidak menghairankan bahawa alfa
Cronbach untuk keseluruhan ujian mungkin rendah kerana soalan mungkin tidak berkorelasi antara satu sama lain.
kenapa? Ini kerana item tersebut mengukur tiga jenis kebolehan manusia yang berbeza.
Penyelesaiannya adalah untuk mengira tiga alpha Cronbach berbeza; satu untuk kebolehan
kuantitatif, satu untuk kebolehan bahasa dan satu untuk kebolehan analitikal yang memberitahu
anda lebih lanjut tentang ketekalan dalaman item dalam ujian.
1. Apakah kelebihan utama teknik split-half berbanding teknik ujian semula ujian
dalam menentukan kebolehpercayaan sesuatu ujian?
Setiap kali anda menggunakan manusia sebagai sebahagian daripada prosedur pengukuran anda,
anda perlu bimbang sama ada keputusan yang anda perolehi boleh dipercayai atau konsisten. Orang
ramai terkenal dengan ketidakkonsistenan mereka. Kita mudah terganggu. Kami bosan melakukan
tugasan yang berulang-ulang. Kami mengelamun. Kami salah tafsir. Jadi, bagaimana kita menentukan
sama ada:
Untuk mencari jawapan kepada soalan ini, mari kita membaca lebih lanjut tentang kebolehpercayaan
antara penilai dan kebolehpercayaan dalam penilai.
(ii) Ketekalan dalam pemarkahan terjejas selepas menandakan satu set sama ada skrip yang
sangat baik atau sangat lemah;
(iii) Apabila terdapat gangguan semasa penandaan kumpulan skrip, piawaian berbeza boleh
digunakan selepas rehat; dan
Menurut Frith dan Macintosh (1987), kebolehpercayaan antara penilai boleh dipertingkatkan
jika kriteria untuk penandaan atau skema pemarkahan:
(ii) Telah membuat peruntukan untuk jawapan alternatif yang boleh diterima;
(iii) Memastikan masa yang diperuntukkan bersesuaian dengan kerja yang diperlukan;
(iv) Dipecahkan secukupnya untuk membolehkan pemarkahan menjadi seobjektif mungkin dan
penjumlahan markah adalah betul; dan
AKTIVITI 8.1
Cadangkan langkah lain yang anda akan ambil untuk meningkatkan kebolehpercayaan
dalam penilai dalam penggredan tugasan pelajar.
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
Apakah kesahan? Kesahan sering ditakrifkan sebagai sejauh mana sesuatu ujian mengukur apa yang
direka bentuk untuk diukur (Nutall, 1987). Walaupun kebolehpercayaan berkaitan dengan ketekalan
ujian, kesahan berkaitan dengan kerelevanan ujian. Jika ia tidak mengukur apa yang ditetapkan untuk
diukur, maka penggunaannya adalah mengelirukan dan tafsiran berdasarkan ujian adalah tidak sah
atau relevan. Sebagai contoh, ujian yang sepatutnya mengukur „kebolehan mengeja kanak-kanak
berumur 8 tahun‰ tetapi tidak melakukannya bukanlah ujian yang sah. Ia akan menjadi bencana jika
anda membuat dakwaan tentang perkara yang boleh atau tidak boleh dilakukan oleh pelajar
berdasarkan ujian yang sebenarnya mengukur sesuatu yang lain. Atas sebab inilah ramai pendidik
berpendapat bahawa kesahan adalah aspek terpenting dalam sesuatu ujian. Walau bagaimanapun,
kesahan akan berbeza dari satu ujian ke satu ujian bergantung pada kegunaannya. Sebagai contoh,
ujian mungkin mempunyai kesahan yang tinggi dalam menguji ingatan fakta dalam ekonomi tetapi
ujian yang sama mungkin rendah dalam kesahan berkaitan dengan menguji aplikasi konsep dalam
ekonomi.
Messick (1989) amat mengambil berat tentang inferens yang dibuat oleh guru daripada markah ujian,
tafsiran yang dibuat oleh guru tentang pelajarnya dan akibat daripada inferens dan tafsiran tersebut.
Anda boleh bayangkan kuasa yang dipegang oleh seorang pendidik semasa mereka bentuk ujian.
Ujian anda boleh menentukan masa depan beribu-ribu pelajar. Inferens berdasarkan ujian kesahan
rendah boleh memberikan gambaran yang berbeza tentang kebolehan dan kecekapan sebenar pelajar.
Tiga jenis kesahan telah dikenal pasti: kesahan konstruk, kesahan kandungan dan kesahan berkaitan
kriteria yang terdiri daripada kesahan ramalan dan serentak (rujuk Rajah 8.4).
Sekarang mari kita ketahui lebih lanjut mengenai setiap jenis kesahihan.
Oleh itu, untuk memastikan kesahan konstruk yang tinggi, anda mesti jelas tentang
definisi konstruk yang anda ingin ukur. Sebagai contoh, konstruk seperti pemahaman
bacaan akan merangkumi perkembangan perbendaharaan kata, membaca untuk
makna literal dan membaca untuk makna inferensi. Beberapa pakar dalam
pengukuran pendidikan berpendapat bahawa kesahan konstruk adalah jenis
kesahan yang paling kritikal. Anda boleh mewujudkan kesahan konstruk instrumen
dengan mengaitkannya dengan ujian lain yang mengukur konstruk yang sama.
Sebagai contoh, anda boleh membandingkan markah yang diperoleh pada ujian
pemahaman bacaan anda dengan markah yang diperoleh pada ujian pemahaman
bacaan terkenal lain yang diberikan kepada sampel pelajar yang sama. Jika markah
bagi kedua-dua ujian adalah sangat berkorelasi, maka anda boleh membuat
kesimpulan bahawa ujian kefahaman bacaan anda mempunyai kesahan konstruk yang tinggi.
Sesuatu konstruk ditentukan dengan merujuk kepada teori. Sebagai contoh, jika
anda berminat untuk mengukur konstruk „harga diri‰, anda perlu jelas apa itu
harga diri. Mungkin, anda perlu merujuk kepada literatur dalam bidang yang
menerangkan sifat-sifat harga diri. Anda akan mendapati bahawa secara teorinya,
harga diri dibuat daripada sifat-sifat berikut ÿ harga diri fizikal, harga diri akademik
dan harga diri sosial. Berdasarkan perspektif teori ini, anda boleh membina item
atau soalan untuk mengukur harga diri meliputi ketiga-tiga jenis penghargaan
kendiri ini. Melalui proses sedemikian anda akan lebih pasti untuk memastikan
kesahan konstruk yang tinggi.
Sebagai contoh, unit Sains mengenai „Tenaga dan Daya‰ mungkin termasuk fakta,
konsep, prinsip dan kemahiran tentang cahaya, bunyi, haba, kemagnetan dan elektrik.
Walau bagaimanapun, adalah sukar, jika tidak mustahil, untuk mentadbir kertas dua
hingga tiga jam untuk menguji semua aspek sukatan pelajaran mengenai „Tenaga dan
Daya‰ (rujuk Rajah 8.5). Oleh itu, hanya fakta, konsep, prinsip dan kemahiran terpilih
daripada sukatan pelajaran (atau domain) sahaja yang dijadikan sampel. Kandungan
yang dipilih akan ditentukan oleh pakar kandungan yang akan menilai kaitan kandungan
dalam ujian dengan kandungan dalam sukatan pelajaran atau domain tertentu.
Rajah 8.5: Sampel kandungan yang diuji untuk unit pada „Tenaga dan Daya‰
Kesahan kandungan akan menjadi rendah jika soalan dalam ujian termasuk kandungan
pengujian yang tidak termasuk dalam domain atau sukatan pelajaran. Untuk memastikan
kesahan kandungan dan liputan, kebanyakan guru menggunakan Jadual Spesifikasi
(seperti yang dibincangkan dalam Topik 3). Jadual 8.2 ialah contoh Jadual Spesifikasi
yang menyatakan pengetahuan dan kemahiran yang akan diukur dan topik yang diliputi
untuk unit mengenai „Tenaga dan Daya‰. Anda tidak boleh mengukur semua kandungan
sesuatu topik, oleh itu, anda perlu memberi tumpuan kepada bidang utama dan
memberikan wajaran yang sewajarnya kepada bidang yang penting. Sebagai contoh,
guru telah memutuskan bahawa 64 peratus soalan akan menekankan kepada pemahaman konsep man
36 peratus akan memberi tumpuan kepada aplikasi konsep untuk lima topik. Jadual
Spesifikasi menyediakan bukti kepada guru bahawa sesuatu ujian mempunyai
kesahan kandungan yang tinggi dan ia meliputi perkara yang perlu diliputi.
Cahaya 7 4 11 (22%)
Bunyi 7 4 11 (22%)
Haba 7 4 11 (22%)
Kemagnetan 3 3 6 (11%)
Elektrik 8 3 11 (22%)
JUMLAH 32 (64%) 18 (36%) 50
Kesahan kandungan adalah berbeza daripada kesahan muka yang merujuk kepada
perkara yang kelihatan untuk diukur oleh ujian secara cetek. Kesahan muka menilai
sama ada ujian „kelihatan sah‰ kepada pemeriksa, kakitangan pentadbiran yang
memutuskan penggunaannya dan pemerhati lain yang tidak terlatih secara teknikal.
Kesahan muka adalah ukuran kesahihan yang lemah tetapi itu tidak bermakna ia
tidak betul, cuma perlu berhati-hati. Kepentingannya tidak boleh dipandang remeh.
(i) Kesahan ramalan berkaitan sama ada ujian meramalkan dengan tepat beberapa
prestasi atau keupayaan masa hadapan. Adakah peperiksaan STPM merupakan
peramal yang baik terhadap prestasi di universiti? Satu kesukaran dalam
mengira kesahan ramalan STPM adalah kerana hanya mereka yang lulus
peperiksaan sahaja yang melanjutkan pelajaran ke universiti (secara amnya)
dan kita tidak tahu sejauh mana pelajar yang tidak lulus peperiksaan mungkin
telah melakukan (Wood, 1991). Lebih-lebih lagi, hanya sebahagian kecil
penduduk yang menduduki peperiksaan STPM. Oleh itu, korelasi antara gred
STPM dan prestasi di peringkat ijazah adalah agak tinggi.
(ii) Kesahan serentak mengambil berat tentang sama ada ujian itu berkorelasi dengan, atau
memberikan keputusan yang sama dengan ujian lain dengan kemahiran yang sama.
Sebagai contoh, adakah ujian bahasa akhir tahun anda berkaitan dengan peperiksaan
MUET? Dengan kata lain, jika ujian bahasa anda berkorelasi tinggi dengan MUET,
maka ujian bahasa anda mempunyai kesahan serentak yang tinggi.
SAH
Deale (1975) mencadangkan bahawa untuk menyediakan ujian yang boleh diterima dan boleh
dipercayai, faktor-faktor ini harus diambil kira:
Pusat atau bullseye adalah konsep yang kita cuba ukur. Katakan sebagai contoh, dalam
cuba mengukur konsep „penaakulan induktif‰, anda berkemungkinan besar akan mencapai
titik tengah (atau mata besar) jika ujian penaakulan induktif anda boleh dipercayai dan sah,
yang merupakan matlamat untuk dicapai oleh semua pembangun ujian (lihat Rajah 8.6(d)).
Sebaliknya, ujian penaakulan induktif anda boleh dipercayai tetapi tidak sah.
Bagaimana mungkin? Ujian anda mungkin tidak mengukur penaakulan induktif tetapi skor
yang anda perolehi setiap kali anda mentadbir ujian adalah lebih kurang sama (lihat Rajah
8.6(b)). Dalam erti kata lain, ujian secara konsisten dan sistematik mengukur konstruk yang
salah (itu bukan penaakulan induktif). Bayangkan akibat membuat pertimbangan tentang
penaakulan induktif pelajar menggunakan ujian sedemikian!
Dalam konteks ujian psikologi, jika instrumen tidak mempunyai kebolehpercayaan yang
memuaskan, seseorang biasanya tidak boleh menuntut kesahihan. Kesahan memerlukan
instrumen yang cukup dipercayai. Rajah dalam Rajah 8.6(c) tidak mempunyai kesahan
kerana kebolehpercayaan adalah rendah. Dalam erti kata lain, anda tidak mendapat
anggaran yang sah tentang keupayaan penaakulan induktif pelajar anda kerana mereka tidak konsisten.
Senario kes terburuk ialah apabila ujian tidak boleh dipercayai dan tidak sah (lihat Rajah
8.6(a)). Dalam senario ini, markah yang diperoleh oleh pelajar cenderung untuk menumpukan
pada separuh bahagian atas sasaran dan mereka secara konsisten kehilangan pusat.
Ukuran anda dalam kes ini tidak boleh dipercayai dan tidak sah dan ujian itu harus ditolak
atau diperbaiki.
• Skor sebenar adalah konsep hipotesis tentang keupayaan, kecekapan dan kebolehan sebenar
kapasiti seseorang individu.
• Semakin tinggi kebolehpercayaan dan kesahan ujian anda, semakin besar kemungkinannya
anda akan mengukur markah sebenar pelajar anda.
• Kebolehpercayaan merujuk kepada ketekalan sesuatu ukuran. Sesuatu ujian dianggap boleh dipercayai jika
kita mendapat keputusan yang sama berulang kali.
• Menggunakan teknik ujian-uji semula, ujian yang sama ditadbir sekali lagi kepada kumpulan pelajar yang sama.
• Untuk teknik bentuk selari atau setara, dua ujian (atau bentuk) setara diberikan kepada kumpulan pelajar yang
sama.
• Ketekalan dalaman ditentukan menggunakan hanya satu ujian yang diberikan sekali untuk
pelajar.
• Apabila dua orang atau lebih menanda soalan esei, sejauh mana terdapat persetujuan dalam markah yang
diperuntukkan dipanggil kebolehpercayaan antara penilai.
• Manakala kebolehpercayaan antara penilai melibatkan dua atau lebih individu, intra-penilai
kebolehpercayaan ialah ketekalan penggredan oleh penilai tunggal.
• Kesahan ialah sejauh mana sesuatu ujian mengukur apa yang didakwa untuk diukur. Adalah penting untuk
ujian itu sah agar keputusan dapat digunakan dan ditafsirkan dengan tepat.
• Kesahan konstruk berkaitan sama ada ujian adalah ukuran yang mencukupi bagi konstruk asas.
• Kesahan kandungan lebih mudah dan berkemungkinan berkaitan dengan kesahan konstruk. Ia berkaitan
dengan liputan kandungan yang sesuai dan perlu.
• Sesetengah orang mungkin menganggap kebolehpercayaan dan kesahan sebagai dua konsep yang berasingan. Dalam
realiti, kebolehpercayaan dan kesahan adalah berkaitan.
Topik ÿ Menilai
Bilik Darjah
9 Ujian dan Item
Analisis
HASIL PEMBELAJARAN
Pada akhir topik ini, anda seharusnya dapat:
1. Tentukan analisis item; 2.
Kira indeks kesukaran; 3. Kira indeks
diskriminasi; 4. Menganalisis keberkesanan
distraktor dalam soalan; 5. Bincangkan perkaitan antara indeks
kesukaran dengan
indeks diskriminasi sesuatu item; dan
ÿ PENGENALAN
Apabila anda membangunkan ujian, adalah penting untuk mengenal pasti kekuatan dan
kelemahan setiap item. Dalam erti kata lain, untuk menentukan prestasi item dalam ujian,
beberapa prosedur statistik perlu digunakan.
Dalam topik ini, kita akan membincangkan analisis item yang melibatkan penggunaan tiga
prosedur iaitu kesukaran item, diskriminasi item dan analisis distraktor untuk membantu
pembangun ujian membuat keputusan sama ada item dalam sesuatu ujian boleh diterima,
diubah suai atau ditolak. Prosedur ini agak mudah dan mudah digunakan tetapi pendidik
perlu memahami logik yang mendasari analisis pelajar untuk menggunakannya dengan
betul dan berkesan.
Apakah analisis item? Analisis item ialah satu proses yang mengkaji respons kepada item atau
soalan ujian individu untuk menilai kualiti item tersebut dan ujian secara keseluruhan. Analisis
item amat berharga dalam menambah baik item atau soalan yang akan digunakan semula dalam
ujian nanti. Selain itu, ia juga boleh digunakan untuk menghapuskan item yang samar-samar
atau mengelirukan dalam satu pentadbiran ujian.
Khususnya dalam Teori Ujian Klasik (CTT) statistik yang dihasilkan daripada menganalisis
keputusan ujian berdasarkan markah ujian termasuk ukuran indeks kesukaran dan indeks
diskriminasi. Menganalisis keberkesanan distraktor juga menjadi sebahagian daripada proses.
Kami akan membincangkan setiap komponen analisis item ini secara terperinci kemudian.
Kualiti sesuatu ujian ditentukan oleh kualiti setiap item atau soalan dalam ujian tersebut. Guru
yang membina ujian hanya boleh menganggarkan secara kasar kualiti sesuatu ujian. Anggaran
ini adalah berdasarkan fakta bahawa guru telah mengikuti semua peraturan dan syarat
pembinaan ujian. Walau bagaimanapun, ada kemungkinan bahawa anggaran ini mungkin tidak
tepat dan aspek penting tertentu telah diabaikan. Oleh itu, adalah dicadangkan untuk
mendapatkan pemahaman yang lebih menyeluruh tentang ujian, analisis item perlu dijalankan
ke atas respons pelajar. Analisis item dijalankan untuk mendapatkan maklumat tentang item
atau soalan individu dalam sesuatu ujian dan bagaimana ujian itu boleh diperbaiki. Ia juga
memudahkan pembangunan item atau bank soalan yang boleh digunakan dalam pembinaan
ujian.
Kedua-dua Teori Ujian Klasik (CTT) dan teori ujian moden seperti Teori Tindak Balas Item (IRT)
menyediakan statistik berguna untuk membantu kami menganalisis data ujian.
Untuk banyak analisis item CTT cukup untuk memberikan maklumat yang kami perlukan. Oleh
itu, CTT akan digunakan dalam modul ini.
Mari kita ambil contoh seorang guru yang telah mentadbir ujian objektif aneka pilihan 30 item dalam
geografi kepada 45 pelajar dalam bilik darjah sekolah menengah.
(a) Langkah 1
Jelas sekali, apabila menerima helaian jawapan, langkah pertama ialah menanda setiap helaian
jawapan.
(b) Langkah 2
Susun 45 helaian jawapan daripada markah tertinggi yang diperoleh kepada markah terendah
yang diperoleh. Kertas yang mendapat markah tertinggi berada di atas dan kertas yang mendapat
markah terendah berada di bahagian bawah.
(c) Langkah 3
Darab 45 (bilangan kertas jawapan) dengan 0.27 (atau 27 peratus) iaitu 12.15 dan bundarkan
kepada 12. Penggunaan nilai 0.27 atau 27 peratus adalah tidak fleksibel. Adalah mungkin untuk
menggunakan sebarang peratusan antara 27 hingga 35 peratus sebagai nilai. Bagaimanapun
peraturan 27 peratus boleh diabaikan jika saiz kelas terlalu kecil. Daripada mengambil sampel 27
peratus, bahagikan bilangan kertas jawapan dengan 2.
(d) Langkah 4
Susun longgokan 45 helaian jawapan mengikut markah yang diperolehi (skor tertinggi hingga
markah terendah). Keluarkan 12 helaian jawapan dari bahagian atas longgokan dan 12 helaian
jawapan dari bahagian bawah longgokan. Panggil dua longgokan ini sebagai pelajar „markah
tinggi‰ dan pelajar „markah rendah‰. Ketepikan kumpulan tengah kertas (21 kertas). Walaupun
ini boleh dimasukkan dalam analisis, hanya menggunakan kumpulan tinggi dan rendah
memudahkan prosedur.
(e) Langkah 5
Rujuk Item #1 atau Soalan #1:
(ii) Kira bilangan pelajar daripada kumpulan „markah rendah‰ yang memilih pilihan A, B, C atau
D (rujuk Rajah 9.1).
Daripada analisis, 11 pelajar daripada kumpulan „markah tinggi‰ dan dua pelajar daripada
kumpulan „markah rendah‰ telah memilih „B‰ yang merupakan jawapan yang betul. Ini
bermakna 13 daripada 24 pelajar memilih jawapan yang betul. Juga, ambil perhatian bahawa
semua pengganggu (A, C dan D) telah dipilih oleh sekurang-kurangnya seorang pelajar. Walau
bagaimanapun, maklumat yang diberikan dalam Rajah 9.1 tidak mencukupi dan analisis lanjut perlu dijalankan.
Apakah yang dimaksudkan denganhlm indeks kesukaran () 0.54? Indeks kesukaran ialah pekali
yang menunjukkan peratusan pelajar yang mendapat jawapan yang betul berbanding dengan
jumlah pelajar dalam dua kumpulan yang menjawab. Dalam erti kata lain, 54 peratus pelajar
memilih jawapan yang betul. Walaupun pengiraan kami berdasarkan kumpulan markah tinggi
dan rendah sahaja, ia memberikan anggaran hampir kepada anggaran yang akan diperoleh
dengan jumlah kumpulan. Oleh itu, adalah wajar untuk mengatakan bahawa indeks kesukaran
untuk item ini ialah 54 peratus (untuk kumpulan tertentu ini). Ambil perhatian bahawa,
memandangkan kesukaran merujuk kepada peratusan mendapatkan item dengan betul, semakin
kecil angka peratusan semakin sukar item tersebut. Lien (1980) menyediakan garis panduan
mengenai tafsiran indeks kesukaran seperti berikut (rujuk Rajah 9.2):
Jika seorang guru percaya bahawa pencapaian 0.54 pada item tersebut adalah terlalu rendah,
dia boleh mengubah cara mengajarnya agar lebih memenuhi objektif yang diwakili oleh item
tersebut. Tafsiran lain mungkin adalah item itu terlalu sukar, mengelirukan atau tidak sah, yang
mana guru boleh menggantikan atau mengubah suai item tersebut, mungkin menggunakan
maklumat daripada indeks diskriminasi item atau analisis distraktor.
Di bawah CTT, ukuran kesukaran item hanyalah perkadaran jawapan yang betul daripada pelajar
untuk sesuatu item. Untuk item dengan skor maksimum 2, terdapat sedikit pengubahsuaian pada
pengiraan perkadaran peratusan yang betul.
Item ini mempunyai kemungkinan pemarkahan kredit separa 0, 1 dan 2. Jika jumlah bilangan
pelajar yang mencuba item ini ialah 100 dan 23 pelajar mendapat markah 0, 60 pelajar mendapat
markah 1 dan 17 pelajar mendapat markah 2, maka pengiraan mudah akan menunjukkan
bahawa 23 peratus pelajar mendapat markah 0, 60 peratus pelajar mendapat markah 1 dan 17
peratus pelajar mendapat markah 2 untuk item tertentu ini. Purata markah untuk item ini
hendaklah (0 ÿ 0.23) + (1 ÿ 0.6) + (2 ÿ 0.17) = 0.94.
Maka purata markah yang diperhatikan bagi item ini ialah 0.94 daripada maksimum 2. Jadi purata
perkadaran yang betul ialah 0.94/2 = 0.47 atau 47 peratus.
AKTIVITI 9.1
Seorang guru memberikan ujian sains 20 item kepada sekumpulan 35 pelajar. Yang betul
jawapan untuk Soalan #25 ialah „C‰ dan keputusannya adalah seperti berikut:
Pilihan A B C D kosong
(c) Adakah anda fikir anda perlu menambah baik Soalan #25? kenapa?
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
Perhatikan dalam contoh kami sebelum ini, 11 pelajar dalam kumpulan „markah tinggi‰ dan dua
pelajar dalam kumpulan „markah rendah‰ memilih jawapan yang betul. Ini menunjukkan diskriminasi
positif kerana item tersebut membezakan antara pelajar dengan cara yang sama seperti jumlah markah
ujian. Iaitu, pelajar yang mendapat markah tinggi dalam ujian (kumpulan markah tinggi) mendapat item
yang betul dengan lebih kerap daripada pelajar yang mendapat markah rendah dalam ujian (kumpulan
markah rendah). Walaupun analisis melalui pemeriksaan mungkin semua yang diperlukan untuk
kebanyakan tujuan, indeks diskriminasi boleh dikira dengan mudah menggunakan formula berikut:
RR h ÿ
L
Indeks diskriminasi ÿ
1 T
2
Di mana Rh = Bilangan pelajar dalam kumpulan „markah tinggi‰ (RH) dengan betul
jawab
Contoh:
Satu ujian telah diberikan kepada sekumpulan 43 pelajar dan 10 daripada 13 kumpulan „markah
tinggi‰ mendapat jawapan yang betul berbanding 5 daripada 13 kumpulan „markah rendah‰ yang
mendapat jawapan yang betul. Indeks diskriminasi dikira seperti berikut:
RR
h 10 5
ÿ
L 10 5
ÿ ÿ
D ÿ ÿ ÿÿ
0.38
T 1 ÿ ÿ26 13
12 2
Apakah maksud indeks diskriminasi 0.38? Indeks diskriminasi ialah pekali yang menunjukkan sejauh
mana soalan mendiskriminasi atau membezakan antara pelajar „markah tinggi‰ dan „markah rendah‰
pelajar. Blood and Budd (1972) menyediakan garis panduan berikut mengenai maksud indeks
diskriminasi seperti berikut (rujuk Rajah 9.3):
Soalan yang mempunyai indeks diskriminasi yang tinggi mampu membezakan antara pelajar yang tahu dan
yang tidak tahu jawapannya. Apabila kita mengatakan sesuatu soalan mempunyai indeks diskriminasi yang
rendah, ia tidak dapat membezakan antara pelajar yang tahu dan pelajar yang tidak tahu. Indeks diskriminasi
yang rendah bermakna lebih ramai pelajar „markah rendah‰ mendapat jawapan yang betul kerana soalan
itu terlalu mudah. Ia juga boleh bermakna bahawa pelajar daripada kumpulan „markah tinggi‰ dan kumpulan
„markah rendah‰ mendapat jawapan yang salah kerana soalan itu terlalu sukar.
Formula untuk indeks diskriminasi adalah sedemikian rupa sehingga jika lebih ramai pelajar dalam kumpulan
„markah tinggi‰ memilih jawapan yang betul daripada pelajar dalam kumpulan markah rendah, bilangannya
akan menjadi positif. Sekurang-kurangnya, seseorang akan mengharapkan nilai positif kerana itu akan
menunjukkan bahawa pengetahuan tentang soalan yang mengakibatkan
jawapan yang betul.
(a) Semakin besar nilai positif (semakin hampir kepada 1.0), semakin kukuh hubungan antara prestasi ujian
keseluruhan dan prestasi pada itu
item.
(b) Jika indeks diskriminasi adalah negatif, ini bermakna atas sebab tertentu pelajar yang mendapat markah
rendah dalam ujian lebih berkemungkinan mendapat jawapan yang betul. Ini adalah situasi pelik yang
menunjukkan kesahihan yang lemah untuk item.
AKTIVITI 9.2
Seorang guru memberikan ujian ekonomi 35 item kepada 42 pelajar. Untuk Soalan #16, 8
daripada 11 kumpulan „markah tinggi‰ mendapat jawapan yang betul berbanding 4
daripada 11 daripada kumpulan „markah rendah‰ yang mendapat jawapan yang betul.
(b) Adakah Soalan #16 mempunyai indeks diskriminasi yang tinggi atau rendah? Mewajarkan.
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
Mari kita andaikan bahawa sekumpulan 20 pelajar telah menjawab soalan esei jawapan
pendek dengan markah antara minimum 0 hingga maksimum 4. Jadual 9.1 menyediakan
markah yang diperolehi oleh pelajar.
Jadual 9.1: Skor Diperolehi oleh Pelajar untuk Soalan Esei Jawapan Pendek
Skor Item Bilangan Pelajar Mendapat Setiap Skor Jumlah Markah Diperolehi
4 5 20
3 6 18
2 5 10
1 3 3
0 1 0
Jumlah 51
Indeks kesukaran () itemhlmboleh dikira menggunakan formula berikut seperti yang dicadangkan
oleh Nitko (2004):
ÿ
Purata markah
hlm
Julat skor yang mungkin
Menggunakan maklumat daripada Jadual 9.1, indeks kesukaran soalan esei jawapan
pendek boleh dikira dengan mudah. Purata skor yang diperolehi oleh kumpulan pelajar ialah
2.55, manakala julat skor yang mungkin bagi item tersebut ialah (4 ÿ 0) = 4. Justeru,
2.55
ÿ
hlm
4
ÿ
0.64
Ambil perhatian bahawa dalam mengira indeks kesukaran dalam contoh di atas, markah daripada
keseluruhan kumpulan digunakan untuk mendapatkan skor purata. Walau bagaimanapun, bagi
sekumpulan besar pelajar, adalah mungkin untuk menganggar indeks kesukaran untuk item
berdasarkan hanya sampel pelajar yang terdiri daripada kumpulan „markah tinggi‰ dan „markah
rendah‰ seperti dalam kes pengiraan indeks kesukaran sesuatu soalan aneka pilihan.
Untuk mengira indeks diskriminasi (formula D ) daripada soalan jenis esei, yang berikut
dicadangkan oleh Nitko (2004):
ÿ
D ÿ
Perbezaan antara skor purata kumpulan atas dan bawah
Julat skor yang mungkin
Menggunakan maklumat daripada Jadual 9.1 dan mempersembahkannya dalam format seperti
yang ditunjukkan dalam Jadual 9.2, kita boleh mengira indeks diskriminasi soalan esei jawapan
pendek.
Purata markah yang diperolehi oleh kumpulan atasan pelajar ialah 3.4 manakala kumpulan
bawahan ialah 1.7. Menggunakan formula seperti yang dicadangkan oleh Nitko (2004), kita boleh
mengira indeks diskriminasi bagi soalan esei jawapan pendek seperti berikut:
3.4 1.7
ÿ
D ÿ
4
ÿ
0.43
Indeks diskriminasi (D) 0.43 menunjukkan bahawa soalan jawapan pendek melakukan
diskriminasi antara kumpulan pelajar atas dan bawah dan pada tahap tinggi (rujuk Rajah
9.3.). Seperti dalam pengiraan indeks diskriminasi soalan aneka pilihan untuk sekumpulan
besar pelajar, sampel pelajar yang terdiri daripada 27 peratus teratas dan 27 peratus
terbawah boleh digunakan untuk memberikan anggaran yang baik.
AKTIVITI 9.3
skor 0 1 2 3 4
Bincangkan penemuan dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
Rajah 9.4: Hubungan teori antara indeks kesukaran dan indeks diskriminasi
Sumber: Stanley & Hopkins (1972)
Mengikut model, indeks kesukaran 0.2 boleh menghasilkan indeks diskriminasi kira-kira 0.3
untuk item tertentu (yang boleh digambarkan sebagai item diskriminasi sederhana). Ambil
perhatian bahawa apabila indeks kesukaran meningkat daripada 0.1 kepada 0.5, indeks
diskriminasi meningkat lebih banyak lagi. Apabila indeks kesukaran mencapai 0.5 (diterangkan
sebagai item kesukaran sederhana), indeks diskriminasi adalah positif 1.00 (diskriminasi
sangat tinggi). Menariknya, untuk indeks kesukaran lebih daripada 0.5, indeks diskriminasi
berkurangan. Kenapa jadi begini?
(a) Contohnya, indeks kesukaran 0.9 menghasilkan indeks diskriminasi kira-kira 0.2 yang
digambarkan sebagai item diskriminasi rendah hingga sederhana.
Apakah maksud ini? Lebih mudah soalan, lebih sukar untuk soalan atau item itu
mendiskriminasi antara pelajar yang tahu dan tidak tahu jawapan kepada soalan itu.
(b) Begitu juga, apabila indeks kesukaran adalah kira-kira 0.1, indeks diskriminasi menurun
kepada kira-kira 0.2. Apakah maksud ini? Lebih sukar soalan itu, lebih sukar untuk
soalan atau item itu mendiskriminasi antara pelajar yang tahu dan tidak tahu jawapan
kepada soalan itu.
AKTIVITI 9.4
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
Contoh:
Kuasa Eropah manakah yang menyerang Melaka pada tahun 1511?
Secara amnya, distraktor yang baik mampu menarik lebih ramai pelajar „markah rendah‰ untuk memilih
respons tertentu atau mengalih perhatian „markah rendah‰ pelajar ke arah memilih respons tertentu
tersebut. Apakah yang menentukan keberkesanan distraktor? Dalam Rajah 9.5, seramai 24 orang pelajar
telah memilih pilihan A, B, C dan D untuk soalan tertentu. Pilihan B adalah pengacau yang kurang berkesan
kerana ramai pelajar „markah tinggi‰ (n = 5) memilih pilihan B. Pilihan D agak mengganggu kerana dua
pelajar daripada kumpulan „markah tinggi‰ dan lima pelajar daripada kumpulan „markah rendah‰
memilih pilihan ini. Analisis pilihan respons menunjukkan bahawa mereka yang terlepas item
berkemungkinan sama untuk memilih pilihan B dan pilihan D. Tiada pelajar memilih pilihan C. Oleh
itu, pilihan C tidak bertindak sebagai gangguan. Ini kerana pelajar tidak memilih antara empat pilihan
jawapan pada item ini, mereka benar-benar memilih antara tiga pilihan sahaja kerana mereka tidak
mempertimbangkan pilihan C.
Ini menjadikan meneka dengan betul lebih berkemungkinan, yang menjejaskan kesahihan item.
Indeks diskriminasi boleh diperbaiki dengan mengubah suai dan menambah baik pilihan B dan C.
AKTIVITI 9.5
Jawapannya ialah B.
Kongsi jawapan anda dengan rakan kursus anda dalam forum dalam talian myINSPIRE.
(a) Langkah
1 Susun 30 helaian jawapan daripada markah tertinggi yang diperoleh kepada markah
terendah yang diperoleh.
(b) Langkah 2
Pilih kertas jawapan yang mendapat skor tengah. Kumpulkan semua kertas jawapan di atas
markah ini sebagai „markah tinggi‰ (tandakan „H‰ pada helaian jawapan ini). Kumpulkan
semua kertas jawapan di bawah markah ini sebagai kumpulan „markah rendah‰ (tandakan
„L‰ pada helaian jawapan ini).
(c) Langkah 3
Bahagikan kelas kepada dua kumpulan (tinggi dan rendah) dan edarkan kertas jawapan
„tinggi‰ kepada kumpulan tinggi dan kertas jawapan „rendah‰ kepada kumpulan rendah.
Tugaskan seorang pelajar dalam setiap kumpulan untuk menjadi kaunter.
(d) Langkah 4
Guru kemudian bertanya kepada kelas.
Guru: Jawapan untuk Soalan #1 ialah „C‰ dan mereka yang mendapatnya betul, angkat
tangan.
Kaunter daripada kumpulan „H‰: 14 untuk kumpulan H.
Kaunter daripada kumpulan „L‰: 8 daripada kumpulan L.
(e) Langkah 5
Guru merekodkan jawapan di papan putih seperti berikut:
Soalan #n n n n
(f) Langkah 6
Kira indeks kesukaran untuk Soalan #1 seperti berikut:
RR
HL
ÿ
14 ÿ8
Indeks kesukaran ÿ ÿÿ
0.73
30 30
(g) Langkah 7
Kira indeks diskriminasi untuk Soalan #1 seperti berikut:
RR
HL 14 8 6
ÿ ÿ
Indeks kesukaran ÿ ÿ ÿÿ
0.40
1 15 15
2 30
Perhatikan bahawa sebelum ini, kami mengambil 27 peratus kertas jawapan dalam kumpulan
„markah tinggi‰ dan 27 peratus kertas jawapan dalam kumpulan „markah rendah‰ daripada
jumlah kertas jawapan. Walau bagaimanapun, dalam pendekatan ini kami membahagikan jumlah
kertas jawapan kepada dua kumpulan. Tiada kumpulan pertengahan. Perkara penting ialah
menggunakan sebahagian besar kumpulan yang cukup besar untuk memberikan maklumat yang berguna.
Memilih bahagian atas dan bawah 27 peratus kumpulan disyorkan untuk analisis yang lebih
halus. Kaedah yang ditunjukkan dalam contoh mungkin kurang tepat tetapi ia adalah kaedah
„cepat dan kotor‰.
AKTIVITI 9.6
Terangkan jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
(a) Daripada perbincangan dalam subtopik terdahulu, adalah jelas bahawa hasil analisis item boleh
memberikan jawapan kepada soalan berikut:
(iii) Adakah barang-barang tersebut bebas daripada petunjuk yang tidak berkaitan dan kecacatan lain?
Jawapan kepada soalan sebelumnya boleh digunakan untuk memilih atau menyemak item ujian
untuk kegunaan masa hadapan. Ini akan membantu meningkatkan kualiti item ujian dan kertas
ujian untuk kegunaan masa hadapan. Ia juga menjimatkan masa guru semasa menyediakan
item ujian untuk kegunaan masa hadapan kerana item yang baik boleh disimpan di bank item.
(b) Data analisis item boleh menyediakan asas untuk perbincangan kelas yang cekap tentang keputusan
ujian. Mengetahui sejauh mana keberkesanan setiap item ujian berfungsi dalam mengukur
pencapaian hasil pembelajaran yang dihasratkan dan prestasi pelajar dalam setiap item, guru
boleh mengadakan perbincangan yang lebih berkesan dengan pelajar kerana maklum balas
berdasarkan analisis item adalah lebih objektif dan bermaklumat. Sebagai contoh, guru boleh
menyerlahkan maklumat salah atau salah faham yang dicerminkan dalam pilihan pengganggu
tertentu pada soalan aneka pilihan atau kesilapan yang kerap berulang pada soalan jenis esei,
dengan itu meningkatkan nilai pengajaran penilaian. Jika, semasa perbincangan, analisis item
mendedahkan bahawa terdapat kecacatan teknikal dalam item atau skema pemarkahan, markah
pelajar juga boleh diperbetulkan untuk memastikan ujian yang lebih adil.
(c) Data analisis item boleh digunakan untuk kerja pemulihan. Analisis akan mendedahkan bidang
khusus yang pelajar lemah. Guru boleh menggunakan maklumat untuk memfokuskan kerja
pemulihan secara langsung pada bidang kelemahan tertentu. Sebagai contoh, berdasarkan
analisis distraktor, didapati bahawa distraktor tertentu mempunyai diskriminasi yang rendah
dengan bilangan pelajar yang tinggi daripada kumpulan markah tinggi dan rendah memilih
pilihan. Ini boleh mencadangkan bahawa terdapat beberapa salah faham pada konsep tertentu.
(d) Data analisis item boleh mendedahkan kelemahan dalam pengajaran dan memberikan maklumat
berguna untuk menambah baik pengajaran. Sebagai contoh, walaupun fakta bahawa item dibina
dengan betul, ia mempunyai indeks kesukaran yang rendah, menunjukkan bahawa kebanyakan
pelajar gagal menjawab item tersebut dengan memuaskan. Ini mungkin menunjukkan bahawa
pelajar belum menguasai kandungan sukatan pelajaran tertentu yang sedang dinilai. Ini mungkin
disebabkan oleh kelemahan dalam pengajaran dan oleh itu memerlukan pelaksanaan strategi
pengajaran yang lebih berkesan oleh guru. Tambahan pula, jika item itu berulang kali sukar
untuk pelajar, mungkin terdapat keperluan untuk menyemak semula kurikulum.
(e) Prosedur analisis item menyediakan asas kepada guru untuk meningkatkan
kemahiran mereka dalam pembinaan ujian. Semasa guru menganalisis tindak
balas pelajar terhadap item, mereka menyedari tentang kecacatan item dan
apa yang menyebabkannya. Apabila menyemak item, mereka mendapat
pengalaman dalam menyusun semula penyataan supaya lebih jelas, menulis
semula gangguan supaya lebih munasabah dan mengubah suai item supaya
berada pada tahap kesukaran yang lebih sesuai. Hasilnya, guru meningkatkan
kemahiran membina ujian mereka.
(a) Kuasa mendiskriminasi item tidak menunjukkan kesahihan item. Indeks diskriminasi
yang tinggi hanya menunjukkan bahawa pelajar dari kumpulan markah tinggi
menunjukkan prestasi yang lebih baik berbanding pelajar dari kumpulan markah
rendah. Pembahagian kumpulan markah tinggi dan markah rendah adalah
berdasarkan jumlah markah ujian yang diperolehi oleh setiap pelajar, yang merupakan
kriteria dalaman. Dengan menggunakan kriteria dalaman jumlah markah ujian,
analisis item menawarkan bukti mengenai ketekalan dalaman ujian dan bukannya
kesahihannya. Kesahan sesuatu ujian perlu dinilai menggunakan kriteria luaran, iaitu
sejauh mana ujian itu menilai hasil pembelajaran yang dimaksudkan.
(b) Indeks diskriminasi tidak selalunya merupakan penunjuk kualiti item. Sebagai contoh,
indeks kuasa diskriminasi yang rendah tidak semestinya menunjukkan item yang
rosak. Jika sesuatu item tidak mendiskriminasi tetapi ia didapati bebas daripada
kesamaran dan kecacatan teknikal lain, item tersebut hendaklah disimpan
terutamanya dalam ujian rujukan kriteria. Dalam ujian sedemikian, item tanpa
diskriminasi mungkin mencadangkan bahawa semua pelajar telah mencapai kriteria
yang ditetapkan oleh guru. Oleh yang demikian, item tersebut tidak membezakan
antara pelajar yang baik dan lemah. Satu lagi sebab yang mungkin mengapa
diskriminasi rendah berlaku untuk item ialah item itu mungkin sama ada sangat
mudah atau sangat sukar. Kadangkala, item ini perlu atau wajar disimpan untuk mengukur a
sampel yang mewakili hasil pembelajaran dan kandungan kursus. Selain itu, ujian
pencapaian biasanya direka untuk mengukur beberapa jenis hasil pembelajaran
(pengetahuan, pemahaman, aplikasi dan sebagainya). Dalam kes sedemikian, akan
terdapat hasil pembelajaran yang dinilai oleh item ujian yang lebih sedikit dan item ini
akan mempunyai diskriminasi yang rendah kerana ia mempunyai kurang perwakilan
dalam jumlah markah ujian. Mengeluarkan item ini daripada ujian adalah tidak
digalakkan kerana ia akan menjejaskan kesahan ujian.
(c) Jenis data analisis item tradisional ini adalah tentatif. Ia tidak tetap tetapi dipengaruhi oleh
jenis dan bilangan pelajar yang diuji dan prosedur pengajaran yang digunakan. Data
itu akan berubah dengan setiap pentadbiran item ujian yang sama. Oleh itu, jika
penggunaan item berulang mungkin, analisis item perlu dijalankan untuk setiap
pentadbiran setiap item. Oleh itu sifat tentatif analisis item harus diambil serius dan
hasilnya ditafsirkan dengan berhati-hati.
Bank item terdiri daripada soalan yang telah dianalisis dan disimpan kerana ia adalah item
yang baik. Setiap item yang disimpan akan mempunyai maklumat tentang indeks kesukaran
dan indeks diskriminasinya. Setiap item disimpan mengikut apa yang diukur terutamanya
berkaitan dengan topik kurikulum. Item ini akan disimpan dalam bentuk Jadual Spesifikasi
yang menunjukkan kandungan yang diukur serta tahap kognitif yang diukur. Contohnya, dari
bank item, anda akan dapat melukis item yang mengukur aplikasi konsep untuk topik
„Elektrik‰.
Anda juga akan dapat menarik item dari bank dengan tahap kesukaran yang berbeza.
Mungkin, anda ingin menyusun soalan yang lebih mudah pada permulaan ujian untuk
membina keyakinan dalam diri pelajar dan secara beransur-ansur memperkenalkan soalan
yang semakin sukar.
Dengan pangkalan data berkomputer, bank item mudah diakses. Guru akan mempunyai beratus-
ratus item yang mereka boleh gunakan semasa membangunkan ujian bilik darjah. Ini sudah tentu
akan membantu guru dengan tugas yang membosankan dan memakan masa untuk membina
item atau soalan dari awal.
Malangnya, tidak banyak institusi pendidikan yang dilengkapi dengan bank item sedemikian.
Amalan yang lebih biasa ialah guru memilih item atau soalan daripada buku kerja yang disediakan
secara komersial, kertas peperiksaan lepas dan item sampel daripada buku teks. Sumber-sumber
ini tidak mempunyai maklumat tentang indeks kesukaran dan indeks diskriminasi item atau
maklumat tentang tahap kognitif soalan atau perkara yang mereka ingin ukur. Guru perlu
memikirkan sendiri ciri-ciri item berdasarkan pengalaman mereka dalam mengajar kandungan.
Walau bagaimanapun, terdapat beberapa isu berkaitan dengan penggunaan bank item. Salah
satu kebimbangan utama bank item ialah cara meletakkan item ujian berbeza yang dikumpul dari
semasa ke semasa pada skala yang sama. Skala hendaklah menunjukkan kesukaran item, satu
skala bagi setiap perkara. Pengambilan semula barang dari bank menjadi mudah apabila semua
item diletakkan pada skala yang sama.
Orang yang bertanggungjawab juga mesti berusaha sedaya upaya untuk menambah hanya item
berkualiti pada kumpulan item. Untuk membangun dan mengekalkan bank item yang baik
memerlukan banyak persediaan, perancangan, kepakaran dan organisasi. Walaupun pendekatan
Item Response Theory (IRT) bukanlah ubat untuk semua masalah perbankan item, banyak isu ini
boleh diselesaikan.
Teori Ujian Klasik (CTT) ialah pendekatan kepada analisis psikometrik yang mempunyai andaian
yang lebih lemah daripada Teori Tindak Balas Item (IRT) dan lebih sesuai untuk saiz sampel yang
lebih kecil. Di bawah CTT, markah ujian mentah pelajar adalah jumlah markah yang diterima pada
item dalam ujian. Sebagai contoh, Iteman ialah program komersial manakala TAP ialah program
percuma untuk analisis klasik.
IRT ialah pendekatan psikometrik yang menganggap bahawa kebarangkalian tindak balas tertentu
adalah fungsi langsung sifat atau sifat asas. Di bawah IRT, kebimbangan adalah sama ada pelajar
memperoleh setiap item dengan betul atau tidak, dan bukannya skor ujian mentah. Konsep asas
IRT adalah mengenai item ujian individu dan bukannya tentang markah ujian. Sifat atau kebolehan
dan ciri-ciri item pelajar dirujuk kepada skala yang sama. Sebagai contoh, ConQuest ialah program
komputer untuk respons item dan model regresi terpendam dan TAM ialah pakej R untuk model
respons item.
• Analisis item ialah satu proses yang mengkaji tindak balas kepada item ujian individu atau soalan
untuk menilai kualiti item tersebut dan ujian secara keseluruhan.
• Analisis item dijalankan untuk mendapatkan maklumat tentang item individu atau
soalan dalam ujian dan bagaimana ujian itu boleh diperbaiki.
• Indeks kesukaran adalah penunjuk kuantitatif berkaitan dengan tahap kesukaran item atau soalan
individu.
• Indeks diskriminasi ialah ukuran asas yang menunjukkan sejauh mana sesuatu soalan
mendiskriminasi atau membezakan antara pelajar dalam kumpulan „markah tinggi‰ dan
kumpulan „markah rendah‰.
• Secara teorinya, lebih sukar soalan (atau item) atau lebih mudah soalan (atau item), semakin
rendah indeks diskriminasi.
• Dengan mengira nisbah pelajar yang memilih setiap pilihan jawapan, guru boleh mengenal pasti
distraktor yang "berfungsi" dan kelihatan menarik kepada pelajar yang tidak tahu jawapan yang
betul dan distraktor yang hanya mengambil ruang dan tidak dipilih oleh ramai pelajar.
• Secara umumnya, distraktor yang baik mampu menarik lebih ramai pelajar „markah rendah‰ untuk
memilih respons tertentu atau mengalih perhatian „markah rendah‰ pelajar ke arah memilih
respons tertentu tersebut.
• Bank item terdiri daripada soalan yang telah dianalisis dan disimpan kerana ia adalah item yang
baik.
HASIL PEMBELAJARAN
Pada akhir topik ini, anda seharusnya dapat:
1. Kira pelbagai ukuran kecenderungan memusat;
2. Menerangkan penggunaan skor standard; 3. Kira
skor z dan skor T; 4. Huraikan ciri-ciri lengkung
normal; dan
5. Jelaskan peranan norma dalam ujian piawai.
ÿ PENGENALAN
Semua data yang telah anda kumpulkan mengenai prestasi pelajar perlu dianalisis.
Dalam topik ini kami akan memberi tumpuan kepada analisis dan tafsiran data yang
telah anda kumpulkan tentang pengetahuan, kemahiran dan sikap pelajar anda.
Anda menganalisis dan mentafsir maklumat yang telah anda kumpulkan tentang
pelajar anda secara kuantitatif dan kualitatif. Untuk analisis kuantitatif data, pelbagai
alat statistik digunakan, yang akan kami fokuskan dalam topik ini. Sebagai contoh,
statistik digunakan untuk menunjukkan taburan markah pada ujian Geografi dan
purata markah yang diperoleh oleh pelajar.
Apabila anda mentadbir ujian Geografi kepada kelas anda yang terdiri daripada 40 pelajar pada
akhir semester, anda akan memperoleh markah untuk setiap pelajar yang merupakan ukuran
sampel keupayaan pelajar. Tingkah laku yang diuji boleh menjadi keupayaan untuk menyelesaikan
masalah seperti membaca peta, glob dan tafsiran graf. Sebagai contoh, pelajar A mendapat
markah 64 manakala pelajar B mendapat 32. Adakah ini bermakna keupayaan pelajar A lebih
baik daripada pelajar B? Adakah ia bermakna keupayaan pelajar A adalah dua kali ganda
keupayaan pelajar B? Adakah markah 64 dan 32 dalam peratusan? Markah atau markah ini
sukar untuk ditafsir kerana ia adalah skor mentah. Skor mentah boleh mengelirukan jika tiada
rujukan dibuat kepada „unit‰. Ia hanya logik bahawa anda menukar markah kepada unit seperti
peratusan. Dalam contoh ini, anda mendapat 64 peratus dan 32 peratus.
Malah penggunaan peratusan mungkin tidak bermakna. Sebagai contoh, mendapat 64 peratus
dalam ujian mungkin dianggap „baik‰ jika ujian itu merupakan ujian yang sukar. Sebaliknya, jika
ujian itu mudah, maka 64 peratus boleh dianggap sebagai hanya „purata‰. Dengan kata lain,
untuk mendapatkan gambaran yang lebih tepat tentang markah yang diperoleh oleh pelajar
dalam ujian, guru hendaklah:
(a) Ketahui pelajar manakah yang memperoleh markah tertinggi dalam kelas dan
bilangan soalan yang dijawab dengan betul;
(b) Ketahui pelajar manakah yang mendapat markah terendah dalam kelas dan bilangan soalan
yang dijawab dengan betul; dan
(c) Ketahui bilangan soalan yang dijawab dengan betul oleh semua pelajar dalam
kelas.
Ini menggambarkan bahawa markah yang diperoleh oleh pelajar dalam sesuatu ujian perlu diteliti
dengan teliti. Tidak memadai dengan hanya melaporkan markah yang diperolehi. Maklumat lanjut
perlu diberikan tentang markah yang diperoleh dan untuk melakukan ini anda perlu bergantung
pada statistik. Sesetengah guru mungkin takut dengan statistik manakala yang lain mungkin
menganggapnya sebagai terlalu memakan masa. Malah, ramai di antara kita sering menggunakan
statistik tanpa disedari. Sebagai contoh, apabila kita bercakap tentang purata hujan, pendapatan
per kapita, kadar faedah dan peratusan peningkatan dalam kehidupan seharian kita, kita bercakap
bahasa statistik. Apakah statistik?
Statistik ialah sains matematik yang berkaitan dengan analisis, tafsiran dan
pembentangan data. Ia boleh digunakan untuk pelbagai disiplin akademik daripada
sains fizikal dan sosial kepada kemanusiaan. Statistik telah digunakan secara meluas
oleh penyelidik dalam pendidikan dan guru bilik darjah. Dalam mengaplikasikan statistik
dalam pendidikan, seseorang itu bermula dengan populasi yang hendak dikaji. Contoh
ini boleh jadi semua pelajar Tingkatan Dua di Malaysia iaitu kira-kira 450,000 pelajar
atau semua guru sekolah menengah di negara ini. Atas sebab praktikal, daripada
menyusun data tentang keseluruhan populasi, kami biasanya memilih atau melukis
subset populasi yang dipanggil sampel. Dengan kata lain, 40 orang pelajar Tingkatan
Dua yang anda ajar adalah sampel populasi pelajar Tingkatan Dua di negara ini. Data
yang anda kumpulkan tentang pelajar dalam kelas anda boleh tertakluk kepada analisis
statistik yang mempunyai dua tujuan yang berkaitan, iaitu deskriptif dan inferens.
Andaikan anda baru sahaja memberikan ujian Bahasa Malaysia kepada kelas 35 pelajar
Tingkatan Satu. Selepas menandakan skrip, anda mempunyai satu set markah untuk setiap
pelajar dalam kelas dan anda ingin mengetahui lebih lanjut tentang prestasi pelajar anda.
Rajah 10.1 menunjukkan taburan markah yang diperoleh oleh pelajar dalam ujian tersebut.
Lajur „frekuensi‰ menunjukkan bilangan pelajar yang mendapat markah bagi setiap markah
yang ditunjukkan dan peratusan ditunjukkan dalam lajur „peratusan‰. Anda boleh
menerangkan skor ini menggunakan dua jenis ukuran, iaitu kecenderungan memusat dan serakan.
(saya maksudkan
Min ÿ
ÿ x 35 41 42 ÿÿÿ
ÿ
ÿÿ 75 2148 ÿ
ÿ
53.22
N 35 40
(ii) Median
Median ditentukan dengan menyusun skor yang diperolehi daripada nilai terendah
kepada nilai tertinggi dan mengambil skor yang berada di tengah-tengah urutan.
Untuk contoh dalam Rajah 10.1, median ialah 52. Terdapat 17 pelajar dengan markah
kurang daripada 52 dan 17 pelajar yang markahnya lebih daripada 52. Jika terdapat
bilangan pelajar genap, tidak akan ada satu mata pun di tengah. . Dalam kes ini, anda
mengira median dengan mengambil min dua titik tengah, iaitu membahagikan jumlah dua
markah dengan 2.
(iii) Mod
Mod ialah skor yang paling kerap berlaku dalam set data. Objek manakah yang paling
kerap muncul dalam set data anda? Dalam Rajah 10.1, mod ialah 57 kerana 7 orang
pelajar memperoleh markah tersebut. Walau bagaimanapun, anda juga boleh
mempunyai lebih daripada satu mod. Jika anda mempunyai dua mod ia adalah bimodal.
(b) Sebaran
Walaupun min memberitahu kita tentang prestasi purata kumpulan, ia tidak
memberitahu kita berapa hampir dengan purata atau min markah pelajar. Sebagai
contoh, adakah setiap pelajar mendapat markah 80 peratus dalam ujian atau adakah
markah tersebar dari 0 hingga 100 peratus? Serakan ialah pengagihan markah.
Antara ukuran yang digunakan untuk menggambarkan sebaran ialah julat dan sisihan piawai.
Rajah 10.3: Markah dalam ujian Sains yang diperolehi oleh 10 orang pelajar
Berdasarkan skor mentah, anda boleh mengira sisihan piawai menggunakan formula yang diberikan
dalam berikut.
ÿx x ÿ2 153
ÿ
Sisihan piawai ÿ ÿÿ
ÿ N ÿ
1 9
17
ÿ
4.12
(a) Langkah pertama dalam mengira sisihan piawai ialah mencari min yang
ialah 390 dibahagikan dengan 10 = 39.
(b) Seterusnya ialah menolak min daripada setiap markah dalam lajur yang berlabel x ÿ
x.
(c) Ini diikuti dengan pengiraan dalam lajur di sebelah kanan berlabel ( ).
2
x x
ÿ
Ambil perhatian bahawa semua nombor dalam lajur ini adalah positif. Perbezaan
kuasa dua kemudiannya dijumlahkan dan punca kuasa dua dikira.
(c) Sisihan piawai ialah 4.12, iaitu punca kuasa dua positif bagi 153
dibahagikan dengan 9.
Untuk lebih memahami maksud sisihan piawai, rujuk Rajah 10.4 yang menunjukkan
sebaran skor dengan min yang sama tetapi sisihan piawai yang berbeza.
(b) Bagi Kelas B, dengan sisihan piawai 2, kira-kira 68% (1 sisihan piawai) pelajar
mendapat markah antara 37 dan 41.
Ambil perhatian bahawa lebih kecil sisihan piawai, lebih besar skor cenderung untuk „kumpulan‰
di sekitar min dan sebaliknya. Oleh itu, tidak cukup untuk hanya meneliti min sahaja kerana sisihan
piawai banyak memberitahu kita tentang sebaran skor di sekitar min. Kelas mana yang anda fikir
berprestasi lebih baik? Min tidak memberitahu kami kelas mana yang berprestasi lebih baik. Kelas
C menunjukkan prestasi terbaik kerana lebih kurang dua pertiga 2
( ) 3daripada pelajar mendapat markah antara 38 dan 40.
AKTIVITI 10.1
Kongsi jawapan anda dengan rakan kursus anda dalam myINSPIRE dalam talian
forum.
Skew
Skew merujuk kepada simetri taburan. Sesuatu pengedaran condong jika salah satu ekornya lebih
panjang daripada yang lain. Rujuk Rajah 10.5 yang menunjukkan taburan markah yang diperolehi
oleh 38 orang pelajar dalam ujian Sejarah. Terdapat kecondongan negatif
kerana ia mempunyai ekor yang lebih panjang ke arah negatif. Apakah maksudnya? Ini bermakna
lebih ramai pelajar mendapat markah tinggi dalam ujian sejarah yang mungkin menunjukkan
bahawa ujian itu terlalu mudah atau kaedah dan bahan pengajaran berjaya menghasilkan hasil
pembelajaran yang diinginkan.
Rajah 10.6 menggambarkan taburan markah yang diperolehi oleh 38 orang pelajar
dalam ujian Biologi. Terdapat pencongan positif kerana ia mempunyai ekor yang
lebih panjang ke arah positif. Apakah maksudnya? Ini bermakna lebih ramai pelajar
mendapat markah rendah dalam ujian Biologi yang menunjukkan ujian itu terlalu
sukar. Sebagai alternatif, ia juga boleh bermakna soalan tidak jelas atau kaedah dan
bahan pengajaran tidak membawa hasil pembelajaran yang diinginkan.
AKTIVITI 10.2
(a) Min;
(b) Median;
Dengan hanya markah mentah, apakah yang boleh anda katakan tentang prestasi Zulinda dalam
ujian ini atau kedudukannya dalam kelas? Nah, sebenarnya tidak sangat. Tanpa mengetahui
bagaimana skor mentah ini dibandingkan dengan jumlah taburan markah mentah untuk setiap
mata pelajaran, adalah sukar untuk membuat sebarang kesimpulan yang bermakna mengenai
prestasi relatifnya dalam setiap ujian ini.
(a) Andaikan bahawa markah ketiga-tiga ujian adalah lebih kurang normal
diedarkan.
(b) Min dan sisihan piawai bagi tiga ujian adalah seperti berikut:
Berdasarkan maklumat tambahan, apakah kenyataan yang boleh anda buat mengenai prestasi
relatif Zulinda dalam setiap tiga ujian? Berikut adalah beberapa kesimpulan yang boleh anda buat:
(a) Zulinda mendapat markah terbaik dalam ujian Sejarah dan markah mentahnya 72 jatuh pada
titik satu sisihan piawai di atas min;
(b) Markah terbaiknya yang seterusnya ialah bahasa Inggeris dan skor mentahnya 40 jatuh tepat
pada min taburan markah; dan
(c) Akhirnya, walaupun markah mentahnya untuk Sains ialah 80, ia jatuh satu standard
sisihan di bawah min.
Markah mentah, seperti skor ZulindaÊs, boleh ditukar kepada dua jenis skor standard iaitu skor
Z dan skor T.
(a) Skor-Z
Menukarkan skor mentah Zulinda kepada „z-skor‰, kita boleh mengatakan bahawa dia
mencapai:
Apakah skor z? Bagaimanakah anda mengira skor z? Skor z ialah sejenis skor standard.
Istilah skor piawai ialah nama umum untuk menukar skor mentah kepada skala lain
menggunakan min yang telah ditentukan dan sisihan piawai yang telah ditetapkan. Skor-Z
memberitahu berapa banyak sisihan piawai dari min skor itu terletak. Skor Z boleh positif
atau negatif. Skor z positif menunjukkan bahawa nilai berada di atas min manakala skor z
negatif menunjukkan bahawa nilai berada di bawah min. Skor ialah skor mentah yang
telah diubah atau ditukar kepada skala dengan min yang piawai
telah ditetapkan
yang telah0ditetapkan
dan sisihandengan-
Formula yang digunakan untuk menukar skor mentah kepada skor-z melibatkan penolakan
min daripada skor mentah dan membahagikannya dengan sisihan piawai.
x ÿ
x
ÿ
Dengan
SD
Mari kita gunakan formula ini untuk menukar markah KumarÊs sebanyak 52 yang
diperolehi dalam ujian Geografi. Min bagi ujian itu ialah 70 dan sisihan piawai ialah 7.5.
x ÿ
x 52 70 18
ÿ ÿ
Dengan
ÿ ÿ ÿ ÿÿ
2.4
SD 7.5 7.5
Skor z yang dikira untuk skor mentah 52 ialah ÿ2.4 yang bermaksud bahawa skor Kumar
untuk ujian Geografi terletak 2.4 sisihan piawai di bawah min.
Ujian 1 Ujian 2
Seng Huat 30 50
Mei Ling 45 35
Min 42 47
Sisihan piawai 7 8
Guru boleh menggunakan min untuk menentukan siapa yang lebih baik. Tetapi kedua-dua pelajar
mempunyai min yang sama. Bagaimana guru membuat keputusan? Dengan menggunakan skor-z,
guru boleh mengetahui sejauh mana skor kedua-dua pelajar itu daripada min dan dengan itu siapa
yang berprestasi lebih baik. Menggunakan formula di atas, guru mengira skor z yang ditunjukkan
dalam perkara berikut:
30 42 ÿ
50 47
ÿ
Seng Huat
ÿ
1.71 ÿ
0.375 ÿ1.34
7 8
45 42
ÿ
35 72 ÿ
Mei Ling
ÿ
0.43 ÿ
1.50 ÿ1.07
7 8
Setelah meneliti maklumat dalam jadual, guru mendapati kedua-dua Seng Huat dan Mei Ling
mempunyai skor z negatif untuk jumlah kedua-dua ujian.
Walau bagaimanapun, Mei Ling mempunyai jumlah z-skor yang lebih tinggi (ÿ1.07) berbanding
dengan jumlah z-skor Seng HuatÊs (ÿ1.34). Dalam erti kata lain, jumlah skor Mei LingÊ lebih
hampir kepada min dan oleh itu guru membuat kesimpulan bahawa Mei Ling melakukan lebih baik
daripada Seng Huat.
Skor Z agak mudah digunakan tetapi ramai pendidik enggan menggunakannya terutamanya
apabila markah ujian dilaporkan sebagai nombor negatif. Bagaimanakah anda mahu skor Matematik
anda dilaporkan sebagai ÿ4? Atas sebab ini, kaedah skor standard alternatif digunakan seperti
skor T.
(b) Skor-T
Skor-T telah dibangunkan oleh W. McCall pada tahun 1920-an dan merupakan salah
satu daripada banyak markah standard yang sedang digunakan. Skor-T digunakan
secara meluas dalam psikologi dan pendidikan terutamanya apabila melaporkan prestasi
dalam ujian piawai. Skor T ialah skor piawai dengan min 50 dan sisihan piawai 10.
Formula untuk mengira skor T ialah:
T = 10(z) + 50
Katakan sebagai contoh, pelajar mempunyai skor z ÿ1.0 dan untuk menukarnya kepada skor T:
ÿ
ÿ ÿ ÿ50
T 10(z) 50 10( 1.0) ÿ ÿÿ ÿ 50
( 10)
ÿ
40
Apabila menukar z-skor kepada T-skor, anda harus berhati-hati untuk tidak menjatuhkan
negatif. Menggugurkan negatif akan menghasilkan skor yang sama sekali berbeza.
AKTIVITI 10.3
z-skor T-skor
+1.0
ÿ2.4
+1.8
Terangkan jawapan anda kepada rakan kursus anda dalam forum dalam talian
myINSPIRE.
Rajah 10.7 menunjukkan keluk taburan normal bagi IQ berdasarkan Skala Kepintaran
Wechsler untuk kanak-kanak. Dalam taburan normal, kira-kira dua pertiga (ÿ) individu
akan mempunyai IQ antara 85 dan 115 dengan min 100. Menurut American
Association of Mental Retardation (2006), individu yang mempunyai IQ kurang
daripada 70 boleh diklasifikasikan sebagai terencat akal atau cacat mental dan mereka
yang mempunyai IQ lebih daripada 130 boleh dianggap sebagai berbakat.
Rajah 10.7: Keluk taburan normal IQ berdasarkan Skala Kepintaran Wechsler untuk
kanak-kanak
Begitu juga, markah ujian yang mengukur ciri tertentu seperti kecekapan bahasa,
keupayaan kuantitatif atau literasi saintifik populasi tertentu boleh dijangka
menghasilkan lengkung normal. Lengkung normal dibahagikan mengikut sisihan
piawai (seperti ÿ4s, ÿ3s ÿÿ +3s dan 4s) yang ditunjukkan pada paksi mendatar. Luas
lengkung antara sisihan piawai ditunjukkan
sebagai peratusan pada rajah. Sebagai contoh, kawasan antara min dan sisihan piawai +1 ialah
34.13%. Begitu juga, luas antara min dan sisihan piawai ÿ1 juga 34.13%. Oleh itu, kawasan
antara sisihan piawai ÿ1 dan sisihan piawai +1 ialah 68.26%. Ini bermakna dalam taburan normal,
68.26% individu akan mendapat markah antara sisihan piawai ÿ1 dan +1.
Dalam menggunakan lengkung normal, adalah penting untuk membuat perbezaan antara nilai
sisihan piawai dan skor sisihan piawai. Nilai sisihan piawai ialah pemalar dan ditunjukkan pada
paksi mengufuk dalam Rajah 10.7. Sebaliknya, skor sisihan piawai ialah skor yang diperoleh
apabila kita menggunakan formula sisihan piawai (yang kita bincangkan sebelum ini). Sebagai
contoh, jika kita memperoleh sisihan piawai bersamaan dengan 5, maka skor untuk 1 sisihan
piawai ialah 5 dan skor untuk 2 sisihan piawai ialah 10, skor untuk 3 sisihan piawai ialah 15 dan
seterusnya.
Nilai sisihan piawai ÿ1, ÿ2, dan ÿ3 akan mempunyai skor negatif sepadan ÿ5, ÿ10 dan ÿ15.
Ambil perhatian bahawa dalam Rajah 10.7, skor-z ditunjukkan daripada + 1 hingga + 4 dan ÿ1
hingga ÿ4 dengan min sebagai 0. Setiap selang adalah sama dengan satu sisihan piawai. Begitu
juga, skor-T dilaporkan dari 10 hingga 90 (selang 10) dengan min ditetapkan pada 50. Setiap
selang 10 adalah sama dengan satu sisihan piawai.
ÿ Istilah „kecenderungan pusat‰ merujuk kepada nilai „tengah‰ dan diukur menggunakan min,
median dan mod. Ia adalah petunjuk lokasi
markah.
ÿ Min hanyalah jumlah semua nilai (markah) dibahagikan dengan jumlah item (pelajar) dalam set.
• Median ditentukan dengan menyusun skor yang diperoleh daripada nilai terendah kepada nilai
tertinggi dan mengambil skor yang berada di tengah-tengah urutan.
• Mod adalah skor yang paling kerap berlaku dalam set data.
ÿ Julat markah dalam sesuatu ujian ialah jarak antara markah terendah dengan markah tertinggi
yang diperolehi dalam ujian.
ÿ Sisihan piawai merujuk kepada berapa banyak skor yang diperoleh pelajar menyimpang atau
menangguhkan daripada min.
ÿ Skew merujuk kepada simetri taburan. Sesuatu pengedaran condong jika salah satu ekornya
lebih panjang daripada yang lain.
ÿ Skor standard merujuk kepada skor mentah yang telah ditukar daripada satu skala
ke skala lain menggunakan min dan sisihan piawai.
ÿ Lengkung normal (juga dipanggil „lengkung loceng‰) ialah lengkung hipotetikal yang sepatutnya
mewakili semua fenomena semula jadi.
Penyerakan Julat
Mod T-skor
Keluk biasa
ÿ JAWAPAN 221
Rujukan
ASCD. (2017). Cara mencipta dan menggunakan rubrik untuk penilaian formatif. kepada Diambil semula
Blank, W., & Harwell, S. (1997). Menghubungkan sekolah menengah dengan dunia sebenar.
Perkhidmatan Pengeluaran Semula Dokumen ERIC No. ED407586 kosong.
Brookhart, SM (1999). Seni dan sains penilaian bilik darjah: Bahagian pedagogi yang hilang.
Laporan Pengajian Tinggi ASHE-ERIC (Jilid 27, No. 1).
Washington, DC: Universiti George Washington, Siswazah. Pusat Pengajian Pendidikan dan
Pembangunan Insan.
Cashin, KAMI (2014). Menambah baik ujian esei . Amerika Syarikat: Universiti Negeri Kansas.
Diperoleh daripada http://www.idea.ksu.edu/papers/Idea_Paper_17.pdf
222 ÿ RUJUKAN
Connie Malamed. (2016). Menulis soalan aneka pilihan untuk susunan yang lebih tinggi
berfikir. Diperoleh
daripada http://theelearningcoach.com/elearning_design/multiple-choice
questions/
Grams, B.F. (1981). Peraturan membina soalan esei . NY: Holt, Rinehart &
Winstoo. Diperoleh daripada
http://www.personal.psu.edu/faculty/s/r/sra113/602/essayexams.htm
Griffith, K., & Nguyen, A. (2005). Adakah pendidik bersedia mempengaruhiafektif kepada
domain? Diperoleh daripada
www.nationalforum.com/Jumlah Jurnal Elektronik/Griffith, Kimberly G
RUJUKAN ÿ 223
Huitt, W. (2004). mekar dan al.Ês taksonomi domain kognitif. Psikologi pendidikan interaktif.
Valdosta, GA: Universiti Negeri Valdosta. Diperoleh daripada
http://chiron.valdosta.edu/whuitt/col/cogsys/bloom.html
.
Analisis item untuk item aneka pilihanERIC Digest. Diperoleh daripada
http://www.eric.ed.gov/ERICDocs/data/ericdocs2/content_storage_01/0
000000b/80/2a/26/4c.pdf
Kemp, J., & Teperof, D. (nd). Garis panduan untuk penilaian portfolio . Diambil semula
daripada http://www.anglit.net/main/portfolio/default.html
Kohn, A. (2006). Masalah dengan rubrik. tidak. 4. Jurnal Bahasa Inggeris Mac 2006. Jld. 95,
Lewis, T. (1916). Kegunaan Ujian Kecerdasan. Pertama kali diterbitkan dalam The
pengukuran kecerdasan
daripada (bab 1). Boston, MA: Houghton Mifflin.
Diperoleh daripada http://psychclassics.yorku.ca/Terman/terman1.htm
Lin, RL, & Gronlund, NE (2000). Pengukuran dan penilaian dalam pengajaran.
New Jersey: Prentice Hall.
224 ÿ RUJUKAN
Linquist, EF (1951). Pertimbangan Awal dalam Pembinaan Ujian Objektif. (ms. 4ÿ22).
Dalam EF Linquist (Ed.). Pengukuran Pendidikan Washington
DC. Majlis Pendidikan Amerika.
Pennekamp, M. (nd). Panduan tingkah laku dan arahan bilik darjah . Diambil semula
daripada http://www.humboldt.edu/~tha1/observ.html
Phillips, JA, Ansary Ahmed, & Kuldip Kaur. (2005). Reka bentuk
prinsip pengajaran pembangunan kursus siswazah e-pembelajaran.Kertasdalam
kerja dibentangkan di The International Conference in E-Learning. Bangkok,
Thailand.
RUJUKAN ÿ 225
Stanley, G., & Hopkins, D. (1972). Pengenalan pengukuran pendidikan dan kepada
ujian. Boston, MA: Macmillan.
text=test_item
226 ÿ RUJUKAN
Wiggins, G., & McTighe, J. (2005). Pemahaman mengikutreka bentuk. New Jersey, NJ:
Pendidikan Pearson.
Jika anda mempunyai sebarang komen atau maklum balas, anda dialu-alukan untuk:
ATAU
2. Isi borang penilaian dalam talian Modul Cetak yang terdapat di myINSPIRE.
Terima kasih.