IPGKTI/ KLL / 2011 Pengujian dan Penilaian (A) Definisi
Pengujian Pengukuran Pentaksiran Penilaian
Pengujian dan Penilaian DEFINASI Penilaian boleh dianggap sebagai proses membuat pertimbangan atau keputusan dalam memberikan nilai, mutu, kualiti atau harga bagi sesuatu benda atau perkara. Stufflebeam et al. (1971:xxv) menyatakan penilaian sebagai proses delineating, mencari dan memberikan maklumat yang berguna dalam mempertimbangkan alternatif-alternatif keputusan. Penilaian & Pentaksiran Gay (1985) berpendapat bahawa penilaian ialah satu proses yang sistematik semasa mengumpul dan menganalisis data bagi menentukan sama ada sesuatu objektif yang telah ditetapkan itu telah tercapai. Ini seterusnya membolehkan guru membuat pertimbangan atau keputusan yang tepat berhubung pengajaran dan pembelajaran. Justeru, penilaian berbeza dengan pengukuran yang hanya melibatkan ukuran dalam bentuk nombor tertentu yang lebih bersifat kuantitatif. Secara menyeluruh, penilaian pendidikan mencakupi aspek- aspek hasil pengajaran dan pembelajaran dan juga hasil program pengajian berbanding matlamat asalnya. Dalam bilik darjah, apabila guru memberikan ujian, adakah guru berkenaan mengukur pencapaian pelajar atau menilai pencapaian pelajar? Dalam keadaan ini kita boleh mengatakan guru sebenarnya mengukur pencapaian pelajar melalui ujian yang dijalankan. Tindakan susulan guru ialah menilai ukuran pencapaian tersebut dengan menggunakan keputusan ujian itu bersama maklumat lain yang berkaitan. Selain menggunakan data kuantitatif, penilaian juga boleh dibuat dengan menggunakan data berbentuk kualitatif seperti yang diperoleh daripada pemerhatian atau temubual. HAMZAH NUN @ IPGKTI HAMZAH NUN @ IPGKTI Kini istilah pentaksiran mula digunakan dalam penilaian pencapaian. Popham (2000) menyatakan istilah-istilah pengukuran, pengujian dan penaksiran digunakan secara silih berganti dan dianggap sebagai sinonim. Pentaksiran melibatkan proses membuat keputusan berdasarkan kepada suatu peraturan atau piawaian. Pentaksiran, yang merupakan sebahagian daripada proses pembelajaran, merangkumi aktiviti menghurai, mengumpul, merekod, memberi skor dan menterjemahkan maklumat tentang pembelajaran seseorang pelajar bagi sesuatu tujuan tertentu (Lembaga Peperiksaan Malaysia, 2000). Hasil pentaksiran dinyatakan dalam bentuk skor. Skor mestilah sah dan boleh dipercayai untuk memastikan keadilan kepada pelajar dan juga untuk mengekalkan kewibawaan institusi pentaksiran. HAMZAH NUN @ IPGKTI Pengukuran membawa maksud yang lebih luas berbanding pengujian. Pengukuran membawa definisi sebagai suatu proses untuk mendapatkan penjelasan secara numerik (melalui angka) tentang sebanyak mana individu/pelajar mempunyai sesuatu ciri yang diukur dengan menggunakan alat tertentu. Dalam erti kata lain pengukuran ialah proses menentukan sejauh mana seseorang individu memiliki ciri-ciri tertentu. Pengukuran HAMZAH NUN @ IPGKTI Biasanya, kita mewakilkan sesuatu pengukuran berbentuk angka kepada prestasi seseorang individu untuk menggambarkan keupayaan individu tersebut. Contohnya, Ramli mendapat 60 peratus dalam ujian Matematik. Kita tidak menyatakan prestasi Ramli sama ada baik atau sebaliknya. Dalam hal ini, kita hanya mengukur pencapaian matematik tanpa memberikan nilai kepada ukuran yang diperoleh. Justeru, pengukuran hanya menentukan tahap prestasi/ciri tertentu seseorang individu/pelajar mengikut alat yang digunakan. HAMZAH NUN @ IPGKTI Pengukuran boleh juga dibuat tanpa menggunakan pengujian. Sebagai contoh, kemahiran melukis seseorang pelajar boleh diukur melalui pemerhatian/pencerapan, sementara pengetahuan dan sikapnya boleh diukur melalui temu bual. Justeru, kita boleh menganggapkan pengukuran sebagai proses untuk mendapatkan sesuatu ukuran dengan menggunakan kaedah tertentu, manakala pengujian pula merupakan salah satu daripada kaedah tersebut. HAMZAH NUN @ IPGKTI Pengukuran tidak bersifat mutlak, misalnya, pengukuran keupayaan mental seseorang sudah tentu lebih sukar diukur secara tepat berbanding ketinggian fizikalnya. Ketinggian fizikal seseorang boleh diukur secara tepat dengan menggunakan alat ukur yang tepat seperti penggunaan pembaris. Seterusnya, seseorang pelajar yang mendapat skor 90 tidak boleh dianggap mengetahui dua kali ganda daripada pelajar yang mendapat skor 45, walaupun skor 90 itu dua kali ganda 45. Seseorang pelajar yang mendapat skor sifar pula tidak juga boleh dianggap sebagai tidak mempelajari/mengetahui tentang sesuatu pelajaran yang diajar guru. Ini jelas menunjukkan ukuran aspek-aspek berkenaan bukanlah petunjuk yang tepat sebagaimana ukuran ketinggian fizikal pelajar menggunakan pembaris. HAMZAH NUN @ IPGKTI Pengujian dapat dianggap sebagai proses penyerahan set soalan yang piawai yang perlu dijawab, atau satu set instrumen bersama satu prosedur yang sistematik bagi mengukur sampel tingkah laku atau perubahan seseorang individu atau pelajar. Menurut Cronbach (1970), Ujian ialah satu prosedur yang sistematik untuk memerhati perlakuan atau tingkah laku seseorang individu dan menjelaskannya dengan bantuan skala bernombor, atau satu sistem yang berkategori. Pengujian HAMZAH NUN @ IPGKTI Contoh skala bernombor ialah angka 30/100 untuk ujian penglihatan, 100/120 untuk ujian kecerdasan (IQ Test) dan 80/100 bagi ujian pencapaian bagi sesuatu mata pelajaran seperti Sains. Manakala contoh sistem berkategori pula ialah ekstrovert atau introvert bagi ujian personaliti, atau rabun warna bagi ujian penglihatan. HAMZAH NUN @ IPGKTI Milagros 1981:menegaskan bahawa: Ujian adalah suatu cara untuk mendapatkan contohan perlakuan yang diperlihatkan oleh murid di dalam keadaan yang dikawal atau ditentukan. Maklumat yang diperoleh daripadanya akan dijadikan dasar untuk membuat penilaian atau pengadilan. HAMZAH NUN @ IPGKTI GLOSARI
Pengujian : Proses/prosedur yang sistematik bagi mengukur pencapaian pelajar yang biasanya dibuat secara bertulis. Tujuan pengujian ialah untuk menentukan pencapaian pelajar dalam sesuatu sesi pembelajaran
Pengukuran: Proses/prosedur yang sistematik bagi mengukur perubahan tingkah laku pelajar yang boleh dibuat secara pemerhatian, lisan atau secara bertulis. Tujuan pengujian ialah untuk menentukan perubahan tingkah laku pelajar, termasuk pencapaian akademik, penguasaan kemahiran dan sikap pelajar
Penilaian: Proses/prosedur yang sistematik bagi membuat pertimbangan dalam mentafsir hasil pengukuran, yang bertujuan untuk memberi maklumat tentang pencapaian akademik, kemahiran atau sikap.
Pentaksiran: Proses/prosedur yang sistematik bagi mendapatkan maklumat dan membuat pertimbangan tentang hasil pembelajaran. (B) Rekabentuk Pentaksiran
prinsip pembinaan item taksonomi Bloom / Solo huraian sukatan pelajaran dan jadual spesifikasi ujian
Pengujian dan Penilaian Rekabentuk Pentaksiran
Prinsip pembinaan item Cth: Garis panduan bagi penulisan item aneka pilihan yang berkualiti.
Pengujian dan Penilaian Rekabentuk Pentaksiran
Taksonomi Bloom (Blooms Taxonomy of Educational Objectives of Cognitive Domain, 1956) Aras kemahiran Taksonomi Bloom Pengetahuan, kefahaman, aplikasi, analisis, sintesis dan penilaian (#1) Contoh-contoh soalan (#2) (#3) Taksonomi Solo (Structure Of Observed Learning Outcomes by Biggs and Collis, 1982) Unistructural, multistructural, relational, extenden abstract (#4) Contoh-contoh soalan (#5) (#6)
Pengujian dan Penilaian Aras Kemahiran Taksonomi Bloom @ Pengetahuan Uji kebolehan pelajar mengingat kembali fakta tertentu, makna, istilah, prinsip, hukum atau definisi yang telah dipelajari. Kefahaman Uji kebolehan dari segi kefahaman dan kemahiran, termasuk kebolehan menerangkan fakta tertentu, konsep, prinsip, hukum atau teori yang dipelajari. Aplikasi Uji kebolehan menggunakan fakta, konsep, prinsip, hukum, teori, pengetahuan atau kemahiran untuk menyelesaikan masalah. Analisis Uji kebolehan untuk membanding dan membeza, menghubungkait atau memilih ciri-ciri atau sifat-sifat konsep, pengetahuan atau kemahiran yang dipelajari. Sintesis Uji kebolehan untuk menggabungkan atau mengintegrasi ilmu pengetahuan atau kemahiran yang dipelajari untuk menyelesaikan masalah Penilaian Uji kebolehan untuk membukti, menilai, mengkritik, menaakul (infer) atau merumuskan sesuatu pernyataan. Aras Kemahiran Taksonomi Solo @ Unistructural (U) One aspect of the task is picked up or understood and there is no relationship sought among the various facts or ideas in the given material
Multistructural (M) Two or more of the tasks are picked up and understood serially, but are not interrelated.
Relational (R) Several aspects are integrated so that the whole has a coherent structure and meaning
Extended (EA) Abstract That coherent whole is generalized to a higher level of abstraction
Rekabentuk Pentaksiran Huraian sukatan pelajaran dan jadual spesifikasi ujian - Definisi Jadual Spesifikasi Ujian Satu jadual yang mengandungi dua perkara iaitu topik- topik matematik (paksi mencancang) dan aras kemahiran (paksi mengufuk) - Tujuan membentuk JSU: Membantu guru untuk membina ujian yang baik dan komprehensif. Memastikan pelbagai topik/kemahiran dan aras kemahiran diuji mengikut pemberatan yang sesuai. Untuk mengelakkan aduan yang kerapkali dibuat terhadap suatu ujian. Ia digunakan untuk memastikan kesahan isikandungan ujian dan mempertingkatkan kualiti ujian.
Pengujian dan Penilaian (C)Pentaksiran berasaskan sekolah dan bilik darjah
formatif dan sumatif penilaian formal dan tak formal pentaksiran alternatif
Pengujian dan Penilaian
Pengujian dan Penilaian (C) P. Sek & BD - Formatif dan sumatif
Perkara Penilaian Formatif Penilaian Sumatif Pengertian Sesuatu jenis ujian formal atau tak formal utk mengesan penguasaan & kemajuan pelajaran dlm kelas Sesuatu jenis ujian formal utk mengesan pencapaian dlm sesuatu tahap persekolahan Tujuan Mengesan penguasaan & kemajuan pelajar utk membaiki kelemahannya dgn serta-merta Mengesan pencapaian pelajar berdasarkan beberapa unit pembelajaran & pemeringkatkan gred pelajar Aktiviti Menjalankan ujian formal atau tak formal semasa waktu pelajaran dgn secara individu, secara kumpulan atau secara kelas Menjalankan ujian formal dalam beberapa waktu pelajaran secara kelas atau tingkatan Masa Semasa mengajar sesuatu atau beberapa kemahiran Selepas mengajar beberapa unit pembelajaran
Pengujian dan Penilaian (C) P. Sek & BD - Formatif dan sumatif Perkara Penilaian Formatif Penilaian Sumatif Bentuk Tak formal (pemerhatian dan soaljawab), atau formal (ujian kertas-pensel dlm masa singkat) Formal: Ujian kertas-pensel atau ujian lisan dalam jangkaan masa yang sesuai. Sasaran Secara individu, secara kumpulan atau secara kelas Secara kelas atau secara tingkatan Liputan Meliputi sesuatu kemahiran (ujian tak formal) atau beberapa kemahiran (ujian formal) Meliputi beberapa unit pelajaran atau sesuatu tahap persekolahan Rekod Tiada (bagi ujian tak formal), dan penggunaan senarai semak/rekod prestasi (bagi ujian formal) Penggunaan rekod profil atau pensijilan Tindak- an Membetulkan kelemahan dgn serta merta atau menjalankan aktiviti pemulihan / pengayaan dlm kelas -Menempatkan pelajar dlm kumpulan /kelas yg sesuai -Merancang & mengubahsuai pelajaran/ kurikulum - Memberi sijil berdasarkan pencapaian dlm peperiksaan (C)Pentaksiran berasaskan sekolah dan bilik darjah
Penilaian formal dan tak formal
Pengujian dan Penilaian formal Ujian kertas- pensel Ujian lisan Tak formal pemerhatian soaljawab (C)Pentaksiran berasaskan sekolah dan bilik darjah
Pentaksiran Alternatif @@
Hancock Suatu proses berterusan yang melibatkan pelajar dan guru dalam membuat penghakiman terhadap perkembangan pelajar dengan menggunakan strategi yang bukan konvensional. (1994, 1)
Pengujian dan Penilaian (D) Pentafsiran pentaksiran
analisis dan pentafsiran item indeks kesukaran dan indeks diskriminasi pemantauan merekod kemajuan dan memantau pencapaian murid
Pengujian dan Penilaian (D) Pentafsiran Pentaksiran Analisis & pentafsiran item
Indeks kesukaran & Indeks diskriminasi Indeks Kesukaran - Indeks yang digunakan untuk menunjukkan item / soalan sama ada terlalu sukar, sederhana atau terlalu mudah. - Nilai indeks kesukaran = Bil. calon jawab betul Jumlah calon cuba (n besar) I. K = BT + BR JT+R
Pengujian dan Penilaian I. Kesukaran Pentafsiran item Keputusan I.K < 0.3 Terlalu Sukar Ubahsuai 0.3 I. K. 0.8 Sederhana Terima I. K. > 0.8 Terlalu Mudah Ubahsuai (D) Pentafsiran Pentaksiran Analisis & pentafsiran item
Indeks kesukaran & Indeks diskriminasi Indeks Diskriminasi - Indeks yang digunakan untuk membezakan calon-calon daripada kumpulan cerdas dengan kumpulan lambat. I. D = BT - BR JT+R
Pengujian dan Penilaian Indeks Diskriminasi Pentafsiran item Keputusan I.D > 0.4 Diskriminasi positif yg tinggi Amat sesuai diterima 0.2 I. D. 0.4
0 I. D. 0.2 Diskriminasi positif yg sederhana
Diskriminasi positif yg rendah Ubahsuai item & cuba sekali Tulis item semula I. D. < 0 Diskriminasi negatif, prestasi kump rendah lebih baik dpd kump tinggi Item buruk & harus dibuang (D) Pentafsiran Pentaksiran (#1)
- mencipta histogram (data terkumpul, data selanjar) - menentukan ukuran kecenderungan dan serakan yang sesuai untuk mengintepret data (Ukuran kecenderungan memusat - min, mod, median - Lengkung taburan pencong positif/negatif; Ukuran serakan julat, varians, sisihan piawai)
Pengujian dan Penilaian (D) Pentafsiran Pentaksiran
Pemantauan -merekod kemajuan & memantau pencapaian murid
Penyimpanan Rekod Prestasi dan Profil (Rujuk Mok Soon Sang, m/s 258 262)
Pengujian dan Penilaian (E) Pentadbiran pentaksiran
pentadbiran ujian moderasi ujian dan skema pemarkahan penilaian laporan dan pelaporan kebolehpercayaan dan kesahan ujian bank item
Pengujian dan Penilaian (E) Pentadbiran Pentaksiran
Pentadbiran Ujian Aspek-aspek pentadbiran pentaksiran - Penyiapan fisikal - Pengawalan Masa - Penyediaan psikologi - Moderasi Ujian - Skema pemarkahan
Pengujian dan Penilaian (E) Pentadbiran Pentaksiran
Pentadbiran Ujian
3 peringkat utama bagi pentadbiran pentaksiran - Persediaan - Pelaksanaan - Moderasi
Pengujian dan Penilaian (E) Pentadbiran Pentaksiran
Skema Pemarkahan Cara membuat pemarkahan ujian Skim Pemarkahan Ujian Subjektif - tiga nilaitara utama: kriteria kandungan* maklumat & pengetahuan kriteria pengelolaan penggunaan bahasa & kemahiran menghuraikan idea kriteria proses - aspek ketepatan, munasabah, kelengkapan, konsisten, keaslian, daya cipta dalam teknik penulisan Cara pemarkahan : cara Analitik cara Holistik / Global
Pengujian dan Penilaian (E) Pentadbiran Pentaksiran
Moderasi Ujian Cara membuat moderasi ujian Analisis Pencapaian 2 kategori utama : Ujian rujukan Norma Ujian rujukan Kriteria
Pengujian dan Penilaian (E) Pentadbiran Pentaksiran
Penilaian Laporan & Pelaporan Rekod Prestasi : - digunakan utk merekod prestasi dlm setiap m/pel. berdasarkan sesuatu senarai kemahiran - menentukan siapa yg perlukan program pemulihan / pengayaan Rekod Profil : - digunakan utk markah & gred yg diperolehi oleh murid dlm ujian penggal atau peperiksaan sekolah - guru menentukan siapa yg perlukan pemulihan khas, merancang pelajaran berdasarkan pencapaian murid, atau menempatkan murid-murid semula dlm kumpulan yg sesuai. Buku Kemajuan Murid - sejenis rekod profil dlm btk risalah - markah dan gred, kelakuan murid, kedatangan
Pengujian dan Penilaian (E) Pentadbiran Pentaksiran
Kebolehpercayaan Ujian & Kesahan Ujian Kesahan Ujian Suatu ujian itu dikatakan sah jika ia mengukur semua yang hendak diukur dan tidak lain daripada itu (Yap Yee Keong, Wan Chwee Seng, Ismail Abu Bakar(1985) ) Kesahan merujuk kepada takat sesuatu ujian dapat memenuhi tujuannya (Tan Hui Leng, Ee Ah Meng (!996)) Kesahan menunjukkan kepada setakat mana sesuatu ujian dapat memenuhi tujuan menguji. (Lee Shok Mee, Mok Soon Sang (1989)) Kesahan dalam ujian adalah merujuk kepada kualiti ujian yang betul- betul mengukur dan menilai dengan tepat sesuatu yang hendak diukur. Ianya dikatakan sah kerana ia dapat menjamin bahawa ujian itu benar-benar menguji perkara-perkara yang harus diuji dan tidak lebih dari itu.
Pengujian dan Penilaian (E) Pentadbiran Pentaksiran
Kebolehpercayaan Ujian & Kesahan Ujian Kebolehpercayaan Ujian Satu lagi ciri penting dalam menentukan sama ada sesuatu ujian itu baik atau tidak ialah keutuhannya. Jika ciri kesahan menekankan apa yang hendak diukur, keutuhan pula mementingkan ketepatan atau kejituan ukuran yang dibuat. (Yap Yee Keong, Wan Chwee Seng, Ismail Abu Bakar(1985)) Kebolehpercayaan boleh merujuk kepada ciri skor berhubung dengan ketepatan dan ketekalan skoran bagi menggambarkan prestasi calon dalam perkara yang diuji. (Azizi Ahmad, Mohd Ishak Awang (2008)) Ciri kebolehpercayaan sesuatu ujian merujuk kepada pencapaian calon adalah tekal apabila dia mengambil ujian itu beberapa kali dalam satu jangka masa. (Mok Soon Sang (2009)) Kebolehpercayaan merujuk kepada ketekalan ujian yang dibuat berulang kali. (Lee Shok Mee, Mok Soon Sang (1989) dan Tan Hui Leng, Ee Ah Meng (!996))
Pengujian dan Penilaian (E) Pentadbiran Pentaksiran Perhubungan/perbezaan atr kesahan & kebolehpercayaan Kebolehpercayaan Ujian & Kesahan Ujian 1. Ujian yang sah & boleh dipercayai adalah ujian yang hanya mengukur apa yang sebenar- benarnya ingin diukur & setelah dilaksanakan ujian itu beberapa kali, skor murid dlm ujian tersebut adalah sama atau hampir sama dlm setiap ujian. Ujian ini merupakan ujian yg terbaik kerana menepati dari aspek KESAHAN dan KEBOLEHPERCAYAAN
Pengujian dan Penilaian Kebolehpercayaan Ujian & Kesahan Ujian 2. UJIAN YANG SAH TETAPI TIDAK BOLEH DIPERCAYAI ADALAH UJIAN YANG MENGUKUR APA YANG SEBENAR-BENARNYA INGIN DIUKUR. NAMUN, SETELAH DILAKSANAKAN UJIAN ITU BEBERAPA KALI, SKOR MURID DALAM SETIAP UJIAN ITU AMAT BERBEZA. HAL INI DIPENGARUHI OLEH FAKTOR EMOSI, TEMPAT UJIAN, SUASANA PERSEKITARAN DAN SEBAGAINYA. UJIAN INI MASIH MERUPAKAN UJIAN YANG BAIK DAN BOLEH DIGUNA PAKAI. GURU PERLU MEMASTIKAN FAKTOR-FAKTOR YANG MENJADI PUNCA BERLAKUNYA KETIDAK BOLEH PERCAYAAN UJIAN INI DIKENALPASTI DAN DIATASI.
Pengujian dan Penilaian
(E) Pentadbiran Pentaksiran Perhubungan/perbezaan atr kesahan & kebolehpercayaan Kebolehpercayaan Ujian & Kesahan Ujian 3. UJIAN YANG TIDAK SAH TETAPI BOLEH DIPERCAYAI ADALAH UJIAN YANG TIDAK MENGUKUR APA YANG SEPATUTNYA DIUKUR. NAMUN, SETELAH UJIAN ITU DILAKSANAKAN BEBERAPA KALI, SKOR MURID DALAM SETIAP UJIAN ADALAH TETAP ATAUPUN HAMPIR SAMA. UJIAN INI MERUPAKAN UJIAN YANG TIDAK SAH DAN TIDAK BOLEH DIGUNAKAN UNTUK MENDAPATKAN SKOR DAN MAKLUM BALAS PEMBELAJARAN MURID KERANA IANYA TIDAK MENGUKUR ASPEK YANG PERLU DIUKUR.
Pengujian dan Penilaian
(E) Pentadbiran Pentaksiran Perhubungan/perbezaan atr kesahan & kebolehpercayaan Kebolehpercayaan Ujian & Kesahan Ujian 4. UJIAN YANG TIDAK SAH DAN TIDAK BOLEH DIPERCAYAI ADALAH UJIAN YANG TIDAK MENGUKUR APA YANG HENDAK DIUKUR DAN SKOR MURID DALAM UJIAN YANG DILAKUKAN BERULANG KALI ADALAH TIDAK TEKAL. UJIAN INI ADALAH UJIAN YANG TIDAK BOLEH DIGUNAPAKAI. SKOR DARI UJIAN INI JUGA TIDAK BOLEH DIGUNAKAN UNTUK MENDAPATKAN MAKLUM BALAS PEMBELAJARAN MURID KERANA IANYA ADALAH TIDAK JITU DAN MURID TIDAK DIUJI DENGAN PERKARA-PERKARA YANG DIPELAJARI.
Pengujian dan Penilaian
(E) Pentadbiran Pentaksiran Perhubungan/perbezaan atr kesahan & kebolehpercayaan ( E) Pentadbiran Pentaksiran
Perhubungan antara Kebolehpercayaan Ujian & Kesahan Ujian
Pengujian dan Penilaian Kesahan Keboleh percayaan Pentafsiran Keputusan & Tindakan
X Ujian yg baik & boleh digunapakai Kenalpasti faktor penyebab & atasinya X
Pengujian dan Penilaian Split-Half Reliability Step 1: Divide the test into equivalent halves. Step 2: Compute a Pearson r between scores on the two halves of the test. Step 3: Adjust the half-test reliability using the Spearman-Brown formula
Kaedah Split-half Kaedah Split-half (E) Pentadbiran Pentaksiran
Bank Item Item paling sesuai dipilih untuk bank item - Indeks Kesukaran - Indeks Diskriminasi