Professional Documents
Culture Documents
Proses pengumpulan, peringkasan, dan penggunaan informasi dari jawaban siswa untuk membuat keputusan tentang setiap penilaian.
1. Untuk mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum soal digunakan 2. Membantu meningkatkan tes melalui revisi atau membuang soal yg tidak efektif 3. Mengetahui informasi diagnostik pada siswa apakah mereka sudah/belum memahami materi yang telah diberikan
Butir-buti soal tes hasil belajar dapat dinyatakan baik, apabila butirbutir soal memiliki derajat kesukaran item sedang atau cukup
Tes Uraian
Validitas Item
(Sumarna. 2004)
Reliabilitas
Distraktor
Distraktor adalah suatu pola yang menggambarkan bagaimana peserta tes menentukan pilihan jawabannya terhadap kemungkinankemungkinan jawaban yang telah dipasangkan pada setiap butir item. Bertujuan untuk mengecoh mereka yang kurang mampu (tidak tahu) untuk dibedakan dengan yang mampu (lebih tahu). Distraktor dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5% dari seluruh peserta tes.
Dari hasil analisa terhadap taraf kesukaran butir, maka soal nomor 1, 2, 3, 4, 6, 7, dan 8 termasuk ke dalam kategori soal mudah dan sisanya soal nomor 5, 8, dan 10 termasuk ke dalam kategori soal sukar.
Contoh
Analisis untuk 40 butir soal yang diujikan pada 98 peserta tes. Hasil analisis butir soal dengan program iteman ditampilkan secara keseluruhan Keterangan Tabel Hasil Analisis dgn PROGRAM ITEMAN: 1.Seq. No. adalah nomor urut butir soal dalam file data 2.Scala item = nomor urut butir soal dalam skala (tes/subset) 3.Prop. Correct (indeks tingkat kesukaran) = proporsi siswa (peserta tes) yang menjawab benar butir soal. Nilai ekstrim (mendekati nol atau satu) menunjukkan bahwa butir soal tersebut terlalu sukar atau terlalu mudah untuk peserta tes.
11/25/2009 file_nrustaman@yahoo.com_09 24
4. Biser (indeks daya pembeda soal) menggunakan koefisien korelasi biserial. Nilai positif menunjukkan peserta tes yang menjawab benar butir soal, mempunyai skor yang relatif tinggi dalam tes/skala tersebut. Sebaliknya nilai negatif menunjukkan bahwa peserta tes yang menjawab benar butir soal, memperoleh skor yang relatif rendah dalam tes/skala tersebut. Dalam beberapa buku evaluasi, hasil analisis ini mewakili hasil analisis validitas butir soal. 5. Point-Biser adalah indeks daya pembeda soal dan pilihan jawaban (alternatif) dengan menggunakan koefisien korelasi point biserial rpbi. Nilai -9,000 artinya statistik butir soal atas pilihan jawaban tidak dapat dihitung. Hal ini terjadi karena peserta tes tidak ada yang memilih pilihan jawaban tersebut. 6. Kunci jawaban (Key) ditandai dengan tanda *. 7. Prop. Endorsing adalah proporsi siswa yang menjawab benar.
MicroCAT (tm) Testing System Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation Item and Test Analysis Program -- ITEMAN (tm) Version 3.00 Item analysis for data from file UCT.TXT Page 1
Item Statistics ----------------------Prop. Point Correct Biser. Biser.
------0.551 -----0.506 -----0.402
0-7
1.000
-9.000
-9.000
A B C D Other
*
26
MicroCAT (tm) Testing System Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation Item and Test Analysis Program -- ITEMAN (tm) Version 3.00 Item analysis for data from file UCT.TXT Page 2
Item Statistics ----------------------Prop. Point Correct Biser. Biser. ------0.408 -----0.378 -----0.299 Alternative Statistics ----------------------------------Prop. Point Endorsing. Biser. Biser. --------0.010 0.561 0.408 0.020 0.000 0.337 0.020 0.143 0.500 0.000 -----0.763 - 0.396 0.378 - 0.234 - 9.000 0.173 0.471 - 0.291 - 0.052 - 9.000 -------0.206 - 0.314 0.299 * - 0.081 - 9.000 0.134 0.164? - 0.188 - 0.041 * - 9.000
31
0-31
0.500
-0.052
-0.041
There were 98 examinees in the data file. Scale Statistics ---------------Scale: 0 ------N of Items 40 N of Examinees 98 Mean 17.469 Variance 38.208 Std. Dev. 6.181 Skew 0.572 Kurtosis -0.526 Minimum 6.000 Maximum 32.000 Median 16.000 Alpha 0.807 SEM 2.713 Mean P 0.437 Mean Item-Tot. 0.352 Mean Biserial 0.47
28
Keterangan
1. Kriteria Tingkat kesukaran (prop,correct) dan Validitas Butir Soal (Biser) disesuaikan dengan kriteria yang digunakan. 2. Kualitas pengecoh dapat dilihat dari Daya Pembeda, dan hasilnya ditunjukkan dari analisis Point Biserial yang ada di Alternative Statistics. Pengecoh yang baik jika hasil point biser negatif artinya: yang terkecoh adalah yang kelompok bawah. Sebaliknya, kunci jawaban yang baik jika daya pembedanya positif. 3. Reliabilitas seluruh naskah dapat dilihat dari nilai alpha.
Butir soal no.31: Pengecoh A dan B harus direvisi karena Hasil Point Biser (+) yang terkecoh kelompok atas. Kunci jawaban adalah D (hasilnya negatif/kunci tidak berfungsi) Kunci jawaban diminta dicek, karena hasil yang ditunjukkan B bagus.
1. Skor data
Average/Mean = 17.48 Deviation Standard = 6.20 Folder Name: E:\LIMITTED TRY-OUT\LIMITTED TRY-OUT DATA.ANA
Nomor Nomor Urut Subyek Nama Subyek | 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 dst sd 98 No. Butir Baru -----> No. Butir Asli ---> Kunci -> 1 2 3 4 5 6 7 8 9 10 Skor 1 1 b 1 1 1 1 1 1 1 1 1 2 2 d 1 1 1 1 1 3 3 c 1 1 1 1 1 1 1 1 4 4 c 1 1 1 1 1 1 1 1 5 5 d 1 1 6 6 b 1 1 1 7 7 d 1 1 1 1 1 1 1 1 1 1 8 8 a 1 1 1 1 1 1 1 1 - 1 dst sd 40 dst sd 40 dst sd 40 dst sd 40 dst sd 40 dst sd 40 dst sd 40 dst sd 40 dst sd 40 dst sd 40 dst sd 40 dst sd 40 dst sd 40
19 17 25 30 19 32 24 19 24 29
2. Reliabilitas
Mean = 17.48 Standard Deviation = 6.20 XYCorrelation = 0.68 Reliability of Test = 0.81 Folder Name : E:\LIMITTED TRY-OUT\DATA OF LIMITTED TRY-OUT.ANA
No.Urut No. Subyek Kode/Nama Subyek Skor Ganjil Skor Genap Skor Total 1 6 6 16 16 32 2 12 12 19 13 32 3 4 4 16 14 30 4 23 23 15 15 30 5 38 38 16 14 30 6 10 10 15 14 29 7 48 48 13 16 29 8 34 34 13 15 28 9 45 45 13 15 28 10 19 19 14 13 27 dst sd 98 file_nrustaman@yahoo.com_09
32
3. DAYA PEMBEDA
Number of Subjects = 98 Upper/Lower Groups (n) = 26 Number of test items = 40
Folder Name: E:\LIMITTED TRY-OUT\DATA OF LIMITTED TRY-OUT .ANA
No Butir Baru No Butir Asli Kel. Atas Kel. Bawah Beda 1 1 22 9 13 2 2 13 1 12 3 3 19 8 11 4 4 13 2 11 5 5 13 1 12 6 6 16 3 13 7 7 26 26 0 8 8 20 5 15 9 9 9 0 9 10 10 25 14 11 dst sd 40 Indeks DP (%) 50.00 46.15 42.31 42.31 46.15 50.00 0.00 57.69 34.62 42.31
4. TINGKAT KESUKARAN
Number of Subject = 98 Number of Test Items= 40
Note:
Interpretation of Test Item Difficulty index is adapted to the criterion being used.
Catatan:
Kriteria signifikansi tidaknya butir soal disesuaikan dengan hasil korelasi product moment sesuai dengan taraf signifikansi yang diinginkan.
6. KUALITAS PENGECOH
Jumlah Subyek= 98 Butir Soal= 40
Nama berkas: E:\UJI COBA TERBATAS\DATA UJI TERBATAS.ANA
No Butir Baru No Butir Asli 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 a 9+ 1214++ 0-59--11+ 0 53** 15+ 3b 54** 6-25+ 57--5-35** 0 28-37+ 77** c 459--47** 29** 16+ 38-0 9+ 36++ 17--d 31--21** 12+ 12+ 18** 14+ 98** 8+ 10** 1-* 0 0 0 0 0 0 0 0 0 0
Keterangan: ** : Kunci Jawaban ++: Sangat Baik + : Baik - : Kurang Baik -- : Buruk ---: Sangat Buruk
Catatan:
Hasil analisis kualitas pengecoh yang ditunjukkan berdasarkan banyaknya peserta tes yang menjawab benar, tetapi belum memperlihatkan apakah yang terkecoh kelompok atas atau kelompok bawah. Pengecoh yang baik adalah jika yang terkecoh adalah kelompok bawah.
11/25/2009 file_nrustaman@yahoo.com_09 36