Analisis Butir Soal

Kedudukan evaluasi dalam proses belajar mengajar sangat penting dan tidak dapat dipisahkan. Demikian juga, agar proses evaluasi itu berfungsi dengan semestinya dan sesuai tujuan, maka alat evaluasi itu sendiri harus baik. Hal ini seringkali dilupakan oleh para praktisi pendidikan di lapangan, mereka hanya berhenti pada pelaporan hasil evaluasi tanpa merasa perlu untuk mengetahui seberapa baik alat evaluasi yang telah mereka gunakan. Alat evaluasi yang dimaksud adalah tes hasil belajar yang berisi butir-butir soal (item soal). Untuk mengukur seberapa baik tes hasil belajar dilakukan analisis berupa : - analisis butir soal (item analysis),dan - analisis validitas dan realibilitas. Pada kesempatan ini akan dibahas analisis butir soal (item analysis), validitas dan realibilitas soal akan dibahas pada kesempatan lain. Analisis butir soal (item análisis) ádalah proses menilai jawaban peserta terhadap soal yang diberikan untuk menguji baik setiap butir soal maupun secara keseluruhan. Menurut Thorndike dan Hagen tujuan analisis butir soal adalah : Pertama, jawaban-jawaban soal merupakan informasi diagnostik untuk meneliti pelajaran di kelas itu dan kegagalan-kegagalan belajarnya untuk segera dicarikan solusinya. Kedua, mencari soal-soal yang baik untuk dikumpulkan dalam bank soal dan digunakan pada tes berikutnya. Melalui analisis, setiap butir soal akan memberikan informasi mengenai : Tingkat kesukaran (difficulty level), Keberfungsian distraktor/pengecoh, sejauh mana pengecoh (bukan jawaban benar) dapat menarik perhatian peserta untuk dipilih. Daya pembeda (discriminating power), yaitu kemampuan untuk membedakan kelompok siswa yang pandai dan yang tidak pandai,
-------------------------------Oleh Abd. Aziz Rofiq. Disajikan sebagai bahan kuliah di STAI Fatahillah Tangerang, Fak. Tarbiyah/PAI smtr V

1

Dengan demikian soal yang terlalu sulit bukan merupakan soal yang baik karena hanya dapat dikerjakan oleh sedikit peserta.00 . dan dinyatakan dalam bentuk kuantitatif.1. Mengisi lembar 3 untuk mengetahui daya pembeda. Tingkat kesukaran (TK) soal pada dasarnya adalah perbandingan antara banyaknya peserta yang menjawab benar dengan jumlah seluruh peserta. Kondisi soal sebagaimana telah dijelaskan disebut dengan tingkat kesukaran soal (difficulty level).Adapun langkah-langkah menganalisis butir soal adalah sebagai berikut: LANGKAH 1 KEGIATAN Mengkoreksi jawaban peserta. kelompok bawah/KB (25% dari peringkat bawah) dan kelompok tengah (50%). Demikian pula soal yang terlalu mudah sehingga dapat dikerjakan dengan benar oleh seluruh peserta. yaitu kelompok atas/KA (25% dari peringkat atas). Beberapa ahli penilaian memberikan skala tingkat kesukaran (TK) yang berbeda. Tingkat Kesukaran Soal (Difficulty Level) Soal yang ideal adalah soal yang sesuai dengan kemampuan peserta tes.0. yang dianalisis adalah KA dan KB saja Bila jumlah KA dan KB cukup banyak. memberikan skor (nilai).70 : sedang (Sd) 0. sehingga tidak mampu membedakan peserta yang pandai dan yang tidak pandai.29 : sukar (Sk) 2 .00 : mudah (Md) 0. Mengisi lembar 1 untuk mengisi nama peserta beserta jawaban masing-masing pada setiap butir soal Mengisi lembar 2 untuk mengisi rekapitulasi jawaban peserta dan mengetahui keberfungsian distraktor.71 . khususnya kelompok atas (upper group) atau bahkan tidak ada seorangpun yang mampu menyelesaikannya. tingkat kesukaran soal dan keputusan akhir setiap butir soal 2 3 4 5 1. bisa diambil sampelnya secara representatif (27%). Kesimpulannya soal yang baik adalah yang berada pada level sedang. namun yang banyak dipakai di kalangan pendidikan adalah skala yang dikemukakan oleh Thorndike dan Hagen (Measurement and Evaluation in Psychology and Education) sebagai berikut : TINGKAT KESUKARAN (TK) atau p 0.30 .0. dan meranking dari nilai tertinggi sampai nilai terendah Membagi peserta menjadi 3 kelompok.

00) TINDAK LANJUT .30 – 0. kita akan mengetahuii adanya tiga kelompok soal.Sedangkan rumus untuk mencari derajat tingkat kesukaran adalah : TK = PB : JP Ket : TK = Tingkat kesukaran JP = Jumlah seluruh peserta PB = Peserta yang menjawab benar Setelah setiap butir soal dianalisis pada tahap ini.71 – 1.20 – 0. dll) .29) Sedang (0.Dikaji ulang untuk menemukan penyebab soal terlalu mudah dijawab . Seberapa baik sebuah butir soal mampu membedakan kedua kelompok tersebut dapat dilihat pada besar kecilnya indeks diskriminasi item (discriminatory power disingkat D) sebagai berikut: INDEKS D 0.pertanyaan.00 – 0.00 0. Tindak lanjut terhadap tiap-tiap kelompok soal ini adalah : INDEKS SOAL Sukar (0.Dicatat pada bank soal dan dikeluarkan lagi pada tes di waktu yang akan datang .70) dan soal mudah (indeks 0. yaitu soal yang sukar (indeks kurang dari 0.40 Kurang dari 0.20 Negatif KLASIFIKASI Excellent Good Satisfactory Poor INTERPRETASI Memiliki daya pembeda yang sangat baik Memiliki daya pembeda yang baik Memiliki daya pembeda yang cukup/sedang Memiliki daya pembeda yang lemah Kelompok atas banyak yang menjawab salah.30).00).Digunakan untuk tes yang tidak terlalu ketat 2.30 – 0.40 – 0.71 – 1.70 0.Dikaji ulang untuk menemukan penyebab soal dianggap sukar (redaksi. Kemampuan peserta tes menyelesaikan suatu soal dengan benar memberikan gambaran akan kepandaiannya yang tentu saja berbeda dengan peserta yang tidak mampu menjawabnya dengan benar.70 – 1. 3 .Didrop (tidak digunakan pada tes mendatang) . Daya Pembeda (Discriminating Power) Daya pembeda soal adalah kemampuan item tes untuk membedakan peserta pandai dan peserta yang kurang pandai.70) Mudah (0.Didrop (tidak digunakan pada tes mendatang) . soal sedang (indeks 0.Digunakan untuk tes tingkat tinggi .

Tetapi bila lebih banyak dipilih oleh kelompok atas atau tidak dipilih. Melontar jumrah c. : lebih banyak dipilih oleh kelompok atas atau tidak dipilih.Rumus untuk mendari daya pembeda adalah : D = JKA – JKB ½n Ket. Contoh : 3. Analisis Pilihan Jawaban Pada setiap body soal pilihan ganda terdapat pernyataan dan alternatif jawaban.B (baik) . Sa’i b. Berlari-lari kecil antara bukit Shafa dan Marwa pada saat melaksanakan ibadah Haji disebut : a. : D KA KB n = daya pembeda = Jumlah Kelompok Atas yang menjawab dengan benar = Jumlah Kelompok Bawah yang menjawab dengan benar = Jumlah seluruh peserta tes 3. Suatu pengecoh dikatakan berfungsi dengan baik bila sedikitnya dipilih oleh 5% peserta tes. Bila dipilih secara merata maka dikatakan sangat baik.TB (tidak baik) 4. kita dapat menentukan apakah suatu soal 4 . Distraktor berfungsi menarik perhatian siswa untuk menguji ketelitiannya dalam memilih jawaban benar. Keputusan Akhir KONDISI : dipilih secara merata oleh peserta tes : dipilih sedikitnya oleh 5% peserta tes. Tahallul d. Setelah mengetahui tingkat kesukaran soal.SB (sangat baik) . Thawaf Pernyataan Kunci jawaban Distraktor Alternatif jawaban Analisis pilihan jawaban terutama ditujukan untuk menganalisis keberfungsian distraktor. maka pengecoh tersebut tidak baik. daya pembeda dan keberfungsian alternatif jawaban. Di dalam alternatif jawaban terdapat kunci jawaban (jawaban yang benar) dan pengecoh/distraktor (jawaban yang salah). PREDIKAT .

Prinsip-prinsip dan Teknik Evaluasi Pendidikan. Untuk lebih jelasnya buatlah analisis butir soal dengan menggunakan form yang tersedia. Rosdakarya.Sumarna Surapranata. good dan excellent) dapat langsung dicatat pada bank soal dan dikeluarkan lagi pada tes mendatang.uleth. c. 2) Didrop atau dibuang artinya tidak digunakan lagi sebagai soal. dan Interprretasi Hasil Tes.dapat dikatakan baik ataukah tidak. 22 Nopember 2007 Referensi : .http:// www. selanjutnya dianalisis lagi untuk mengetahui apakah TK dan DPnya semakin baik.Anas Sudijono. Analisis.edu/oea/score1. Tangerang. .http://www. Butir-butir soal yang bertanda negatif (-) tidak perlu digunakan lagi karena terbukti kualitasnya buruk. Reliabilitas. Raja Grafindo Persada . b.htm *************** 5 . Rajawali . Demikian teknik analisis butir soal pilihan ganda secara sederhana. Tindak lanjut atas hasil analisis tersebut adalah sebagai berikut : a.ca/edu . Ngalim Purwanto. Validitas.washington. Pengantar Evaluasi Pendidikan. artinya peserta kelompok atas lebih banyak menjawab salah dibanding kelompok bawah. Butir-butir soal yang daya pembedanya rendah (poor) ada dua kemungkinan : 1) Dikaji ulang dan diperbaiki. karena kualitasnya memadai.M. Butir soal yang memiliki daya pembeda yang baik (satisfactory.

Sign up to vote on this title
UsefulNot useful