You are on page 1of 10

PERBANDINGAN PENYEKORAN MODEL RASCH

DAN MODEL PARTIAL CREDIT PADA MATEMATIKA

Awal Isgiyanto
FKIP Universitas Bengkulu
email: awalunib@yahoo.co.id

Abstrak
Penelitian ini bertujuan untuk menentukan atribut butir soal; kemampuan peserta menjawab
butir soal; penyekoran model Rasch dan Partial Credit; serta nilai fungsi informasi model Rasch dan
Partial Credit tes matematika. Metode penelitiannya adalah retrofitting dengan subjek peserta ujian
nasional matematika SMP di Kabupaten Bantul. Objeknya berupa butir dan respons butir peserta.
Hasilnya adalah pertama, atribut yang mendasari butir soal ada 47 yang terdiri atas empat atribut
isi, 36 atribut proses, dan tujuh atribut keterampilan; kedua, kemampuan tertinggi peserta ada pada
butir soal statistika dan peluang, diikuti aljabar dan geometri, sedangkan kemampuan terendah pada
butir soal bilangan; ketiga, tingkat kesulitan tertingi model Rasch terletak pada bilangan, aljabar,
serta statistika dan peluang dan terendah pada geometri dan pengukuran, sedangkan tertinggi pada
model Partial Credit terletak pada threshold 2, diikuti threshold 1, dan terendah pada threshold 3;
serta keempat, nilai fungsi informasi model Partial Credit lebih baik dan akurat daripada model
Rasch.

Kata kunci: penyekoran model rasch, model partial credit

COMPARISON OF SCORING OF THE RASCH MODEL


AND THE PARTIAL CREDIT MODEL IN MATHEMATICS

Abstract
The study is aimed at determining the test item attributes, testees’ ability in answering the test
items, model scoring, and the degree of the information function of the Rasch model and the Partial
Credit model of mathematics tests. The research method is that of retrofitting involving as subjects
participants of the junior-high-school mathematics national examination of Bantul Regency. The
research object consists of the participants’ items and item responses. Findings show the following.
First, there are 47 attributes underlying the test items consisting of four attributions, 36 process
attributions, and seven skill attributions. Second, the highest participants’ ability is found on the
statistical and chance test items, followed by algebra and geometry, while the lowest ability is on
math test items. Third, the highest difficulty level of the Rasch model is found on math, algebra, and
statistical and chance test items, while the lowest difficulty level is on geometry and measurement.
Meanwhile, the highest level on the Partial Credit model is on threshold 2, followed by threshold 1,
and the lowest is on threshold 3. Fourth, the value of the information function of the Partial Credit
model is better and more accurate than that of the Rasch model.

Keywords: scoring rasch model, partial credit model

Pendahuluan respons suatu butir, dan fungsi responsnya


Kalibrasi dalam Item Response Theory memuat parameter butir dan parameter person.
(IRT) merupakan proses penentuan parameter Tujuan kalibrasi adalah untuk mendapatkan

9
JURNAL KEPENDIDIKAN, Volume 43, Nomor 1, Mei 2013, Halaman 9 - 18

nilai estimasi parameter butir dan parameter logistik satu parameter (1-PL-model) atau
person. Parameter butir dapat berupa tingkat Rasch Model (RM) adalah model yang
kesulitan butir dan parameter person dapat melibatkan parameter tingkat kesulitan
berupa kemampuan peserta. butir.
Nilai fungsi informasi tes (test Penyekoran politomus adalah model
information function-TIF) merupakan respons butir yang mempunyai kemungkinan
penjumlahan seluruh nilai fungsi informasi jawaban lebih dari dua kategori (Wells,
butir. Fungsi informasi butir (item information Hambleton, & Urip Purwono, 2008: 1).
function-IIF) merupakan suatu fungsi untuk Model Penyekoran politomus meliputi
menjelaskan kekuatan suatu butir, pemilihan Graded Response Model (GRM) dari
butir, dan perbandingan beberapa perangkat Samejima, Nominal Model (NM) dari Bock,
tes. Melalui IIF dapat diketahui butir tes Partial Credit Model (PCM) dari Masters,
yang cocok dengan model, sehingga dapat Generalized Partial Credit Model (GPCM)
digunakan untuk seleksi butir tes. dari Muraki, dan Rating Scale Model (RSM)
Untuk menyelesaikan butir soal dari Andrich (DeMars, 2010: 22; Thissen,
matematika diperlukan sejumlah tahapan Nelson, Rosa, et al., 2001: 143-149; Wells,
penyelesaian. Pada setiap tahapan diperlukan Hambleton, & Urip Purwono, 2008: 2-10;
penguasaan atribut yang mendasari butir Hessen, 2009: 5-17). Partial Credit Model
soal tersebut. Atribut didefinisikan sebagai (PCM) dikembangkan dari Rasch Model
prosedur, proses, keterampilan, atau (RM) oleh Masters. RM untuk data skor
kompetensi yang harus dimiliki peserta dikotomus dikembangkan menjadi skor
untuk menyelesaikan butir soal (Gierl, 2007a; lebih dari dua kategori (politomus). PCM
Gierl, Yinggan Zheng, & Ying Cui, 2008; tidak mensyaratkan langkah penyelesaikan
Robert & Gierl, 2010). Atribut diperlukan butir tes harus berurutan dan tidak harus
untuk menyelesaikan butir soal belum mempunyai kesulitan yang sama (De Ayala,
tentu dikuasai dan diterapkan oleh peserta 1993). Threshold pada Penyekoran PCM
dengan tepat. Pada Penyekoran dikotomus, dari suatu ketegori ke kategori berikutnya
hanya peserta yang sudah menguasai dan tidak selalu lebih besar. PCM juga cocok
menerapkan dengan tepat semua atribut untuk butir yang diskor dalam kategori
matematika yang diperlukan untuk menjawab berjenjang, akan tetapi indeks kesukaran
dengan betul saja yang dihargai. Peserta yang dalam setiap langkah tidak perlu terurut.
belum menguasai dan menerapkan dengan Skor kategori yang lebih tinggi menunjukkan
tepat seluruh atribut tidak diberi credit. Oleh kemampuan yang lebih tinggi dari pada skor
karena itu perlu inovasi model Penyekoran kategori yang lebih rendah. Respons butir
dengan mengembangkan model Penyekoran pada penelitian ini dapat betul pada langkah
politomus pada butir soal objektif pilihan tertentu, tetapi dapat salah pada langkah
ganda pada Matematika. yang lain. Pada kasus respons seperti itu,
Respons butir dikotomus mempunyai disarankan untuk menggunakan Penyekoran
dua kategori skor jawaban, yaitu jawaban PCM. Pada RM atau PCM diasumsikan
betul (skor 1) dan jawaban salah (skor 0) bahwa parameter tingkat kesulitan butir
(Bond & Fox, 2007: 49; DeMars, 2010: 9). merupakan satu-satunya karakteristik butir
Model Penyekoran dikotomus disebut model yang mempengaruhi kinerja peserta.
logistik dikotomus. Model logistik dikotomus Pada Peraturan Menteri Pendidikan
dinamai sesuai dengan banyaknya parameter Nasional Republik Indonesia Nomor 22
yang dilibatkan dalam model (Hambleton, Tahun 2006 Tentang Standar Isi untuk
Swaminathan, & Rogers, 1991: 12). Model Satuan Pendidikan Dasar dan Menengah

10
Awal Isgiyanto: Perbandingan Penyekoran Model Rasch...

disebutkan bahwa ruang lingkup mata Pendidikan dan Olahraga Daerah Istimewa
pelajaran Matematika pada satuan pendidikan Yogyakarta.
SMP/MTs meliputi aspek-aspek (1) bilangan, Identifikasi atribut dilakukan
(2) aljabar, (3) geometri dan pengukuran, dan melalui pendekatan retrofitting dengan
(4) statistika dan peluang. Pada tingkat SMP, cara menganalisis data berupa butir soal
matematika berfungsi untuk mengembangkan UN Matematika. Pendekatan retrofitting
kemampuan menghitung, mengukur, didasarkan pada atribut yang muncul di antara
merumuskan dan menggunakan rumus butir soal. Konstruk suatu model kognitif
matematika yang diperlukan dalam kehidupan diidentifikasi untuk menemukan atribut
sehari-hari melalui materi bilangan, aljabar, yang mendasari butir soal melalui analisis
geometri dan pengukuran, dan statistika dan tugas pada butir soal yang mewakili suatu
peluang. Demikian pentingnya rekomendasi domain tertentu. Atribut yang mendasari
kepada pemangku kepentingan, maka perlu butir soal sejalan dengan kompetensi dasar
penelitian tentang fungsi informasi tes (KD). Atribut yang mendasari butir soal
model Rasch dan model Partial Credit pada dikategorikan menjadi atribut kategori isi
Matematika. (I), atribut kategori proses (P), dan atribut
Berdasarkan uraian pada latar kategori keterampilan (K). Hasil identifikasi
belakang, rumusan masalah penelitian adalah atribut divalidasi oleh siswa, guru matematika
“bagaimanakah nilai fungsi informasi tes SMP, dan pakar pendidikan matematika.
model Rasch dan model Partial Credit pada Data berupa butir soal UN Matematika
tes objektif pilihan ganda pada matematika?”. dianalisis untuk mendapatkan Rubrik
Tujuan penelitian ini untuk menemukan: (1) Penyekoran. Rubrik Penyekoran disusun
atribut uang mendasari butir soal, (2) model melalui pendekatan retrofitting didasarkan
Penyekoran dikotomus model Rasch dan pada atribut yang muncul di antara butir soal.
politomus model Partial Credit, dan (3) nilai Untuk memperoleh option yang betul dapat
fungsi informasi tes model Rasch dan model dilakukan melalui prosedur yang bermacam-
Partial Credit pada tes objektif pilihan ganda macam. Peserta memilih option yang betul
pada matematika. diberi skor maksimum (skor 3). Pada tiga
option yang salah (distraktor) dikategorikan
Metode menurut bobot kesalahannya menjadi kategori
Penelitian ini menggunakan pendekatan ringan (skor 2), kategori sedang (skor 1), dan
retrofitting (Gierl, 2007a). Pendekatan kategori berat (skor 0). Rubrik Penyekoran
retrofitting dilakukan melalui analisis divalidasi oleh siswa, guru matematika SMP,
butir soal dan data respons butir pada UN dan pakar pendidikan matematika. Validitas
Matematika. Subjek penelitian adalah peserta Rubrik Penyekoran didasarkan pada hasil
UN Matematika SMP Tahun Pelajaran validasi. Kesahihan skor yang diperoleh juga
2007/2008 di wilayah Kabupaten Bantul, didasarkan pada validitas Rubrik Penyekoran
Daerah Istimewa Yogyakarta. Objek yang tersebut.
dipilih adalah 40 butir soal dan 1016 respons Analisis menggunakan R Programming
butir peserta UN Matematika. Sampel diambil version 2.9.0 (2009-04-17) packages irtoys,
secara simple random sampling diperoleh dan eRm (extended Rasch model). Analisis data
12 sekolah atau 1016 peserta. Data expost juga menggunakan bantuan SPSS dan EXCEL.
facto berupa respons butir peserta ujian dan Analisis data dikotomus difokuskan pada
butir soal pada UN Matematika SMP Tahun model Rasch. Analisis terhadap data model
Pelajaran 2007/2008 dikumpulkan dengan Rasch untuk menemukan harga parameter
teknik dokumentasi. Data diambil dari Dinas tingkat kesulitan butir (diviculty) dan test

11
JURNAL KEPENDIDIKAN, Volume 43, Nomor 1, Mei 2013, Halaman 9 - 18

information function (TIF). Analisis terhadap teridentifikasi pada pemecahan masalah


data yang diskor politomus difokuskan pada butir soal 2, 3, 5, 6, 7, 8, 14, 15, 32, 33, 35,
model Partial Credit. Analisis data pada dan 39. Atribut (At.P.2) teridentifikasi pada
Penyekoran model Partial Credit untuk butir soal 19. Atribut (At.P.3) teridentifikasi
menemukan parameter tingkat kesulitan butir pada butir soal 32 dan 33. Ketiga atribut
(thresholds), test information fuction (TIF), tersebut tidak termasuk KD, akan tetapi
dan kemampuan peserta. merupakan kompetensi sangat penting dalam
penyelesaian butir soal UN Matematika Tahun
HASIL PENELITIAN DAN PEMBAHASAN Pelajaran 2007/2008. Untuk selanjutnya,
Atribut yang Mendasari Butir Soal ketiga atribut tersebut dapat dipertimbangkan
Atribut yang menyusun konstruk suatu dalam revisi KD mata pelajaran matematika
model kognitif diidentifikasi melalui analisis SMP.
tugas pada butir soal yang mewakili suatu
domain tertentu. Untuk mengidentifikasi atribut Rubrik dan Model Penyekoran
yang mendasari butir soal UN Matematika Penyusunan Rubrik Penyekoran
digunakan pendekatan diagnosis post-hoc, dilakukan melalui pendekatan retrofitting.
yang digambarkan sebagai pendekatan Pendekatan retrofitting didasarkan pada
retrofitting (Gierl, 2007b). Pendekatan ini atribut yang muncul di antara butir soal.
dilakukan dengan cara menganalisis butir Konstruk suatu model kognitif setiap distraktor
soal UN Matematika. Pendekatan retrofitting diidentifikasi untuk menemukan atribut yang
tersebut didasarkan pada atribut yang muncul mendasarinya. Identifikasi dilakukan melalui
di antara butir soal UN Matematika. analisis tugas pada butir soal yang mewakili
Sebaran hasil identifikasi atribut yang suatu domain tertentu.
mendasari butir soal disajikan pada Tabel Untuk menjawab butir soal matematika
1. Pada Tabel 1 tampak bahwa ada 47 diperlukan sejumlah tahapan penyelesaian.
atribut yang mendasari butir-butir soal UN Pada setiap tahapan diperlukan penguasaan
Matematika, meliputi 4 atribut kategori isi, 36 atribut yang mendasari butir soal yang
atribut kategori proses, dan 7 atribut kategori bersangkutan. Oleh karena itu perlu inovasi
keterampilan. model Penyekoran dengan mengembangkan
Tiga puluh enam atribut kategori model Penyekoran politomus pada tes objektif
proses tersebut ada tiga atribut yang tidak pilihan ganda pada Matematika.
termasuk KD. Atribut yang dimaksud adalah Rubrik Penyekoran data UN
atribut (At.P.1) kompetensi melakukan proses Matematika pada penelitian ini difokuskan
pemikiran logis, atribut (At.P.2) kompetensi pada paradigma pengujian unidimensi.
menentukan nilai bentuk aljabar, dan atribut Hasil penelitian Walker & Beretvas
(At.P.3) kompetensi melakukan konversi (2003) menyatakan bahwa menurut model
satuan panjang. Atribut (At.P.1) tersebut unidimensi, dimensi tunggal dapat mewakili

Tabel 1. Distribusi Atribut yang Mendasari Butir Soal

12
Awal Isgiyanto: Perbandingan Penyekoran Model Rasch...

beberapa kombinasi kemampuan matematika Penyekoran tampak bahwa peserta yang


umum dan komunikasi matematika. UN memilih option A melakukan kesalahan
merupakan tes pendidikan berskala besar yang dalam menentukan rumus luas permukaan
berfungsi untuk mengukur dan menyusun kotak kayu L=pl+lt+pt, yang berarti peserta
peringkat peserta berdasarkan pada sifat laten tidak tuntas atribut (A1).P.1. Kompetensi
unidimensional. melakukan proses pemikiran logis, (A2).I.1.
Konsep dasar geometri dan pengukuran:
Penyekoran Rasch Model (RM) balok, dan (A3).P.2. Kompetensi menghitung
Penyekoran RM mempunyai dua luas permukaan dan volume kubus, balok,
kategori. Pada Rubrik Penyekoran dikotomus prisma dan limas. Peserta yang memilih
RM, option yang betul diberi skor “1”, dan option C melakukan kesalahan dalam
tiga option yang salah diberi skor “0”. Peserta menentukan rumus luas permukaan kotak
yang diberi skor “0”, sesungguhnya peserta kayu L= pl+lt+pt, dan dalam melakukan
yang bersangkutan melakukan kesalahan yang konversi satuang panjang 14.000 cm2 = 14
berbeda. Jika dalam UN Matematika masih m2, yang berarti peserta tidak tuntas atribut
menggunakan tes objektif pilihan ganda, (A1).P.1. Kompetensi melakukan proses
maka perlu alternatif Penyekoran politomus pemikiran logis, (A2).I.1. Konsep dasar
agar dapat digunakan untuk mengontrol geometri dan pengukuran: balok, (A3).P.2.
distraktor dan untuk mengungkap informasi Kompetensi menghitung luas permukaan dan
diagnostik yang belum didapat dari model volume kubus, balok, prisma dan limas, dan
Penyekoran dikotomus. (A6).P.4. Kompetensi melakukan konversi
Ketuntasan atribut setiap option pada satuan panjang. Peserta yang memilih option
kasus butir soal 32 tampak bahwa peserta D hanya melakukan kesalahan melakukan
yang memilih option A, C, dan D diberi konversi satuan panjang 28.000 cm2 = 28 m2,
skor “0”. Padahal peserta yang diberi skor yang berarti peserta tidak tuntas pada atribut
“0” tersebut sudah menguasai atribut yang (A6).P.4. Kompetensi melakukan konversi
mendasari butir soal yang dikembangkan satuan panjang saja.
dari kompetenasi dasar (KD), yaitu (At.I.3)
konsep dasar geometri, (At.P.27) kompetensi Penyekoran Model Politomus
mengidentifikasi sifat-sifat kubus, balok, Butir soal UN Matematika tidak
prisma dan limas serta bagian-bagiannya, dikonstruk untuk dilakukan Penyekoran
(At.I.1) konsep dasar bilangan, dan atribut politomus. Penyusunan rubrik Penyekoran
(At.P.4) kompetensi melakukan operasi hitung politomus dilakukan melalui pendekatan
bilangan bulat dan pecahan. Penyekoran retrofitting. Respons butir pada Penyekoran
model dikotomus pada kasus butir soal politomus mempunyai kemungkinan
32 tersebut kurang tepat dan kurang adil, jawaban lebih dari dua kategori. Untuk
karena peserta sudah memerapkan dengan memperoleh jawaban yang betul, peserta
benar semua KD pada Matematika SMP, dan dapat menyelesaikan butir soal melalui
peserta hanya melakukan kesalahan dalam tahapan yang berbeda-beda. Oleh karena itu
mengkonversikan satuan panjang, yang peserta yang memilih option yang betul diberi
sesungguhnya bukan KD yang harus dikuasai skor maksimum (skor 3). Proses Penyekoran
oleh siswa SMP. pada option yang salah dilakukan secara
Pada kasus butir soal 33 tampak partial, untuk selanjutnya dikategorikan
bahwa peserta yang memilih option B diberi menurut bobot kesalahannya menjadi kategori
skor “1”, dan peserta yang memilih option ringan (skor 2), kategori sedang (skor 1), dan
A, C dan D diberi skor “0”. Pada Rubrik kategori berat (skor 0).

13
JURNAL KEPENDIDIKAN, Volume 43, Nomor 1, Mei 2013, Halaman 9 - 18

Penyekoran politomus PCM yang merupakan gabungan dari butir soal bilangan,
dikembangkan bertujuan untuk mengatasi aljabar, geometri dan pengukuran, dan butir
kelemahan model Penyekoran dikotomus, soal statistika dan peluang. Kemampuan
yaitu tidak dapat digunakan untuk mengontrol peserta pada butir soal statistika dan peluang
distraktor dan untuk mengetahui kesalahan 0,29888, kemampuan peserta pada butir soal
yang dilakukan oleh peserta, karena aljabar 0,28985, kemampuan peserta pada
semua option yang salah diberi skor “0”. butir soal geometri 0,23777, dan kemampuan
Kenyataannya, kesalahan pada distraktor dapat peserta pada butir soal bilangan -0,06100.
berasal dari sumber kesalahan yang berbeda. Deskripsi kemampuan peserta pada UN
Pengembangan model Penyekoran politomus mata pelajaran matematika diperoleh rerata
ini dengan menyesuaikan PCM dari Masters 0,23910, median 0,18807, simpangan baku
dengan pertimbangan (1) model Penyekoran 0,34016, dengan standard error of estimation
politomus dapat memberikan credit pada 0,0136.
penerapan atribut dengan benar, (2) model
Penyekoran politomus akan memberikan Tingkat Kesulitan Butir pada Model Rasch
peluang meningkatkan akurasi pengukuran (RM)
dibandingkan dengan model dikotomus, (3) Deskripsi tingkat kesulitan butir RM
antar tahapan dalam menyelesaikan butir soal pada butir soal UN Matematika mempunyai
matematika tidak selalu mempunyai tingkat rerata –0,085, median –0,1576, range 2,77,
kesulitan yang sama, dan (4) kategori yang minimum –1,51, maksimum 1,26, dan
lebih tinggi tidak selalu mempunyai threshold standard error of estimation 0,1222. Rerata
yang lebih tinggi, demikian juga kategori tingkat kesulitan tertingi pada bilangan
yang lebih rendah tidak selalu mempunyai 0,540719, kemudian pada aljabar 0,054208,
threshold yang lebih rendah. pada ststistika dan peluang -0,33709, dan
terendah pada geometrid dan pengukuran
Tingkat Kesulitan Butir -0,33709. Tingkat kesulitan sebesar -0,085
Pada penelitian ini difokuskan pada mempunyai makna bahwa peserta diharapkan
Penyekoran dikotomus model Rasch (RM) dan dapat menyelesaikan butir soal dengan benar
Penyekoran politomus model Partial Credit jika mempunyai kemampuan minimal -0,085.
(PCM). PCM merupakan perluasan dari RM, Parameter tingkat kesulitan butir merupakan
sehingga diasumsikan bahwa semua butir parameter lokasi yang menunjukkan posisi
soal mempunyai daya beda yang sama. Pada kurva karakteristik butir dalam hubungannya
RM atau PCM diasumsikan bahwa parameter dengan skala kemampuan. Parameter tingkat
tingkat kesulitan butir merupakan satu-satunya kesulitan butir digambarkan oleh suatu titik
karakteristik butir yang mempengaruhi kinerja pada skala kemampuan dimana peluang
peserta didik, yang berarti parameter tebakan menjawab betul sebesar 0,5. Semakin besar
semu © diasumsikan tidak berpengaruh nilai parameter beta, maka semakin besar
terhadap peluang kemampuan peserta untuk kemampuan yang diperlukan peserta untuk
menjawab butir soal dengan betul. Peluang mendapatkan peluang 50% menjawab butir
peserta didik berhasil mengerjakan butir soal soal dengan betul.
tergantung pada kemampuan (ability) dan
tingkat kesulitan (difficulty) butir soal yang Tingkat Kesulitan Butir pada Model Partial
dikerjakannya. Credit (PCM)
Kemampuan peserta pada matematika PCM tidak mensyaratkan langkah
dinyatakan oleh parameter theta. Estimasi penyelesaikan butir tes harus berurutan dan
kemampuan peserta pada butir soal matematika tidak harus mempunyai kesulitan yang sama

14
Awal Isgiyanto: Perbandingan Penyekoran Model Rasch...

(De Ayala, 1993). PCM yang dikembangkan 3, maka butir soal tersebut mempunyai 3
ini mempunyai empat kategori, sehingga threshold. Threshold 1 dari kategori 0 ke
analisis PCM menghasilkan tiga thresholds kategori 1, Threshold 2 dari kategori 1 ke
(tingkat kesulitan) untuk setiap butir, yakni kategori 2, dan Threshold 3 dari kategori
Thresholds Butir Soal Bilangan, Thresholds 2 ke kategori 3. Perpotongan grafik antara
Butir Soal Aljabar, Thresholds Butir Soal kategori 0 dan kategori 1 menghasilkan
Geometri dan Pengukuran, dan Thresholds suatu titik. Jika dari titik tersebut ditarik
Butir Soal Statistika dan Peluang. garis lurus memotong sumbu ability, maka
Berdasarkan Thresholds Butir Soal titik potong dengan sumbu ability disebut
Bilangan diperoleh hasil dari threshold 1 ke threshold 1. Perpotongan grafik antara
threshold 2 yang mengalami kenaikan pada kategori 1 dan kategori 2 menghasilkan suatu
butir soal 1 dan 3 serta yang mengalami titik. Jika dari titik tersebut ditarik garis lurus
penurunan pada butir soal 2, 4, 9, dan 10. memotong sumbu ability, maka titik potong
Threshold 2 ke threshold 3 yang mengalami dengan sumbu ability disebut threshold 2.
kenaikan pada butir soal 2 dan 10, dan yang Perpotongan grafik antara kategori 2 dan
mengalami penurunan pada butir soal 1, 3, kategori 3 menghasilkan suatu titik. Jika dari
4, dan 9. titik tersebut ditarik garis lurus memotong
Hasil analisis Thresholds Butir Soal sumbu ability, maka titik potong dengan
Aljabar dari threshold 1 ke threshold 2 yang sumbu ability disebut threshold 3.
mengalami kenaikan pada butir soal 6, 8, Butir soal 10 mempunyai threshold 1
11, 12, 13, dan 15, dan yang mengalami sebesar 3,61417, mempunyai makna bahwa
penurunan pada butir soal 5, 7, 14, dan 16. peserta dapat menyelesaikan dengan betul
Threshold 2 ke threshold 3 yang mengalami dari kategori 0 ke kategori 1 apabila peserta
kenaikan hanya pada butir soal 14, dan mempunyai kemampuan minimal 3,61417.
pada butir soal aljabar yang lain mengalami Nilai threshold 2 sebesar -2,77800, mempunyai
penurunan. makna bahwa para peserta harus memiliki
Hasil analisis Thresholds Butir Soal kemampuan mininal sebesar -2,77800 untuk
Geometri dan Pengukuran Dari threshold dapat menyelesaikan dengan betul dari
1 ke threshold 2 yang mengalami kenaikan kategori 1 ke kategori 2. Nilai threshold 3
pada 11 butir soal, yaitu butir soal 22, 23, sebesar -1,42640, mempunyai makna bahwa
24, 27, 28, 30, 31, 33, 34, dan 36, dan yang peserta harus memiliki kemampuan minimal
mengalami penurunan pada 5 butir soal, yaitu sebesar -1,42640, untuk dapat menyelesaikan
butir 25, 9, 32, 35, dan 37. Threshold 2 ke kategori 2 dan kategori 3 dengan betul.
threshold 3 yang mengalami kenaikan pada Untuk melihat kecenderungan
3 butir soal, yaitu butir 25, 31, dan 37, dan Threshold 1, Threshold 2, dan Threshold 3
yang mengalami penurunan pada 13 butir pada bilangan, aljabar, geometri, statistika,
soal yang lain. dan matematika disajikan pada Gambar 1.
Hasil analisis Thresholds Butir Soal Pada Gambar 1 tampak bahwa threshold pada
Statistika dan Peluang Dari threshold 1 ke submateri bilangan semakin tinggi posisi
threshold 2 yang mengalami kenaikan butir threshold, maka nilai threshold semakin
soal 38 dan 39, yang mengalami penurunan rendah, yang berarti semakin mudah. Pada
pada butir soal 40 terjadi pada threshold 2 ke submateri aljabar, geometri, dan statistika
threshold 3. tampak bahwa dari threshold 1 ke threshold
Penyekoran politomus memiliki tingkat 2 semakin sulit, dan dari threshold 2 ke
kesulitan (threshold) lebih dari 1. PCM threshold 3 semakin mudah.
dengan 4 kategori Penyekoran 0, 1, 2, dan

15
JURNAL KEPENDIDIKAN, Volume 43, Nomor 1, Mei 2013, Halaman 9 - 18

Butir soal UN Matematika secara kecil dibandingkan nilai fungsi informasi tes
keseluruhan mempunyai rerata threshold 1 pada PCM. Hal ini bisa terjadi karena model
sebesar 0,07335, rerata threshold 2 sebesar Penyekoran politomus mempunyai kategori
0,37047, dan rerata threshold 3 sebesar lebih banyak dibandingkan dengan kategori
-0.99802. Berdasarkan hasil analisis tersebut pada model dikotomus, sehingga varians pada
dapat dikatakan bahwa tingkat kesulitan pada model politomus lebih kecil dibandingkan
butir soal UN Matematika yang paling tinggi dengan varians pada model dikotomus.
pada umumnya adalah threshold 2, diikuti Varians pada model politomus lebih kecil
threshold 1, dan yang paling mudah pada dibandingkan varians pada model dikotomos,
umumnya terjadi pada threshold 3. sehingga nilai fungsi informasinya model
politomus lebih besar dibandingkan dengan
Fungsi Informasi Tes nilai fungsi informasi pada dikotomus. Kurva
Nilai fungsi informasi tes yang fungsi informasi model politomus lebih tinggi
diberikan pada RM dan PCM pada bilangan, dan lebih sempit, sehingga hasil estimasinya
aljabar, geometri dan pengukuran, statistika lebih akurat. Hasil tersebut menunjukkan
dan peluang, dan matematika disajikan pada bahwa data UN Matematika pada PCM dapat
Tabel 2. memberikan nilai fungsi informasi tes yang
Pada Tabel 2 tampak bahwa nilai fungsi lebih baik dibandingkan dengan nilai fungsi
informasi tes pada PCM sebesar 50,09 lebih informasi tes yang dihasilkan RM. Hasil
besar dari pada estimasi skor fungsi informasi penelitian ini sejalan dengan penelitian Wasis
tes pada RM sebesar 46,1. Hasil estimasi (2009: 50) bahwa semakin tinggi kurva fungsi
menunjukkan bahwa data UN Matematika informasi suatu butir atau tes, maka butir atau
pada PCM dapat memberikan nilai fungsi tes tersebut semakin baik dalam mengestimasi
informasi tes yang lebih baik dan lebih akurat kemampuan peserta.
dibandingkan dengan nilai fungsi informasi
tes yang dihasilkan RM. Simpulan
Hasil TIF yang diperoleh pada RM dan Berdasarkan hasil dan pembahasan,
PCM submateri bilangan, aljabar, geometri dapat ditarik beberapa simpulan. Pertama,
dan pengukuran, statistika dan peluang, atribut yang mendasari butir soal pada
dan matematika disajikan pada Tabel 2. matematika ada 47 atribut yang terdiri atas
Pada Tabel 2 tampak bahwa nilai fungsi empat atribut isi, 36 atribut proses, dan tujuh
informasi tes RM pada matematika lebih atribut keterampilan. Kedua, kemampuan

Gambar 1. Diagram Garis Threshold 1, Threshold 2, dan Threshold 3 pada Submateri


Bilangan, Aljabar, Geometri, Statistika, dan Matematika

16
Awal Isgiyanto: Perbandingan Penyekoran Model Rasch...

Tabel 2. Fungsi Informasi Tes untuk Model Rasch dan Model Partial Credit

peserta yang tertinggi pada butir soal statistika 2006, tentang Standar Isi untuk Satuan
dan peluang, diikuti kemampuan peserta Pendidikan Dasar dan Menengah.
pada butir soal aljabar, kemampuan peserta
pada butir soal geometri, dan terendah dan Gierl, M. J. 2007a. “Making Diagnostic
kemampuan peserta pada butir soal bilangan. Inferences about Cognitive Attributes
Ketiga, tingkat kesulitan tertingi pada model Using the Rule-space Model and
Rasch dicapai pada bilangan, kemudian aljabar, Attribute Hierarchy Method”. Journal
ststistika dan peluang, dan terendah pada of Educational Measurement, 44(4),
geometri dan pengukuran. Threshold model 325-340.
Partial Credit pada butir soal matematika Gierl, M. J. 2007b. “Using the Attribute
yang tertinggi adalah threshold 2, diikuti Hierarchy method to make diagnostic
threshold 1, dan yang terendah terjadi pada inferences about examinees’ cognitive
threshold 3. Keempat, hasil fungsi informasi skills”. Makalah disajikan dalam
tes model Partial Credit dapat memberikan Association of Test Publishers Annual
nilai fungsi informasi tes yang lebih baik dan Meeting Palm Springs, 6 February
lebih akurat dibandingkan dengan nilai fungsi 2007.
informasi tes yang dihasilkan model Rasch.
Gierl, M. J., Yinggan Zheng, & Ying Cui.
DAFTAR PUSTAKA 2008. “Using the Attribute Hierarchy
Bond, T. G., & Fox, C. M. 2007. Applying Method to Identify and Interpret
the Rasch Model: Fundamental Cognitive Skills that Produce Group
Measurement in the Human Sciences. Differences”. Journal of Educational
(2nd Ed.). Mahwah: Lawrence Erlbaum Measurement, 45 (1), 65-89.
Associates, Publishers.
Hambleton, R. K., Swaminathan, H., &
De Ayala, R. J. 1993. “Methods, Plainly Rogers, H. J. 1991. Fundamentals of
Speaking: An Introduction to Item Response Theory. Newbury Park:
Polytomous Item Response Theory Sage Publications.
Models”. Measurement and Evaluation
Hessen, D. J. 2009. “Applying IRT using R”.
in Counseling and Development, 25,
Makalah disajikan dalam Pelatihan
172-189
Aplikasi Program R dalam Bidang
DeMars, C. 2010. Item Response Theory. New Psikometri dan Penilaian Pendidikan,
York: Oxford University Press, Inc. di PPs Universitas Negeri Yogyakarta,
Juni, 2009.
Depdiknas. 2006. Peraturan Menteri
Pendidikan Nasional Nomor 22, Tahun

17
JURNAL KEPENDIDIKAN, Volume 43, Nomor 1, Mei 2013, Halaman 9 - 18

Roberts, M. R., & Gierl, M. J. 2010. IRT as a Diagnostic Aid. Journal of


“Developing Score Reports for Educational Measurement, 40, 255-
Cognitive Diagnostic Assessment”. 275.
Educational Measurement: Issues and
Practice. 29 (3), 25-38. Wasis. 2009. “Penyekoran Model Partial
Credit pada Item Multiple True-False
Thissen, D., Nelson, L., Rosa, K., et al. 2001. Bidang Fisika”. Disertasi Doktor. Tidak
“Item Response Theory for Items Scored Diterbitkan. Yogyakarta: Universitas
in More than Two Categories” dalam Negeri Yogyakarta.
D. Thissen & H. Wainer. Test Scoring
(pp. 141-184). New Jersey: Lawrence Wells, C. S., Hambleton, R.K., & Urip
Erlbaum Associates Publishers. Purwono. “Polytomous Response IRT
Models and Applications”. Makalah
Walker, C. M., & Beretuas, S. N. 2003. Disajikan dalam Pelatihan Asesmen
Comparing Multidimensional Pendidikan dan Psikologi (Psikometri),
and Undimensional Proficiency 18-24 Juni 2008 di PPs Universitas
Classifications: Multidimensional Negeri Yogyakarta.

18

You might also like