You are on page 1of 3

Review Artikel

Dosen Pengampu : Dr. Kana Hayati M.Pd.

Oleh : Kelompok 6
1. Munira Alfisyahrina (21309251056)
2. Lalu Irfan Abdul Manaf (21309251059)
3. Rahmadani Kholifa (21309251071)

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM


JURUSAN PENDIDIKAN MATEMATIKA
UNIVERSITAS NEGERI YOGYAKARTA
2022
Review Artikel

Judul : Evaluation of Mathematics Achievement Test: A Comparison between CTT and IRT
Tujuan : Tujuan utama dari penelitian ini adalah untuk menganalisis sifat psikometrik dari
instrumen pada dua kelompok siswa yang berbeda, yaitu ditetapkan validitas dan reliabilitas
instrumen menggunakan kerangka CTT dan IRT, serta menentukan DIF untuk setiap butir.

Sample : 80 Mahasiswa yang terdiri dari 34 mahasiswa jurusan matematika dan 46 mahasiswa
jurusan bahasa inggris dari University of Eastern Philippines in Northern Samar

Instrumen : 40 soal pilihan ganda dengan 5 pilihan jawaban (Soal terdiri dari Patterns and
relations, equations and distances, geometric and trigonometric, shapes, areas and volumes and
combinatory and probability)

Analisis Data :

Dua bagian analisis dilakukan untuk menetapkan sifat psikometrik.

Pertama menggunakan langkah-langkah teori tes klasik yang meliputi analisis butir soal.
Microsoft Excel digunakan untuk analisis dan perhitungan yang terlibat dalam analisis CTT.
SPSS digunakan untuk menentukan reabilitas tes.

Kedua, metode IRT digunakan untuk menyesuaikan kesulitan butir dan orang dengan
menggunakan Bigsteps WINSTEPS.

Untuk mendeteksi bias butir berkaitan dengan kelompok siswa yang berbeda, tes DIF dilakukan
menggunakan perangkat lunak untuk perhitungan statistik yang terlibat dalam IRT Likelihood-
Ratio Tes.

Hasil Penelitian :

a. Reliabilitas : Hasil Cronbach’s alpha menunjukkan 0.77 sehingga reliabilitas butir tes baik.
b. Indeks Kesulitan Butir Soal
Indeks kesulitan butir soal menggunakan teori klasik menunjukkan bahwa 73% butir soal
merupakan soal dengan kesulitan rata-rata, dan 27% menunjukkan soal sukar dan mudah.
Dari 37 butir yang dipertimbangkan dalam tes, hanya 3 atau 8% yang muncul sebagai butir
yang buruk. Ini butir ditolak. Hanya dua butir yang perlu ditingkatkan.
Tiga puluh atau 81% merupakan butir yang baik atau butir yang sangat baik. Ini hanya
berarti bahwa secara umum, butir untuk tes prestasi benar-benar mewakili kemampuan
belajar peserta tes. Sebagian besar butir bisa membedakan dengan baik kelompok berkinerja
tinggi dan rendah.
c. DIF Analisis
Uji signifikansi butir 3, 4, 7, 8 11, 36, 38 dan 40 menunjukkan DIF. Jurusan bahasa inggris
lebih banyak merespon dalam kategori skor lebih rendah di butir 3 yang dibuktikan dengan
nilai chi-kuadrat ( x 2 = 5,5, df =3) lebih besar dari nilai kritis X 2 = 3,84.
Nilai signifikan yang serupa dapat diamati pada butir 4, 7, 8, 11, 36, 38 dan 40 dengan nilai
chi-kuadrat yang dihitung dari 6.4, 4.9, 4.6, 3.9, 8.1, 14.11, dan 5.5 masing-masing. Hasil ini
menunjukkan bahwa kesulitan butir berfungsi secara berbeda di kedua kelompok dan
sebagai hasilnya peserta ujian bahasa Inggris dan matematika mungkin memiliki peluang
yang berbeda untuk mendapatkan nilai yang sama.
Di sisi lain, setelah pemeriksaan dekat dari butir, itu mungkin berarti bahwa konsep butir
tertentu ini tidak dibahas secara mendalam untuk jurusan bahasa Inggris. Namun demikian,
semua butir dengan DIF ini harus direvisi sehingga seimbang untuk kedua kelompok siswa.

You might also like