Professional Documents
Culture Documents
X = T + E ………………………………………………………….. (1)
dengan :
X : skor amatan,
T : skor sebenarnya,
E : skor kesalahan pengukuran (error score).
1
Asumsi-asumsi pada teori tes klasik ini dijadikan dasar untuk menge mbangkan
formula-formula dalam menentukan validitas dan reliabilitas tes.
Validitas dan reliabilitas pada perangkat tes digunakan untuk menentukan
kualitas tes. Kriteria lain yang dapat digunakan untuk menentukan kualitas tes
adalah indeks kesukaran dan daya pembeda.
1). Reliabilitas
Mehrens & Lehmann (1973: 102) menyatakan bahwa reliabilitas
merupakan derajat keajegan (consistency) di antara dua buah hasil pengukuran
pada objek yang sama. Definisi ini dapat diilustrasikan dengan seseorang yang
diukur tinggi badannya akan diperoleh hasil yang tidak berubah walaupun
menggunakan alat pengukur yang berbeda dan skala yang berbeda. Dalam
kaitannya dengan dunia pendidikan, prestasi atau kemampuan seorang siswa
dikatakan reliabel jika dilakukan pengukuran, hasil pengukuran akan sama
informasinya, walaupun penguji berbeda, korektornya berbeda atau butir soal
yang berbeda tetapi memiliki karakteristik yang sama.
Allen & Yen (1979: 62) menyatakan bahwa tes dikatakan reliabel jika skor
amatan mempunyai korelasi yang tinggi dengan skor yang sebenarnya.
Selanjutnya dinyatakan bahwa reliabilitas merupakan koefisien korelasi antara
dua skor amatan yang diperoleh dari hasil pengukuran menggunakan tes yang
paralel. Dengan demikian, pengertian yang dapat diperoleh dari pernyatan
tersebut adalah suatu tes itu reliabel jika hasil pengukuran mendekati keadaan
peserta tes yang sebenarnya.
Dalam pendidikan, pengukuran tidak dapat langsung dilakukan pada ciri
atau karakter yang akan diukur. Ciri atau karakter ini bersifat abstrak. Hal ini
menyebabkan sulitnya memperoleh alat ukur yang stabil untuk mengukur
karakteristik seseorang (Mehrens & Lehmann, 1973: 103).
Berdasarkan uraian di atas, maka dalam pembuatan alat ukur dalam dunia
pendidikan harus dilakukan secermat mungkin dan disesuaikan dengan kaidah-
kaidah yang telah ditentukan oleh ahli-ahli pengukuran di bidang pendidikan.
Untuk melihat reliabilitas suatu alat ukur, yang berupa suatu indeks reliabilitas,
dapat dilakukan penelaahan secara statistik. Harga ini biasa dina makan dengan
koefisien reliabilitas (reliability coefficient).
2
Untuk menentukan harga reliabilitas suatu tes (butir soal berbentuk pilihan
ganda (multiple choice)) dapat digunakan formula sebagai berikut .
2
^ R i
1 …………………………………………….(2)
R 1 x2
dengan :
R : banyaknya butir soal,
2 : varians.
Mehrens & Lehmann (1973: 104) menyatakan bahwa meskipun tidak ada
perjanjian secara umum, tetapi secara luas dapat diterima bahwa untuk tes yang
digunakan untuk membuat keputusan pada siswa secara perorangan harus
memiliki koefisien reliabilitas minimal sebesar 0,85. Dengan demikian, pada
penelitian ini, tes seleksi digunakan untuk menentukan keputusan peda siswa
secara perorangan, sehingga indeks koefisien reliabilitasnya diharapkan minimal
sebesar 0,85.
2). Validitas
Validitas suatu perangkat tes dapat diartikan merupakan kemampuan suatu
tes untuk mengukur apa yang seharusnya diukur (Allen & Yen, 1979: 97;
Syaifudin Azwar, 2000: 45; Kerlinger, 1986). Ada tiga tipe validitas, yaitu
validitas isi, validitas konstruk dan validitas kriteria (Allen & Yen, 1979: 97;
Syaifudin Azwar, 2000: 45 ; Kerlinger, 1986 : 731).
Ada dua macam validitas isi , yaitu validitas kenampakan dan validitas
logika (Syaifudin Azwar, 2000: 45-47). Validitas isi berarti sejauh mana suatu
perangkat tes mencerminkan keseluruhan trait yang hendak diukur (Syaifudin
Azwar, 2000: 45), yang berupa analisis rasional terhadap domain yang hendak
diukur. Validitas kenampakan didasarkan pada pertanyaan apakah suatu butir -
butir dalam perangkat tes mengukur aspek yang relevan dengan domainnya.
Validitas logika berkaitan dengan keseksamaan batasan pada domain yang
hendak diukur, dan merupakan jawaban apakah keseluruhan butir merupakan
sampel representatif dari keseluruhan butir yang mungkin dibuat.
3
Validitas kriteria, disebut juga validitas prediktif, merupakan kesahihan
suatu perangkat tes dalam membuat prediksi, dapat meramalkan keberhasilan
siswa pada masa yang akan datang. Validitas prediktif suatu perangkat tes dapat
diketahui dari korelasi antara perangkat tes dengan kriteria tertentu yang
dikehendaki, yang disebut dengan variabel kriteria (Allen & Yen, 1979 : 97;
Syaifudin Azwar, 2000: 51).
pi =
B ………………………………………………………(3)
N
dengan :
p = proporsi menjawab benar pada butir soal tertentu.
B = banyaknya peserta tes yang menjawab benar.
N = jumlah peserta tes yang menjawab.
4
4). Daya Pembeda
Untuk menentukan daya pembeda, dapat digunakan indeks diskriminasi,
indeks korelasi biserial, indeks korelasi point biser ial, dan indeks keselarasan.
Pada analisis butir dalam penelitian ini, hanya digunakan indeks korelasi point
biserial. Koefisien korelasinya untuk suatu butir tes ditentukan dengan rumus:
X X p1
rpbis = 1 ………………...........................….…(4)
s X 1 p1
dengan r pbis = koefisien korelasi point biserial, X i merupakan variabel kontinu,
X 1 merupakan rerata skor X untuk peserta tes yang menjawab benar butir
X , dan p1 merupakan proporsi peserta tes yang menjawab benar butir tersebut.
Pada suatu butir soal, indeks daya beda dikatakan baik jika lebih besar
atau sama dengan 0,3. Indeks daya pembeda suatu butir yang kecil nilainya akan
menyebabkan butir tersebut tidak dapat membedakan siswa yang kemampuannya
tinggi dan siswa yang kemampuannya rendah. Pada analisis tes dengan Content-
Referenced Measures, indeks daya pembeda butir tidak terlalu perlu menjadi
perhatian, asalkan tidak negatif (Ebel & Frisbie, 1986; Frisbie, 2005). Jika
nilainya kecil, menunjukkan bahwa kemencengan distribusi skor dari populasi,
yang juga mengakibatkan validitas tes menjadi rendah.
E = x 1 xx , ……………………………………………….(5)
5
dengan x merupakan standar deviasi dari skor total dan xx’ merupakan
koefisien reliabilitas.
Kegiatan 1
Latihan Mengestimasi Tingkat Kesukaran, Daya Pembeda, dan Reliabilitas
Secara Manual
6
B. Analisis Butir Soal Aspek Kognitif dengan Program ITEMAN
Pada analisis butir soal aspek kognitif dengan program ITEMAN, data
masukan berupa data dikotomi, misal soal benar-salah, atau soal pilihan ganda,
atau soal menjawab singkat. Untuk instrumen yang jawabannya dikotomi, kunci
jawaban dapat dinyatakan dengan huruf mulai dari A sampai dengan I atau
dengan angka mulai dari 0 sampai dengan 9.
Dalam kesempatan ini dipilih soal objektif bentuk pilihan ganda deng an 4
alternatif jawaban. Data dituliskan dalam bentuk alphabetik (A, B, C, D).
Langkah pertama yang dilakukan adalah memasukkan data ke file dalam bentuk
ASCII atau DOS Text.
Contoh:
020 o N 10
DCABBCADAACBACDACBDC
44444444444444444444
yyyyyyyyyyyyyyyyyyyy
0042001 BADCCDABBDABBCDABDCD
0042002 BCADDACBCDABCADBADCC
dst
0042040 ABDCABDACCDABCDAACBC
Keterangan :
Baris pertama
Kolom 1 – 3 : jumlah butir soal, maksimum 250 butir (dalam hal ini 020)
4 : kosong/spsi
5 : untuk jawaban kosong (omit) (dalam contoh o)
6 : kosong/spasi
7 : untuk butir soal yang belum dikerjakan (dalam contoh N)
8 : kosong/spasi
9 – 10 : jumlah identitas data siswa (maks 80) (dalam contoh 10)
Baris kedua : Kunci jawaban
Baris ketiga : Jumlah pilihan jawaban
7
Baris ke empat : kode Y = Yes, butir soal dianalisis, N = butir soal tidak
dianalisis
Baris ke lima dst : jawaban responden. Bila data sudah masuk semua kemudian
disimpan dalam sub direktori tersendiri, yaitu satu sub direktori dengan program
ITEMAN. Dalam kesempatan ini data ditulis dengan “notepad” kemudian
disimpan dalam disket, yaitu jadi satu disket dengan program ITEMAN.
Misalkan data yang baru selesai dimasukkan itu diberi nama CONTOH-1.DAT.
Menjalankan program
Apabila program ITEMAN dan data sudah dalam 1 disket maka cara
menjalankannya adalah sebagai berikut.
1. Start – program – Acessories- MS Dos Promt
2. C> lalu ketik A :
3. A :\ > ITEMAN lalu tekan ENTER maka di layar akan tampak:
-----------------------------------------------------------------------------------------
ITEM & TEST ANALYSIS PROGRAM
>>>***************************************************************
Enter the name of the input file:
------------------------------------------------------------------------------------------
4. Ketik nama file yang akan dianalisis, misalnya CONTOH-1.DAT Enter
-------------------------------------------------------------------------------------------
Enter the name of the outout file:
-------------------------------------------------------------------------------------------
Komputer meminta diisikan nama output file (file hasil analisis)
5. Ketik nama file output (hasil) yang dikehendaki, misal CONTOH-1.OUT
lalu tekan ENTER, maka muncul:
-------------------------------------------------------------------------------------------
Do you want the score written to a file?:
-------------------------------------------------------------------------------------------
Y = bila dikehendaki hasil analisis direkam
N = bila hasil analisis tidak direkam.
Bila diketik Y maka akan muncul:
-------------------------------------------------------------------------------------------
8
Enter the name of the score file:
-------------------------------------------------------------------------------------------
Komputer minta diisikan nama file untuk skor peserta tes.
6. Ketikkan nama file untuk hasil skor, misal CONTOH-1.SCR lalu tekan
ENTER
Dalam waktu beberapa detik, akan muncul tampilan:
Ini menunjukkan bahwa proses analisis telah selesai. Hasil dapat diprint, namun
sebelumnya ditata dulu agar hasilnya tidak terpotong-potong. Contoh hasil
analisis dapat dilihat pada halaman berikut.
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
9
Scale Statistics
----------------
Scale: 0
-------
N of Items 20
N of Examinees 40
Mean 5.575
Variance 2.394
Std. Dev. 1.547
Skew -1.699
Kurtosis 1.403
Minimum 2.000
Maximum 7.000
Median 6.000
Alpha 0.490
SEM 1.889
Mean P 0.279
Mean Item-Tot. 0.198
Mean Biserial 0.272
10
6. Skew adalah kemiringan distribusi skor peserta tes. Juling negatif
menunjukkan bahwa sebagian besar skor berada di bagian atas (skor tinggi)
dari distribusi skor, dan sebaliknya
7. Kurtosis adalah puncak distribusi skor yang menggambarkan kelandaian
distribusi skor peserta tes dibanding dengan distribusi normal. Nilai positif
menunjukkan distribusi lebih lancip, dan nilai negatif menunjukkan distribusi
yang lebih landai (merata). Kurtosis untuk distribusi normal adalah nol.
8. Alpha adalah koefisien reliabilitas alpha untuk tes tersebut.
9. SEM (standard error of measurement) adalah kesalahan baku pengukuran
untuk setiap tes.
10. Mean P adalah rata-rata tingkat kesukaran semua butir soal dalam tes
secara klasikal dihitung dengan cara mencari rata-rata proporsi peserta tes
yang menjawab benar untuk semua butir dalam soal tes tersebut.
11. Mean Item-Tot adalah nilai rata-rata indeks daya beda dari semua butir
dalam tes yang diperoleh dengan menghitung nilai rata-rata point biserial dari
semua butir dalam tes/skala.
12. Mean Biserial adalah nilai rata-rata indeks daya beda dari semua butir
dalam tes yang diperoleh dengan menghitung nilai rata-rata biserial dari
semua butir dalam tes/skala.
DAFTAR PUSTAKA
Anonim. 1986. User' manual for ITEMAN, RASCAL and ASCAL. N.C. ASCAR
11
Kegiatan 2
Menganalisis Butir Soal Dikotomi
12
000042 BCBADADABABCCABCCCACAABDDACCCDACCBAAABCB
000043 BCBADADABABCCABCCDBBAABBDACCCCACCCBAABCA
000044 BCBCDADABABCCADCCCADAABBDACCCDACCCBCACCB
000045 BCBAAADABACCCBDCCBAAAABBDACCCDBCCCAABCCB
000046 BCBADADABABCDABCCBADAABBDACCCDBCCCAAABCB
000047 BCBCDADACABADABCCCADAABCCBBCCCACCACDABCB
000048 BCBCCADDBABCAABCDDCAAABBDADCCCBCBCAACBCB
000049 BDBDDADBBACABABCADCAAABADABCCDACCAADBBAB
000050 BCBADADACABCCABCCBADAABBDACCCDACCACADBCB
000051 BCBADAABAADCDABCCAD AABBDACCCCBCCCAACBCB
000052 DCBADADBBABABABCBCABAABBDADCCBDCCDDDABAB
000053 BCBCDADABABCDABCBDBBAABCDACCCDACBCAACBCB
000054 BCBCDADABABCCABCCBADAABDDACCCDBCBCAAABCB
000055 CCCCDADBBABCCABCCBADAADBDACCCDBCCCCCBBCB
000056 BABCDADBBAACBABCCCACAABBDACCCDBCCCBACBCB
000057 BABACADABABCDCBCDBCBAABCDABCCCBABCCAACCB
000058 BCBCDADBBADCAABCDBAAABCBAACCDDADCCBABCBB
000059 BCBCDADABACCCCBCCDABAABBDACCCDBCBCBACBCB
000060 BCBCDADABAACCABCBCADAABBDABCCDACCCBAABCB
000061 BABACADAAABCACBCBBBCAACCDBCCBCACBDBDBABB
000062 BCBCDADABABCCABCCCCDAACBDABCCDBCDCDAABBB
000063 BCBCDADADABCCABCCBAAAABDDACCCDBCCCAAABCB
000064 BCBADADBDABCBBBCCBB ABCADAACABACACBBADCB
000065 BCBADADABABCAABCCBCDAABADACCCCBCCCABABAB
000066 BABCDCDABADCAACCBCCAAABDDAACBCACBCDABBBB
000067 BABCDADABADCDABCDDDAAABBDACCCCACBCAAAABB
000068 BCBADADBCABADBCCDDBAAACB ACCCDACBCCACAAB
000069 BCBCDADABABCCABCCBADAABBDABCCDBCCCAACBCB
000070 BABADADABABCCABCCBCDAABBDACCCDACBCABCCBB
000071 BCAADADABABCDACCCBCDABBBDADCCCACCCCBCBBB
000072 BCBADADABAACDADCCCBCAACBDABCCDACBCAAABBB
000073 BACADADBBABCCABCCBABAABABAACCDBCBCDAABBB
000074 CCBADADCDA ABBBCDDABAACBDAACCD CBCAAAAAA
000075 BDBADADABACACABCCBDDAABBDACCCCCCBCAACBDB
000076 BCBCDADABABACABCCAADAABBDACCCDACDCAACCCB
000077 BCBADADABABCCABCCCDDAABBBACCCBBCCDDCCBCB
000078 BCBADADAAADCDACCCAADAABDDACCCBBCCCACCBCB
000079 BCBCDADBBABCCABCBBDAAAABDACCBBACABAADBCB
000080 BCBADADABABCCABCCAADAABBDACCCDBCBDAAABCB
000081 BCBCDADABABACABCCBADAABBDACCADBCCCDAABCB
000082 BABCDADBBABCCABCBDBCAACDDACCCDACACBAABCB
000083 BCBCDADABADCCABCCBABAABBDACCCDBCBAAAABCB
000084 CCBCDADABADCCABCCBABAABDDABCCDACBCCAABCB
000085 BCBADADABABCCCBCDDBAAACCDACCCDACBCCAABDB
000086 BCBCDADABABCCABCCDCBAABDDACCCDBCCCAAABDB
000087 AABABADBCBBCDDBCBDCCAABBDACCCBACCCACABBB
000088 BCBADADABABCCABCCBAAAABBDACCCDCCCCAAABCB
000089 BABCDCDBAACCDACCCBCACABBDABCCDACCDBAABCB
000090 BCBCCADACADCCABACDADAABBDAACCBBCACAAABDB
13