You are on page 1of 16

Jurnal Sosio Humaniora Vol. 3 No.

4, September 2012 ISSN : 2087-1899

EVALUASI KUALITAS TES PSIKOLOGI KEPRIBADIAN I

Muhammad Wahyu Kuncoro


Fakultas Psikologi Universitas Mercu Buana Yogyakarta
(email : wahyu_umby@yahoo.co.id)

Abstract

This study aims to determine how well the items of the exam in the personality
psychology test. In this study, the statistical methods were used to identify the item difficulty,
which is a measure of the proportion of examinees who responded to an item correctly, and the
item discrimination, which is a measure of how well the item discriminates between examinees.
An additional analysis that is the distractor analysis. The distractor analysis provides a measure
of how well each of the incorrect options contributes to the quality of a multiple choice item.

By using The Iteman Program showed that the 60 analyzed items were well enough and can
be used. A total of 46 items has an Easy and Medium of The item difficulty index. In addition
there are about 44 items with good and very good of the item discrimination index and about 57
points aitem already possess the characteristics of a good. The reliability coefficient alpha of this
personality test is 0.898, so it is considered to have good reliability.

Pendahuluan dalam pembangunan yang terus


Masalah pendidikan merupakan berkembang.
suatu masalah yang sangat penting, karena Prestasi belajar sebagai salah satu
melalui pendidikan kita akan mendapatkan tolok ukur peningkatan mutu pendidikan,
insan-insan yang berkualitas bagi termasuk pendidikan tinggi. Para pengelola
pembangunan bangsa. Tingkat pendidikan pedidikan telah melakukan berbagai usaha
suatu negara akan menentukan kemajuan untuk memperbaiki dan meningkatkan
suatu bangsa. prestasi belajar mahasiswa. Usaha-usaha
Stiggins (1994) mengemukakan tersebut antara lain : melalui perbaikan
bahwa pendidikan sangat berperan dalam kurikulum, penyetaraan kualitas pengajar,
membentuk masa depan individu dan penambahan fasilitas pelajaran dan lain-lain
masyarakat, baik dalam bidang ilmu (Rustaman, 2003).
pengetahuan, bidang seni, bidang oleh raga Menurut Azwar (2002) prestasi
maupun bidang lain. belajar merupakan indikator utama dari
Kualitas pendidikan ditunjukkan oleh proses belajar, sebagaimana dari nilai yang
peningkatan kualitas proses dan hasil diperoleh. Demikian juga Masrun dan
pendidikan itu sendiri. Proses pendidikan Martaniah (1976) menyatakan bahwa
yang berkualitas akan menghasilkan tenaga prestasi belajar dipakai sebagai ukuran
terampil dan ahli yang sangat dibutuhkan untuk mengetahui hasil kegiatan belajar,

58
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

yaitu sejauhmana siswa dapat menguasai menghasilkan nilai tentang tingkah laku atau
bahan pelajaran yang telah diajarkan. prestasi siswa sebagai peserta didik.
Evaluasi merupakan salah satu
Pada saat ini peneliti adalah dosen
rangkaian kegiatan dalam meningkatkan
pengampu mata kuliah psikologi
kualitas, kinerja atau produktivitas suatu
kepribadian, sebagai salah satu mata kuliah
lembaga dalam melaksanakan programnya
wajib dalam kurikulum program studi
Mardapi (2008). Oleh karena itu, evaluasi
psikologi. Selama ini peneliti telah
merupakan salah satu subsistem yang
menggunakan tes pilihan ganda sebagai
penting dalam sistem pendidikan. Dalam
bahan ujian mid dan akhir pada mata kuliah
Undang-Undang Nomor 20 Tahun 2003
psikologi kepribadian.
tentang Sistem Pendidikan Nasional,
evaluasi diatur dalam Bab XVI Pasal 57,58, Butir-butir soal yang disusun lebih
dan 59. Pelaksanaan evaluasi bertujuan mendasarkan pada pengungkapan
untuk mengukur dan mengendalikan mutu kompetensi mahasiswa berdasarkan Satuan
pendidikan. Acara Perkuliahan (SAP) yang telah
ditetapkan dalam RPKPS.
Bentuk tes yang digunakan
diantaranya berupa tes tertulis (paper and Sehubungan dengan
pencil test). Tes tertulis merupakan teknik penyelenggaraan evaluasi dalam
penilaian yang seringkali digunakan untuk pendidikan, maka pengampu mata kuliah
menilai prestasi belajar siswa. Melalui tes (dosen) bertanggungjawab pada kualitas
prestasi belajar, dapat diperoleh informasi perangkat tes yang digunakan dalam
yang dapat menggambarkan kemampuan evaluasi, termasuk di dalamnya perangkat
siswa (Stiggins, 1994)). Oleh karena itu, tes psikologi kepribadian 1.
pengelolaan ujian dan mutu bahan ujian
Untuk menjamin kualitas tes
yang digunakan perlu mendapat perhatian
psikologi kepribadian diperlukan
agar hasil tes dapat mencerminkan
pengembangan bank soal. Bank soal yang
kemampuan siswa yang sebenarnya.
biasa dikenal pendidik didefinisikan sebagai
Secara sederhana Allen & Yen kumpulan dari butir-butir tes. Namun bank
(1979) menyebut tes sebagai perangkat soal tidak hanya mengacu pada
untuk memperoleh sampel suatu perilaku sekumpulan soal-soal saja. Bank soal
individu. Ahli pengukuran yang lain, Djaali mengacu pada proses pengumpulan soal-
(2006) menyatakan tes adalah suatu cara soal, pemantauan dan penyimpanannya
atau alat untuk mengadakan penilaian yang dengan informasi yang terkait sehingga
berbentuk suatu tugas atau serangkain mempermudah pengambilannya untuk
tugas yang harus dikerjakan oleh siswa merakit soal-soal (Thorndike, 1982).
atau sekelompok siswa sehingga

59
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

Permasalahan yang diajukan adalah Setiap butir pertanyaan atau tugas


bahwa sampai saat ini peneliti dan tersebut mempunyai jawaban atau
sekaligus pengampu mata kuliah psikologi ketentuan yang dianggap benar. Dengan
kepribadian 1 belum memiliki bank soal demikian apabila suatu tugas atau
tersebut. pertanyaan menuntut harus dikerjakan oleh
seseorang, tetapi tidak ada jawaban atau
Terkait dengan permasalahan di
cara pengerjaan yang benar dan salah
atas, maka tujuan penelitian ini adalah
maka tugas atau pertanyaan tersebut
menguji kualitas tes kepribadian 1 melalui
bukanlah tes. Tes merupakan salah satu
analisis butir soal yang meliputi indeks
upaya pengukuran terencana yang
kesukaran (p), daya beda (d), dan distribusi
digunakan oleh guru untuk mencoba
respons.
menciptakan kesempatan bagi siswa dalam
Manfaat dari hasil studi ini adalah memperlihatkan prestasi mereka yang
memberikan informasi empiris guna berkaitan dengan tujuan yang telah
melakukan revisi terhadap aitem bilamana ditentukan (Gronlund, 1981).
diperlukan dan guna meningkatkan kualitas
Tes terdiri atas sejumlah soal yang
tes yang pada gilirannya akan
harus dikerjakan siswa. Setiap soal dalam
meningkatkan validitas hasil pengukuran
tes menghadapkan siswa pada suatu tugas
tes psikologi kepribadian 1 dan sekaligus
dan menyediakan kondisi bagi siswa untuk
untuk menyusun bank soal
menanggapi tugas atau soal tersebut. Tes
menurut Arikunto dan Jabar (2004)
Evaluasi Kualitas Tes Psikologi merupakan alat atau prosedur yang
Kepribadian 1 digunakan untuk mengetahui atau
mengukur sesuatu dengan menggunakan
Tes (test) merupakan suatu alat
cara atau aturan yang telah ditentukan.
penilaian dalam bentuk tulisan untuk
Dalam hal ini harus dibedakan pengertian
mencatat atau mengamati prestasi siswa
antara tes, testing, testee, tester.
yang sejalan dengan target penilaian
(Jacobs & Chase, 1992). Jawaban yang Testing adalah saat pada waktu tes
diharapkan dalam tes menurut Mardapi tersebut dilaksanakan (saat pengambilan
(2008) dapat secara tertulis, lisan, atau tes). Sementara itu Ebel (1972) menyatakan
perbuatan. Menurut Zainul dan Nasution bahwa testing menunjukkan proses
(2001) tes didefinisikan sebagai pertanyaan pelaksanaan tes. Testee adalah responden
atau tugas atau seperangkat tugas yang yang mengerjakan tes. Mereka inilah yang
direncanakan untuk memperoleh informasi akan dinilai atau diukur kemampuannya.
tentang suatu atribut pendidikan atau suatu Sedangkan Tester adalah seseorang yang
atribut psikologis tertentu.

60
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

diserahi tugas untuk melaksanakan dilihat dari keberpihakannya, menurut


pengambilan tes kepada responden. Stiggins (1993) asesmen lebih berpihak
kepada kepentingan siswa. Siswa dalam hal
Dewasa ini tes masih merupakan
ini menggunakan hasil asesmen untuk
alat evaluasi yang umum digunakan untuk
merefleksikan kekuatan, kelemahan, dan
mengukur keberhasilan siswa dalam
perbaikan belajar.
mencapai tujuan pendidikan dan
pengajaran (Subekti & Firman, 1989). Tes Sementara itu evaluasi menurut
yang baik harus memenuhi beberapa Rustaman (2003) lebih berpihak kepada
kriteria berdasarkan karakteristik butir soal kepentingan evaluator. Yulaelawati (2004)
antara lain meliputi indeks kesukaran (p), mengungkapkan bahwa terdapat perbedaan
daya beda (d), dan distribusi respons. antara evaluasi dengan asesmen. Evaluasi
(evaluation) merupakan penilaian program
Tes Psikologi Kepribadian 1 adalah
pendidikan secara menyeluruh. Evaluasi
sebuah tes prestasi belajar untuk
pendidikan lebih bersifat makro, meluas,
mendapatkan data, yang merupakan
dan menyeluruh. Evaluasi program
informasi untuk melihat seberapa banyak
menelaah komponen-komponen yang saling
pengetahuan yang telah dimiliki dan
berkaitan tentang perencanaan,
dikuasai oleh mahasiswa sebagai akibat
pelaksanaan, dan pemantauan. Sementara
dari pendidikan dan pelatihan yang
itu asesmen merupakan penilaian dalam
diperoleh di dalam perkuliahan selama
scope yang lebih sempit (lebih mikro) bila
setengah atau satu semester.
dibandingkan dengan evaluasi. Seperti
Berdasarkan uraian tersebut di atas, dikemukakan oleh Kumano (2001) asesmen
maka evaluasi kualitas tes psikologi hanya menyangkut kompetensi siswa dan
kepribadian 1 adalah upaya peninjauan perbaikan program pembelajaran.
kualitas butir-butir soal yang mengukur
Harlen (1982) mengungkapkan
keberhasilan mahasiswa dalam menguasai
perbedaan antara asesmen dan evaluasi
materi-materi pengetahuan mata kuliah
dalam hal metode. Evaluasi dinyatakan
psikologi kepribadian 1,sehingga diperoleh
menggunakan kriteria dan metode yang
informasi tentang indeks kesukaran (p),
bervariasi. Asesmen dalam hal ini hanya
daya beda (d), dan distribusi respons setiap
merupakan salah satu dari metode yang
butir soal tersebut.
dipilih untuk evaluasi tersebut. Selain dari
Tes, pengukuran, asesmen dan evaluasi itu, subyek untuk asesmen hanya siswa,
sementara itu subyek evaluasi lebih luas
Rustaman (2003) mengungkapkan
dan beragam seperti siswa, guru, materi,
bahwa asesmen lebih ditekankan pada
organisasi, dll.
penilaian proses. Sementara itu evaluasi
lebih ditekankan pada hasil belajar. Apabila

61
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

Yulaelawati (2004) menekankan tidak selalu memiliki jawaban atau cara


kembali bahwa scope asesmen hanya pengerjaan yang benar atau salah karena
mencakup kompetensi lulusan dan measurement dapat dilakukan melalui alat
perbaikan cara belajar siswa. Jadi ukur non-tes. Maka tugas atau pertanyaan
hubungannya lebih pada peserta didik. tersebut bukanlah tes. Selain dari itu, tes
Ruang lingkup evaluasi yang lebih luas mengharuskan subyek untuk menjawab
ditunjukkan dengan cakupannya yang atau mengerjakan tugas, sementara itu
meliputi isi atau substansi, proses pengukuran (measurement) tidak selalu
pelaksanaan program pendidikan, menuntut jawaban atau pengerjaan tugas.
kompetensi lulusan, pengadaan dan
Menurut Kumano (2001)
peningkatan tenaga kependidikan,
mengungkapkan bahwa meskipun terdapat
manajemen pendidikan, sarana dan
perbedaan makna/pengertian, asesmen dan
prasarana, dan pembiayaan.
evaluasi memiliki hubungan. Hubungan
Pengukuran, Tes, dan evaluasi antara asesmen dan evaluasi tersebut
dalam pendidikan berperan dalam seleksi, digambarkan sebagai berikut, “ Evaluasi
penempatan, diagnosa, remedial, umpan adalah untuk mengevaluasi data yang
balik, memotivasi dan membimbing. Baik diperoleh melalui pengukuran. Pengukuran
tes maupun pengukuran keduanya terkait adalah proses pengumpulan data yang
dan menjadi bagian istilah evaluasi. Meski menunjukkan perkembangan dari proses
begitu, terdapat perbedaan makna antara belajar.
mengukur dan mengevaluasi. Mengukur
Menurut Zainul & Nasution (2001)
adalah membandingkan sesuatu dengan
Hubungan antara tes, pengukuran, dan
satu ukuran tertentu. Dengan demikian
evaluasi adalah sebagai berikut. Evaluasi
pengukuran bersifat kuantitatif. Sementara
belajar baru dapat dilakukan dengan baik
itu evaluasi adalah pengambilan suatu
dan benar apabila menggunakan informasi
keputusan terhadap sesuatu dengan
yang diperoleh melalui pengukuran yang
ukuran baik-buruk. Dengan demikian
menggunakan tes sebagai alat ukurnya.
pengambilan keputusan tersebut lebih
Akan tetapi tentu saja tes hanya merupakan
bersifat kualitatif (Arikunto,2003; Zainul &
salah satu alat ukur yang dapat digunakan
Nasution, 2001).
karena informasi tentang hasil belajar
Setiap butir pertanyaan atau tugas tersebut dapat pula diperoleh tidak melalui
dalam tes harus selalu direncanakan dan tes, misalnya menggunakan alat ukur non
mempunyai jawaban atau ketentuan yang tes seperti observasi, skala rating, dan lain-
dianggap benar (Jacobs & Chase, 1992). lain.
Sementara itu tugas ataupun pertanyaan
Zainul dan Nasution (2001)
dalam kegiatan pengukuran (measurement)
menyatakan bahwa guru mengukur

62
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

berbagai kemampuan siswa. Apabila guru Seperti yang dikatakan Suharsimi


melangkah lebih jauh dalam (2003) bahwa soal pilihan ganda terdiri dari
menginterpretasikan skor sebagai hasil pernyataan dan pertanyaan yang harus
pengukuran tersebut dengan menggunakan dijawab oleh siswa atau melengkapi dengan
standar tertentu untuk menentukan nilai memilih salah satu dari beberapa alternatif
atas dasar pertimbangan tertentu, maka yang tersedia. Satu di antaranya adalah
kegiatan guru tersebut telah melangkah yang paling benar, lainnya disebut
lebih jauh menjadi evaluasi. pengecoh

Tes Pilihan Ganda Menurut Muhajir ( dalam Chabib,


2001) mengatakan bahwa pengertian Tes
Untuk mengukur seberapa jauh
Pilihan Ganda merupakan tes objektif
tujuan-tujuan pengajaran telah tercapai,
dimana masing-masing item disediakan
dapat dilakukan dengan evaluasi, dalam hal
lebih dari dua kemungkinan jawaban, dan
ini evaluasi hasil belajar. Alat ukur untuk
hanya satu dari pilihan-pilihan tersebut yang
mengevaluasi hasil belajar tersebut di
benar atau yang paling benar.
gunakan tes.Tes adalah cara (yang dapat
dipergunakan)atau prosedur yang (yang Sedangkan keunggulan tes pilihan
perlu ditempuh) dalam rangka pengukuran ganda menurut Azwar (2005) sebagai
dan penilaian di bidang pendidikan. berikut : (1) Kompherhensif, karena dalam
waktu tes yang singkat dapat memuat lebih
Menurut Suharsimi (2003) tes yang
banyak item. (2) Pemeriksaan jawaban dan
baik harus mempunyai syarat-syarat
pemberian skornya mudah dan cepat (3)
sebagai berikut:1) Harus efisien
Penggunaan lembar jawaban menjadikan
(Parsimony) 2) Harus baku (Standardize) 3)
tes efisien dan hemat bahan. (4) Kualitas
Mempunyai norma 4) Objektif 5) Valid
item dapat dianalisi secara empirik (5)
(Sahih) 6) Reliabel (Andal) Oleh sebab itu
Objektifitasnya tinggi. (6) Umumnya
untuk memperoleh tes yang baik, tes
memiliki reabilitas yang memuaskan.
tersebut harus di ujicobakan terlebih dahulu
dan hasilnya dianalisis sehingga memenuhi Disamping keunggulan tes pilihan
syarat-syarat tersebut di atas. ganda mempunyai kelemahan sebagai
berikut : (1) Pembuatannya sulit dan
Salah satu bentuk tes hasil belajar
memakan banyak waktu dan tenaga (2)
adalah Tes Pilihan Ganda. Tes pilihan
Tidak mudah ditulis untuk mengungkapkan
ganda adalah bentuk tes obyektif yang
tingkat kompetensi tinggi. (3) Ada
mempunyai ciri utama kunci jawaban jelas
kemungkinan jawaban benar semata-mata
dan pasti sehingga hasilnya dapat diskor
karena tebakan.
secara obyektif.

63
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

Langkah – langkah Menganalisis Tes Bila ada butir soal yang hampir tidak
ada peserta tes yang menjawab benar
a. Menghitung Indeks kesukaran
maka butir soal tersebut dikatakan butir
Hasil tes setelah diperiksa di beri
yang sukar, dan sebaliknya bila hampir
skor untuk jawaban benar 1 dan untuk
semua peserta tes menjawab benar maka
jawaban salah 0. Skor yang diperoleh di
butir tersebut dikatakan mudah. Dari hasil
urut dari skor yang paling tinggi ke skor
perhitungan indeks kesukaran maka
yang paling rendah serta di bagi 2 menjadi
kemungkinan tidak semua soal dapat
kelompok atas dan kelompok bawah.
terambil. Soal yang mempunyai indeks
Hitung Indeks Kesukaran Butir (IKB) kesukaran sedang yang dapat di ambil.
/ p dengan formula:
Kelemahan utama indeks kesukaran
IKB =T/R ´X 100% soal seperti ini ialah bahwa antara indeks
kesukaran soal dan taraf kesukaran soal
Ket :
mempunyai hubungan yang berlawanan
IKB atau p = Indeks Kesukaran Item, R = arah, artinya makin tinggi indeks
jumlah responden yang menjawab kesukarannya, maka makin rendahlah taraf
benar,dan kesukarannya. Dalam hal pengukuran yang
bertujuan untuk membedakan subyek yang
T = jumlah responden seluruhnya.
satu dengan yang lainnya dalam hal

Indeks Kesukaran Butir (IKB) dapat kompetensi mereka mengenai sesuatu mata
bernilai 0,00-1,00. pengetahuan, kebanyakan ahli berpendapat
bahwa tes yang terbaik adalah tes yang
Biasanya kategori Indeks Kesukaran Butir
terdiri dari soal-soal yang mempunyai taraf
adalah sebagai berikut :
kesukaran sedang dan rentang distribusi

0,00 - 0,20 adalah sangat sukar, kesukarannya yang kecil.

0,20 - 0,40 sukar, b. Menghitung daya beda


Menurut Suryabrata (2000) daya
0,40 - 0,60 sedang, pembeda soal diukur dari kesesuaian soal

0,60 - 0,80 mudah, dan itu dengan keseluruhan tes dalam


membedakan antara mereka yang tinggi
0,80-1,00 sangat mudah. kemampuannya dan mereka yang rendah
kemampuannya dalam hal yang diukur oleh
tes yang bersangkutan. Teknik yang banyak
Biasanya butir yang ditoleransi sebagai tes digunakan untuk mengukur daya pembeda
standar adalah yang memiliki IKB = 0,30- itu adalah korelasi antara skor pada soal
0,70. tertentu dengan skor total. Rumus korelasi

64
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

biserial yang paling banyak digunakan (2005) dan rekomendasi ahli lain (Crocker &
adalah : Algina, 1986) dan masih jauh lebih tinggi
daripada yang disarankan oleh Kehoe yaitu

Xb Xs p(1 p) 0,15 (Kehoe, 1997).


r bis
St y c. Analisis distraktor (pengecoh)
Analisis distraktor di perlukan hanya
untuk pembuat soal. Selain menghitung
Dengan keterangan : indeks kesukaran dan daya beda dalam
analisis butir juga perlu di ketahui apakah
Xb : rata –rata skor kriteria subyek yang distraktor atau pengecoh yang di sediakan
memilih jawaban benar tepat atau tidak benar. Apakah semua
pilihan yang disediakan dipilih semua
X s : rata-rata skor kriteria subyek yang
karena dianggap betul, jawaban terkumpul
menjawab salah
pada pilihan tertentu atau pilihan yang sama
St : simpangan baku skor kriteria semua sekali tidak ada pemilihnya.
subyek
Indikator lain mengenai efektivitas
p : proporsi subyek yang menjawab benar distraktor ditampakkan oleh koefisien r-
terhadap semua subyek pointbiserial bagi masing-masing distraktor.
Suatu distraktor yang efektif adalah yang
y : ordinat dalam kurve normal yang
memiliki koefisien r negatif. Semakin
pbis
membagi menjadi p dan 1-p
besar harga negatif r menunjukkan
pbis
Suatu butir soal harus dapat
bahwa fungsi distraktor semakin efektif
membedakan kelompok yang pandai
sedangkan r yang berada di sekitar nol
pbis
dengan kelompok yang lemah dalam hal ini
berarti distraktor tidak berfungsi
kelompok atas dan kelompok bawah.
sebagaimana mestinya. Pada aitem-aitem
Klasifikasi daya beda adalah sebagai
yang sulit, yaitu yang persentase subjek
berikut: 1) daya beda ≤ 0 (negatif), 2) 0,00-
menjawab benar sangat kecil, interpretasi
0,20 jelek 3) 0,21-0,20 cukup, 4) 0,41-0,71
efektivitas distraktor tidak dapat semata-
baik, 0,71-1,00 baik sekali. Soal-soal
mata disandarkan pada angka statistik r
dengan klafisifisi daya beda jelek dan pbis

negatif di buang, yang di ambil klasifikasi namun harus disertai dengan pertimbangan
cukup, baik, dan baik sekali. mengenai distribusi peluang subjek yang
menjawab salah pada aitem yang
Dalam analisis ini daya beda
bersangkutan.
dianggap memuaskan bila mencapai angka
0,25. Angka ini lebih tinggi dibanding
rekomendasi Thorndike sebesar 0,20

65
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

d. Blue Print Tes Psikologi Kepribadian Aitem yang diujikan berjumlah 60


1 butir soal, dengan durasi waktu
Gay (1987) menyatakan bahwa mengerjakan 65 menit. Soal-soal dikerjakan
validitas isi (content validity) adalah derajat secara individual dan bersifat tertutup.
pengukuran yang mencerminkan domain isi Penelitian dilaksanakan pada 23 Juli 2012.
yang diharapkan. Validitas isi penting untuk c. Subyek Penelitian
tes hasil belajar (achievement test). Suatu Subyek penelitian ini adalah para
skor kurang bahkan tidak mencerminkan mahasiswa Universitas Mercu Buana
hasil belajar siswa apabila instrumen tidak Yogyakarta yang mengikuti ujian akhir
mampu mengukur secara komprehensif apa pada mata kuliah psikologi kepribadian
yang telah dipelajari oleh siswa. 1 berjumlah 70 mahasiswa.

Prosedur yang hendak ditempuh d. Teknik Analisis Data

agar suatu tes hasil belajar mampu Data yang diperoleh dalam

mencerminkan domain isi secara penelitian ini, selanjutnya dianalisis secara

komprehensif adalah dengan menyusun secara kuantitatif (empiris) dengan bantuan

kisi-kisi tes. program Item and Test Analysis (ITEMAN)


Versi 3.00. Analisis ini akan menghasilkan
karakteristik butir soal dan perangkat tes
METODE PENELITIAN berupa statistik. Statistik butir tes, meliputi:
(1) tingkat kesukaran, (2) daya beda, dan

a. Variabel-variabel Penelitian (3) efektivitas distraktor.

Variabel dalam analisis aitem Pada saat memasukkan data/skor


adalah skor aitem tes psikologi kepribadian subyek ke dalam program ITEMAN, maka
1 yang meliputi akhir semerster. Aitem – pilihan jawaban a diubah menjadi 1, b
aitem berupa soal pilihan ganda dengan 4 menjadi 2, c menjadi 3 dan d menjadi 4).
pilihan jawaban yaitu a, b, c, dan d dengan Hal ini untuk memudahkan dalam input
satu kunci jawaban. Skor aitem merupakan data.
skor dikotomi, yaitu 1 untuk jawaban yang
benar dan 0 untuk jawaban yang salah.

DISKUSI
b. Metode Pengumpulan Data
Data penelitian berupa skor aitem a. Deskripsi data penelitian
dan skor tes psikologi kepribadian 1 dari Berdasarkan hasil pengambilan data
mahasiswa Program Studi Psikologi UMBY yang dilakukan pada subjek penelitian
yang mengikuti ujian akhir semester mata sebanyak 70 orang, diperoleh gambaran
kuliah Psikologi Kepribadian1 Semester data sebagai berikut :
Genap T.A. 2011/2012.
Tabel 1.
66
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

Deskripsi data bahwa butir soal tersebut terlalu sukar atau


(N=70 Subyek)
terlalu mudah untuk peserta tes. Indeks ini
Jumlah aitem 60 butir disebut juga indeks tingkat kesukaran soal
(N of aitem) secara klasikal.
Jumlah subyek 70
Berdasarkan hasil analisis data
(N of mahasiswa
yang dilakukan pada subjek penelitian
examinees)
sebanyak 70 orang dengan 60 butir,
Rerata 34,814
diperoleh gambaran data sebagai berikut
Varian 106,923
yang tercantum pada tabel 2.
Standar 10,340
deviasi
Minimum 15
Maksimum 59
Alpha 0,898

b. Hasil hitung Indeks Kesukaran Butir


Hasil indeks kesukaran aitem dalam
program ITEMAN ditunjukkan oleh Prop.
Correct yaitu Proporsi mahasiswa yang
menjawab benar butir tes. Nilai ekstrem
mendekati nol atau satu menunjukkan

67
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

Tabel 2.

Indeks Kesukaran Butir (IKB)

No. soal IKB No. soal IKB No. soal IKB

1 0.886 21 0.371 41 0.643

2 0.186 22 0.600 42 0.600

3 0.700 23 0.686 43 0.586

4 0.671 24 0.414 44 0.557

5 0.471 25 0.543 45 0.443

6 0.400 26 0.957 46 0.443

7 0.557 27 0.629 47 0.514

8 0.729 28 0.800 48 0.757

9 0.443 29 0.757 49 0.571

10 0.643 30 0.500 50 0.957

11 0.571 31 0.629 51 0.543

12 0.043 32 0.586 52 0.686

13 0.871 33 0.843 53 0.229

14 0.800 34 0.686 54 0.386

15 0.229 35 0.586 55 0.657

16 0.571 36 0.600 56 0.771

17 0.586 37 0.443 57 0.700

18 0.700 38 0.157 58 0.571

19 0.343 39 0.686 59 0.457

20 0.629 40 0.729 60 0.514

Berdasarkan Indeks Kesukaran Butir Ditinjau dari tujuan pelaksanaan tes,


(IKB) tersebut maka didapatkan aitem perlu diperhatikan bahwa soal yang sangat
dengan kategori sangat sukar (3 aitem), mudah atau sangat sukar mungkin memang
sukar (5 aitem), sedang (23 aitem), mudah kurang memberikan informasi yang berguna
(22 aitem), dan sangat mudah (7 aitem). bagi peserta tes pada umumnya, di
Biasanya butir yang ditoleransi sebagai tes antaranya kemungkinan karena belum
standar adalah yang memiliki IKB = 0,30- berfungsinya pengecoh dengan baik,
0,70, dalam hal ini didapatkan sebanyak 43 namun demikian pada soal yang terlalu
aitem. mudah atau terlalu sukar ini, apabila

68
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

pengecohnya berfungsi dengan baik yakni mengetahui sebaran tingkat penguasaan


Prop Endorsing memenuhi ( >0,05 ) serta materi siswa. Misalnya dalam tes yang
daya pembedanya negatif maka soal bertujuan untuk evaluasi formatif.
tersebut masih memenuhi untuk diterima
c. Hasil hitung Indeks Daya Beda Butir
sebagai salah satu alternatif untuk disimpan
Berdasarkan hasil analisis data yang
dalam bank soal.
dilakukan pada subjek penelitian sebanyak
Demikian pula pada butir soal yang 70 orang dengan 60 butir, diperoleh
memiliki IKB sangat sukar atau sangat gambaran data IDB sebagai berikut yang
mudah, dapat tetap digunakan untuk tercantum pada tabel 3

Tabel 3.
Indeks Daya Beda (IDB)
No. soal IDB No. soal IDB No. soal IDB

1 0.180 21 0.351 41 0.555

2 0.129 22 0.434 42 0.594

3 0.184 23 0.321 43 0.518

4 0.514 24 0.352 44 0.346

5 0.142 25 0.219 45 0.280

6 0.068 26 0.126 46 0.472

7 0.384 27 0.318 47 0.654

8 0.331 28 0.367 48 0.541

9 0.539 29 0.418 49 0.431

10 0.301 30 0.496 50 0.235

11 0.462 31 0.258 51 0.613

12 0.058 32 0.459 52 0.309

13 0.455 33 0.448 53 0.108

14 0.316 34 0.512 54 0.497

15 0.395 35 0.582 55 0.156

16 0.610 36 0.558 56 0.332

17 0.366 37 0.628 57 0.462

18 0.308 38 0.224 58 0.096

19 0.284 39 0.300 59 0.396

20 0.447 40 0.508 60 0.347

69
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

Hasil evaluasi IDB, diperoleh aitem dengan Pada aitem-aitem yang sulit, yaitu
dengan kategori : jelek (10aitem), perlu yang persentase subjek menjawab benar
perbaikan (6 aitem), bagus (18 aitem), dan sangat kecil, interpretasi efektivitas
bagus sekali (26 aitem). distraktor tidak dapat semata-mata
disandarkan pada angka statistik r namun
pbis
Daya diskriminasi yang baik
memang pada umumnya terdapat pada harus disertai dengan pertimbangan

aitem yang tidak terlalu mudah dan juga mengenai distribusi peluang subjek yang

tidak terlalu sukar, yaitu apabila harga p menjawab salah pada aitem yang

berkisar antara 0,40 sampai dengan 0,60. bersangkutan.


Ditinjau dari distribusi jawaban yaitu
Berdasarkan kategori tersebut, persentase peserta tes merespons alternatif
maka sangat perlu dilakukan peninjauan jawaban, semua pengecoh telah berfungsi
ulang terhadap butir-butir soal yang masuk dengan baik. Dapat dilihat pada kolom Prop
dalam kategori jelek dan perlu perbaikan. Endorsing, tampak bahwa pada masing
masing alternatif jawaban sebagian besar
d. Hasil hitung efektivitas distraktor
ada yang memilih.
(pengecoh)
Indikator lain mengenai efektivitas Berdasarkan indeks Point biserial
distraktor ditampakkan oleh koefisien r- (pada alternative statistics), diperoleh
pointbiserial bagi masing-masing distraktor. masing-masing alternatif pengecoh memiliki
Suatu distraktor yang efektif adalah yang angka negatif dan memiliki presentasi yang
memiliki koefisien r negatif. Semakin baik dalam hal jumlah pemilih. Namun
pbis

besar harga negatif r menunjukkan demikian terdapat beberapa nomor butir


pbis
yang mendapatkan peringatan dari hasil
bahwa fungsi distraktor semakin efektif
ITEMAN, yaitu butir nomor : 6, 12 dan 58.
sedangkan r yang berada di sekitar nol
pbis
Selengkapnya dapat dilihat pada tabel 4.
berarti distraktor tidak berfungsi
sebagaimana mestinya.

Tabel 4
Analisis distraktor (6, 12, 58)
No. butir Alternatif Point Biserial Porp. Endorsing Prop.
Jawaban Kunci

6 1 0,196 0,30 0,40

12 4 0,102 0,20 0,043

58 1 0,247 0,186 0,571

70
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

Berdasarkan data tersebut di reliabilitas alpha sebesar ; 0,898,


atas, butir soal no 6, memiliki pengecoh sehingga dianggap memiliki reliabilitas
yang tidak efektif, yaitu alternatif 1 (atau yang baik.
a). pengecoh tersebut memiliki indeks
Point biserial positif dan dipilih oleh 30%
hampir setara dengan kunci (40%). KESIMPULAN DAN SARAN
Artinya bahwa alternatif ini justru lebih
Hasil analisis butir soal dengan
banyak dipilih oleh kelompok yang tinggi
menggunakan program iteman
(pandai) dari pada kelompok rendah.
berdasarkan Statistik butir soal
Demikian juga butir soal nomor 12, (Prop.corret, Point biser, dan Point biser
menunjukkan pada alternatif 4 (atau d), (alt statis)) dan Statistik tes (koefisien
memiliki indeks point biserial positif dan reliabilitas alpha) menunjukkan bahwa
dipilih 20% lebih banyak dari kunci jawaban dari 60 butir soal yang dianalisis cukup
(4,3%). Artinya pengecoh 4 (atau d) kurang baik dan dapat digunakan. Sebanyak
efektif karena kelompok tinggi banyak yang 43 aitem memiliki IKB standar yaitu
memilihnya dari pada kunci jawaban. berkisar 0,30-0,70, dan terdapat 44 butir
soal yang memiliki IDB Bagus dan
Butir soal nomor 58 memiliki
Sangat bagus.
karakteristik yang mirip dengan butir soal
nomor 6 pada alternatif 1 (a). Terkait dengan efektifitas distraktor,
maka sebanyak 57 butir aitem telah miliki
Oleh karena itu sangat perlu
karakteristik distraktor yang bagus.
dilakukan penggantian alternatif
jawaban pada alternatif-alternatif Analisis butir soal dengan
tersebut di atas. menggunakan program iteman sangat
cepat dan tepat untuk digunakan sebagai
e. Reliabilitas
kesimpulan analisis akhir dari suatu butir
Sebenarnya tidak terdapat suatu
soal atau tes secara keseluruhan apakah
ukuran yang pasti mengenai berapa
layak digunakan atau tidak. Hal ini penting
tinggi koefisien reliabilitas. Reliabilitas
untuk peningkatan kualitas pembelajaran
yang baik tergantung pada tujuan atau
sebagai acuan untuk menganalisa secara
kegunaan tes. Menurut Suryabrata
cepat, tepat agar menghasilkan suatu alat
(2000) menyatakan bahwa kebanyakan
evaluasi yang baik.
tes-tes di bidang pendidikan pada
umumnya memiliki koefisien reliabilitas Penelitian ini menghasilkan suatu
minimal 0,8 untuk populasi yang sesuai. analisis butir soal yang murah, tepat dan
cepat karena menggunakan program
Reliabilitas paket butir-butir soal
computer yang direkomendasikan untuk
tes kepribadian 1 ini memiliki koefisien

71
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

diinterpretasikan pada soal-soal tes yang Gay, L. R. 1987. Education research,


lainnya. Competencies for analysis and
application. Third edition.
Columbus: Merrill Publishing
DAFTAR PUSTAKA
Company.

Gronlund, NE. (1981). Measurement and


Allen, M.J., & Yen, W.M. 1979. Intrduction
evaluating in teaching. New
to measurement theory. Monterey:
York:Macmillan Publishing Co., Inc.
Brooks/Cole Publishing Company.
Harlen, W. 1983. Guides to Assessment in
Arikunto, S & Jabar. 2004. Evaluasi Education Science. London:
Program Pendidikan. Jakarta: Bumi Macmillan Education
Aksara
Jacobs & Chase. 1992. Developing and
Using test Effectively. San
Azwar, S. 2002. Tes Prestasi. Yogyakarta :
Fransisco: Jossey-Bass Publishers.
Pustaka Pelajar.
Kehoe, J. 1997. Basic item analysis for
Azwar, S .2005. Dasar-dasar psikometri multiple-choice tests. ERIC Digest.
(Edisi 1). Yogyakarta: Pustaka http://www.ericdigests.org/1997-
Pelajar. 1/basic.html

Chabib,M. 2001. Teknik Evaluasi


Kumano, Y. 2001. Authentic Assessment
Pendidikan, Jakarta: PT Raja
and Portfolio Assessment-Its
Grafindo Persada.
Theory and Practice. Japan:
Crocker, L. & Algina, J. (1986). Introduction Shizuoka University.
to Classical and Modern Test,
Mardapi, D. 2008. Teknik penyusunan
Theory_. New York: Holt, Rinehart
instrument tes dan nontes.
and Winston, Inc.
Yogyakarta: Mitra Cendekia Press.
Djaali. 2006. Hasil belajar evaluasi dalam
Masrun & Martaniah. 1976. Psikologi
evaluasi pendidikan: Konsep dan
Pendidikan : Seri Pedagogik dan
aplikasi. Jakarta: Uhamka Press.
Psikologi. Yogyakarta : Yayasan
Ebel, RL. (1972). Essential of educational Penerbitan Fakultas Psikologi
measurement and evaluating in UGM.
education and psycology. New
York: Holt, Rine hart, and Winston.
Inc.

72
Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : 2087-1899

Rustaman,N. 2003. Asesmen Pendidikan Thorndike, R.L. 1982. Applied


IPA. Makalah penataran guru-guru Psychometrics. Boston : Houghton
NTT di Jurusan pendidikan Biologi. Mifflin.

Stiggins, R.J. 1994. Student-Centered Thorndike, R.M. 2005. Measurement and


Classroom Assessment. New York evaluation in psychology and
: Macmillan College Publishing education (7th ed). New Jersey:
Company Pearson Education, Inc.

Subekti, R. & Firman, H. 1989. Evaluasi Yulaelawati, E. 2004. Kurikulum dan


Hasil Belajar dan Pengajaran Pembelajaran. Jakarta: Pakar Raya
Remedial. Jakarta: UT. Jakarta.

Suharsimi.2003.Dasar-Dasar Evaluasi Zainul, A. (2001). Alternative assessment.


Pendidikan(edisi revisi). Jakarta. Jakarta: Dirjen Dikt
Penerbit Bumi Aksara.

Suryabrata, S. 2000. Pengembangan alat


ukur psikologis. Yogyakarta :
Penerbit Andi.

73

You might also like