You are on page 1of 16

VALIDITAS

Oleh : M. Irfan Syahroni

A. PENDAHULUAN
Dalam setiap kegiatan pendidikan maka tidak akan bisa dipisahkan dengan
evaluasi. Tanpa adanya evaluasi maka semua kegiatan pendidikan hanya sia-sia
belaka, karena kita tidak akan pernah mengetahui apakah pendidikan yang
dilaksanakan berhasil atau gagal, baik atau buruk, lulus atau tidak lulus. Evaluasi
merupakan kegiatan akhir yang dilakukan oleh pendidik untuk mengetahui seberapa
jauh penguasaan peserta didiknya terhadap materi yang telah diberikan atau bisa juga
evaluasi itu diartikan sebagai sebuah proses untuk menentukan nilai segala sesuatu
yang ada hubungannya dengan dunia pendidikan1.
Sekolah sebagai sebuah institusi yang menyelenggarakan pendidikan
diumpamakan sebagai sebuah tempat pengolahan di mana calon siswa sebagai bahan
mentah yang akan diolah, maka lulusan sekolah itu diumpamakan sebagai hasil
olahan yang siap dipergunakan. Untuk mengetahui apakah seorang siswa lulus atau
tidak lulus maka perlu diadakan evaluasi sebagai alat penyaring2.
Dengan demikian evaluasi menduduki kedudukan yang sangat penting dalam
pendidikan karena hasil evaluasi dapat merupakan pencerminan keberhasilan atau
kegagalan dari pendidikan itu sendiri. Hasil evaluasi ini kemudian akan digunakan
untuk mengambil berbagai keputusan pendidikan.
Namun, tidak semua hasil evaluasi dapat dimanfaatkan untuk mengambil
keputusan pendidikan, hanya evaluasi yang baik saja yang dapat digunakan untuk
mengambil keputusan pendidikan. Evaluasi dapat dikatakan baik apabila memenuhi
tiga syarat pokok yaitu validitas (kesahihan), reliablitas (kehandalan), dan
kepraktisan3.

1
Khairon Rosyadi, Pendidikan Profetik, (Jakarta: Pustaka Pelajar Offset, 2004), hlm. 283-284.
2
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, (Jakarta: P.T. Bumi Aksara, 2003),
cet. Keempat, hlm. 4-5.
3
Max Darsono et all, Belajar dan Pembelajaran, (Semarang: IKIP Semarang Press, 2000), hlm.
107.

1
Dalam makalah ini penulis hanya akan membahas tentang validitas saja,
karena topik yang lain akan dikemukakan oleh pemakalah lain.

B. PENGERTIAN VALIDITAS
Validitas berasal dari kata valid (kata sifat) yang berarti tepat, benar, shahih,
dan abasah, yang selanjutnya dibendakan menjadi validitas yang mempunyai arti
ketepatan, kebenaran, kesahihan, dan keabsahan4.
Di dalam Wikipedia Indonesia validitas diartikan sebagai “kesahihan,
kebenaran yang diperkuat oleh bukti atau data”5. Demikian juga dalam Kamus
Bahasa Indonesia dapat jumpai validitas diartikan sebagai “sifat benar menurut bahan
bukti yang ada, logika berpikir, atau kekuatan hukum”6.
Dengan demikian, evaluasi yang tidak didukung dengan bukti-bukti konkrit
atau bertentangan dengan kaidah-kaidah dan hukum yang berlaku tidak dapat
dikatakan sebagai evaluasi yang valid.
Sejalan dengan definisi yang dikemukakan di atas, Max Darsono dalam
konteks pendidikan lebih lanjut menyatakan bahwa kevalidan sebuah evaluasi harus
didasarkan atas kesesuaiannya dengan tujuan evaluasi tersebut7.
Dalam kaitannya dengan tes dan penilaian, Retno mengemukakan tiga pokok
pengertian validitas yang biasa digunakan sebagai berikut.
a. Validitas berkenaan dengan hasil dari suatu alat tes atau alat evaluasi, dan
tidak menyangkut alat itu sendiri. Tes intelegensi sebagai alat untuk
melakukan tes kecerdasan hasilnya valid, tapi kalau digunakan untuk
melakukan tes hasil belajar tidak valid.
b. Validitas adalah persoalan yang menyangkut tingkat (derajat). Sehingga,
istilah yang digunakan adalah derajat validitas suatu tes, maka suatu tes ada
yang bias disebut validitasnya tinggi, sedang, atau rendah.
c. Validitas selalu dibatasi pada pengkhususannya dalam penggunaan, dan tidak
pernah dalam arti kualitas yang umum. Suatu tes berhitung mungkin tinggi
validitasnya untuk mengukur keterampilan menjumlah angka, tetapi rendah
validitasnya untuk mengukur berpikir matematis, dan sedang validitasnya
4
Anas Sudijono, Pengantar Statistik Pendidikan, (Jakarta: Raja Grafindo, 1999), cet. IX, hlm.
93.
5
http.//.wwwid..wikipedia.org/wiki/Validitas
6
Dani K., Kamus Lengkap Bahasa Indonesia, (Surabaya: Putra Hasan, 2002), hlm. 666.
7
Max Darsono et all, loc. cit.

2
untuk meramal keberhasilan siswa dalam pelajaran matematik yang akan
datang8.

Kata validitas digunakan paling tidak dalam tiga konteks, yaitu: validitas
penelitian, validitas butir dan validitas tes9. Berikut ini adalah penjelasan dari ketiga
penggunaan validitas tersebut.
a. Validitas penelitian (research validity) merupakan validitas yang
mempersoalkan derajat kesesuaian hasil penelitian dengan keadaan
sebenarnya. Valitidas penelitian mengandung dua sisi, yaitu : (1) validitas
intenal yang mempersoalkan kesesuaian antara data hasil penelitian dengan
kondisi sebenarnya melalui instrument pengambilan data yang memenuhi
persyaratan ilmiah tertentu; dan (2) validitas eksternal yang mempersoalkan
derajat kesesuaian antara generalisasi hasil penelitian dengan keadaan
sesungguhnya melalui penyusunan rancangan sampling yang cermat10.
b. Validitas butir (item validity) merupakan validitas yang mempersoalkan
derajat kesesuain antara suatu butir dengan perangkat butir-butir lain yang
diukur dengan korelasi antara skor pada butir dengan skor pada perangkat
butir (item total correlation), yang sering dihitung dengan korelasi biserial. Isi
validitas butir meliputi: (1) tingkat kesukaran butir; (2) daya pembeda butir
(item discriminating power); dan (3) efektivitas distraktor11.
c. Validitas tes (test validity) merupakan validitas yang mempersoalkan derajat
ketepatan dan kecermatan pengukuran suatu tes, atau sejauh mana tes tersebut
mengukur apa yang hendak diukur12.
Tes sebagai alat ukur dapat dikatakan memiliki tingkat validitas tinggi apabila
alat ukur tersebut mampu menjalankan fungsinya sebagai alat ukur, yakni mengukur
sesuatu sesuai dengan tujuan dilakukan pengukuran. Aspek lain yang terkait dengan

8
Retno Sriningngsih Satmoko, Proses Belajar Mengajar II: Penilaian Hasil Belajar,
(Semarang : IKIP Semarang Press, 1999), hlm. 41.
9
Sumadi Suryabrata, Pengembangan Alat Ukur Psikologis, (Yogyakarta: Andi, 2000), hlm. 40.
10
Ibid., hlm. 41.
11
Saefuddin Azwar, Tes Prestasi, Fuungsi dan Pengembangan Pengukuran Prestasi Belajar,
(Yogyakarta: Pustaka Pelajar, 2000), cet. III, 134.
12
Sumadi Suryabrata, loc. cit.

3
pengertian validitas adalah kecermatan pengukuran. Artinya, kevalidan alat ukur
tidak sekedar mampu megungkapkan data dengan tepat, tetapi juga mampu
memberikan gambaran yang cermat mengenai data yang menjadi objek pengukuran.
Yang dimaksud dengan cermat di sini adalah mampu memberikan gambaran yang
cermat mengenai perbedaan sekecil-kecilnya antara objek pengukuran satu dengan
yang lainnya13.
Berkenaan dengan penggunaan validitas sebagaimana tersebut di atas, maka
dalam pembahasan ini penulis tidak akan mengungkapkan tentang validitas penelitian
(research validiy), karena tidak terkait dengan apa yang penulis sedang bahas. Penulis
hanya akan mengemukakan dua penggunaan validitas yang terakhir, yaitu validitas
tes (test validity) dan validitas butir (item validity).
Untuk dapat memahami tentang prosedur mencari validitas, maka kita
perlu mengetahui macam-macam validitas. Sebagaimana yang telah dikemukakan
tentang penggunaan validitas, maka berikut ini gambar tentang pembagian validitas.

Gambar 1 : Pembagian Validitas

13
Saefuddin Azwar, Reliabilitas dan Validitas, (Yogyakarta: Pustaka Pelajar, 2001) cet. III,
hlm. 6-7.

4
C. PROSEDUR MENCARI VALIDITAS TES
Menurut Suharsimi, ada dua jenis validitas tes yaitu validitas logis dan
validitas empiris14. Sementara menurut Retno validitas tes itu terbagi menjadi lima
tipe, yaitu validitas tampang (face validity), validitas logis (logical validity), validitas
faktor (factorial validity), validitas isi (content validity), dan validitas empiris
(empirical validity)15.
Menurut hemat penulis kedua jenis pembagian validitas yang dikemukakan
oleh Suharsimi dan Retno pada dasarnya sama saja. Suharsimi membagi validitas
menjadi dua jenis secara global kemudian merinci kedua jenis pembagiann itu ke
dalam beberapa macam lagi, sedang Retno langsung membagi validitas menjadi
beberapa tipe secara terinci.
Sebagaimana pembagian validitas tersebut di atas, maka untuk mengetahui
sejauh mana validitas sebuah tes, dapat ditempuh melalui dua teknik analisis, yaitu :
analisis logika (logical analysis) dan analisis empiris (empirical analysis)16.
1. Validitas logis
Logis dalam bahasa Indonesia diartikan sebagai “sesuatu yang masuk
akal, sesuai yang telah atau memang demikian sebenarnya”17. Masuk akal di
sini dapat diartikan sesuatu yang didasarkan atas penalaran.
Sesuai dengan konteksnya dengan alat evaluasi (tes), validitas rasional
diartikan sebagai ketepatan mengukur didasarkan pada hasil analisis yang
bersifat rasional, yakni analisis yang menggunakan pendekatan logika atau
rasional18.
Sedangkan Suharsimi mengatakan, “validitas logis untuk sebuah
instrument evaluasi menunjuk pada kondisi bagi sebuah instrument yang

14
Suharsimi Arikunto, op. cit., hlm. 65. Bandingkan juga dengan Max Darsono, op. cit., hlm.
108.
15
Sriningsih Satmoko, op. cit., 42-45.
16
Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: Raja Grafindo, 2001), cet. III., hlm.
64.
17
Dani K., op. cit., hlm. 317.
18
Anas Sudijono, Pengantar Evaluasi Pendidikan, op. cit., hlm. 163-164.

5
memenuhi persyaratan valid berdasarkan hasil penalaran”19. Lebih lanjut
Suharsimi mengemukakan bahwa validitas dapat dicapai apabila instrument
disusun mengikuti ketentuan yang ada. Dengan demikian, validitas logis tidak
perlu diuji kondisinya tapi instrument tersebut akan diketahui kevalidannya
setelah setelah selesai disusun20.
Untuk menguji validitas secara rasional, maka dapat ditempuh dengan
menggunakan dua cara, yaitu :
a. Melaui validitas isi (content validity), yaitu validitas yang diperoleh
dari hasil pengujian terhadap isi yang terkandung di dalam tes. Dalam
konteks ini, sebuah tes dapat dikatakan valid apabila tes tersebut sudah
mewakili keseluruhan materi yang diajarkan kepada peserta didik.
Validitas ini dapat juga disebut dengan validitas kurikuler, karena tes
tersebut merupakan penjabaran dari kurikulum yang telah
ditentukan21.
b. Melalui validitas konstruksi (construct validity), yaitu yaitu suatu
rekaan psikologis yang dibuat para ahli ilmu jiwa untuk merinci isi
jiwa atas beberapa aspek seperi ingatan (pengetahuan), pengalaman,
aplikasi dan sebagainya. Dalam konteks ini, sebuah alat evaluasi (tes)
dapat dikatakan valid apabila butir-butir soal dalam tes tersebut
mampu mengukur setiap aspek berpikir yang ada dalam tujuan
instruksional khusus (TIK)22.
Menurut Retno, validitas logis ini merupakan alat pengukur yang
validitasnya didasarkan atas konstruksi teoritis yang jelas dan logis. Namun,
menurutnya validitas alat pengukur yang didasarkan atas validitas logis
kadang tidak dapat diterima sepenuhnya karena sebuah teori bisa saja tidak
benar, sehingga kerap kali harus tunduk pada validitas empiris23.

19
Suharsimi Arikunto, loc. cit.
20
Ibid,, hlm. 66.
21
Saefuddin Azwar, Reliabilitas dan Validitas, op. cit., hlm. 45.
22
Suharsimi Arikunto, op. cit., hlm. 67-68.
23
Retno Sriningsih Satmoko, op. cit., 43

6
2. Validitas empiris
Istilah empiris kalau memperhatikan kamus bahasa Indonesia dapat
diartikan “berdasarkan pengalaman, terutama yang diperoleh dari penemuan,
percobaan, pengamatan yang telah dilakukan”24.
Suharsimi mengatakan bahwa sebuah instrument dapat dikatakan
memiliki validitas empiris apabila instrument tersebut sudah teruji
berdasarkan pengalaman25. Lebih lanjut Suharsimi menjelaskan bahwa untuk
mengetahui apakah sebuah instrument memang valid adalah dengan
membandingkan kondisi instrument dengan sebuah kriterium atau ukuran.
Kriterium atau ukuran pembanding ini ada dua macam: pertama, concurrent
validity yaitu membandingkan instrumen dengan kriterium yang sudah
tersedia atau yang sudah ada; dan kedua, predictive validity yaitu
membandingkan instrumen dengan kriterium yang diramalkan akan terjadi.26
Menurut Suharsimi27 untuk mengetahui kesejajaran antara hasil tes tersebut
dengan kriterium adalah dengan menggunakan korelasi product moment yang
dikemukakan oleh Pearson. Rumus korelasi product moment ada dua macam :
a. Korelasi product moment dengan simpangan28

r xy 
 xy

( x2
)(  y2
)
di mana :
rxy = koefisien korelasi antara variable X dan variable Y, dua variable yang
dikorelasikan (x = X-X dan y = Y-Y)
Σ xy = jumlah perkalian x dengan y
x2 = kuadrat dari x
y2 = kuadrat dari y

Contoh perhitungan :
Misalnya kan menghitung validitas tes prestasi belajar matematika.
Sebagai kriterium diambil rata-rata ulangan yang akan dicari validitasnya
24
Dani K., op. cit., hlm. 144.
25
Suharsimi Arikunto, op. cit., hlm. 66.
26
Ibid., hlm. 66-67. Lihat juga Retno Sriningsih Satmoko, op. cit., 45.
27
Suharsimi Arikunto, op. cit., 69-70.
28
Ibid., hlm. 70-72.

7
diberi kode X dan rata-rata nilai harian diberi kode Y, kemudian dibuat tabel
persiapan sebagai berikut.

Tabel 1 : Persiapan Untuk Mencari Validitas Tes Prestasi Matematika

No Nama Mahasiswa X Y x y x2 y2 xy
1. Abdul Wahid 6,5 6,3 0 -0,1 0,0 0,01 0,0
2. Ahmad Kholiq 7 6,8 +0,5 +0,4 0,25 0,16 +0,2
3. Al Bahri 7,5 7,2 +1,0 +0,8 1,0 0,64 +0,8
4. Bahnur Damau 7 6,8 +0,5 +0,4 0,25 0,16 +0,2
5. Debi Musdalifah 6 7 -0,5 +0,6 0,25 0,36 -0,3
6. Diding Darmudi 6 6,2 -0,5 -0,2 0,25 0,04 +0,1
7. Iqbal Mustopa 5,5 5,1 -1,0 -1,3 1,0 1,69 +1,3
8. M.Irfan Syahroni 6,5 6 0 -0,4 0,0 0,16 0,0
9. Yasak 7 6,5 +0,5 +0,1 0,25 0,01 +0,05
10. Miftahol Arifin 6 5,9 -0,5 -0,6 0,25 0,36 +0,3
Jumlah 65,0 63,8 3,5 3,59 2,65

X 65 .0
X    6 .5
N 10
ZY 63 .8
Y    6 .38  dibulatkan  6 .4
N 10
x X X
y  Y Y

Dimasukkan ke rumus
 xy
rxy 
( x 2 )( y 2
2,65 2,65
 
3,5  3,59 12,565
2,65
  0,748
3,545
Indeks korelasi antara X dan Y inilah indeks validitas soal yang dicari
b. Korelasi product moment dengan angka kasar29
NXY  (X )(Y )
rXY 
{N X  (X ) 2 }{NY 2  (Y ) 2}
2

di mana :

29
Ibid., hlm. 72-75.

8
rXY = koefisien korelasi antara variable X dan variable Y, dua variable yang
dikorelasikan
Dengan menggunakandata hasil tes prestasi matematika di atas kini
dihitung dengan rumus korelasi product moment dengan angka kasar yang
tabel persiapannya sebagai berikut.

Tabel 2 : Persiapan Untuk Mencari Validitas Tes Prestasi Matematika

No Nama Mahasiswa X Y X2 Y2 XY
1. Abdul Wahid 6.5 6.3 42.25 39.69 40.95
2. Ahmad Kholiq 7 6.8 49 46.24 47.6
3. Al Bahri 7.5 7.2 56.25 51.84 54.0
4. Bahnur Damau 7 6.8 49 46.24 47.6
5. Debi Musdalifah 6 7 36 49 42
6. Diding Darmudi 6 6.2 36 38.44 37.2
7. Iqbal Mustopa 5.5 5.1 30.25 26.01 28.05
8. M.Irfan Syahroni 6.5 6 42.25 5.5 39
9. Yasak 7 6.5 49 36 45.5
10. Miftahol Arifin 6 5.9 36 34.81 35.4
Jumlah 65.0 63.8 426.0 410.52 417.3

Dimasukkan ke rumus :
NXY  (X )(Y )
rXY 
{NX  (X ) 2 }{NY 2  (Y ) 2 }
2

10  417,3  (65  63,8)


rXY 
(10  426  4225)(10  410,52  4070,44)
4173  4147
...... 
(4260  4225)(4105,2  4070,44)
26 26
......  
35  34,76 1216,6
26
......   0,745
34,8797
Jika diperbandingkan dengan validitas soal yang dihitung dengan rumus
simpangan, ternyata terdapat perbedaan sebesar 0,003 lebih besar yang
dihitung dengan rumus simpangan. Hal ini wajar karena dalam mengerjakan
perkalian atau penjumlahan jika diperoleh 3 atau angka di belakang koma
dilakukan pembulatan ke atas. Perbedaan ini kecil sehingga dapat diabaikan.

9
D. PROSEDUR MENCARI VALIDITAS ITEM
Di samping mencari validitas soal, perlu juga dicari validitas butir soal atau
biasa disebut dengan validitas item. Jika seorang peneliti atau seorang guru
mengetahui bahwa validitas soal tes terlalu rendah atau rendah saja, maka selanjutnya
ingin mengetahui butir-butir tes manakah yang menyebabkan soal secara keseluruhan
tersebut jelek karena memiliki validitas rendah. Untuk inilah dicari validitas soal30.
Dari uraian di atas dapat dipahami bahwa sebuah item dikatakan valid apabila
mempunyai dukungan yang besar terhadap skor total. Skor pada item menyebabkan
skor total menjadi tinggi atau rendah. Dengan lain kata, sebuah item memiliki
validitas yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total.
Untuk mengetahui ketepatan sebuah butir dapat diukur dengan tiga parameter,
yaitu :
1. Indeks kesukaran butir
Untuk mencari indeks kesukaran butir dapat menggunakan rumus :
B
P
T
dimana :
P = proporsi menjawab benar, atau tingkat kesukaran tes
B = banyaknya peserta tes yang menjawab benar
T = jumlah peserta yang menjawab31

2. Indeks daya pembeda


Untuk mencari indeks pembeda, dapat menggunakan rumus korelasi product
moment32. Untuk soal-soal bentuk objektif, skor item biasa diberikan dengan angka 1
bila item dijawab dengan benar, dan 0 bila item yang dijawab salah. Skor total
selanjutnya merupakan jumlah dari skor untuk semua item yang membangun soal
tersebut.
Contoh Perhitungan :

30
Ibid., hlm. 75-76
31
Masrun, Analisis Item dalam Metodologi Penelitian, (Yogyakarta: Lembaga Pendidikan
Doktor, 1975)
32
Suharsimi Arikunto, op. cit., hlm. 76.

10
Tabel 3 : Daftar Nilai Bahasa Arab Mahasiswa Pascasarjana IAIN Walisongo

No Nama Mahasiswa Butir Soal/Item Skor


1 2 3 4 5 6 7 8 9 10 Total
1. Abdul Wahid 1 0 1 0 1 1 1 1 1 1 8
2. Ahmad Kholiq 0 0 1 0 1 0 0 1 1 1 5
3. Al Bahri 0 1 0 0 0 1 0 1 0 1 4
4. Bahnur Damau 1 1 0 0 1 1 0 0 1 0 5
5. Debi Musdalifah 1 1 1 1 1 1 0 0 0 0 6
6. Diding Darmudi 1 0 1 0 1 0 1 0 0 0 4
7. Iqbal Mustopa 1 1 1 1 1 1 1 0 0 0 7
8. M.Irfan Syahroni 0 1 0 1 1 1 1 1 1 1 8

Misalnya akan dihitung validitas item nomor 6, maka skor item tersebut
disebut variable X dan skor total disebut variable Y. Selanjutnya perhitungan
dilakukan dengan menggunakan rumus korelasi product moment, baik dengan rumus
simpangan maupun rumus angka kasar.
Untuk menghitung validitas item nomor 6, maka dibuat terlebih dahulu table
persiapan sebagai berikut.
Tabel 4 : Persiapan untuk Menghitung Validitas Item Nomor 6

No Nama mahasiswa X Y
1. Abdul Wahid 1 8
2. Ahmad Kholiq 0 5
3. Al Bahri 1 4
4. Bahnur Damau 1 5
5. Debi Musdalifah 1 6
6. Diding Darmudi 0 4
7. Iqbal Mustopa 1 7
8. M.Irfan Syahroni 1 8

Keterangan :
X = skor item nomor 6
Y = skor total
Dari perhitungan diperoleh data sebagai berikut :
∑X = 6 ∑Y = 46 ∑X2 = 6 ∑Y2 = 288 ∑XY = 37
6 2
Xt = 5,57 Xp = 6,17 p = = 0,75 q = = 0,25
8 8
Kemudian dimasukkan ke dalam rumus korelasi product moment dengan angka kasar

11
NXY  (X )(Y )
rXY 
{NX  (x) 2 }{NY 2  (Y ) 2 }
2

8  37  6  46
..... 
(8  6  6 2 )(8  288  46 2 )

8  37  6  46
..... 
(48  36)  (2304  2116

8  37  6  46 20 20
.....     0,421
12  188 2256 47,197
Dari perhitungan di atas diperolehkoefisien validitas item nomor 6 adalah
0,421. dengan demikian validitas soal nomor 6 adalah rendah.
Di samping dengan menggunakan rumus korelasi product moment di atas,
masih ada cara lain yang terkenal dengan rumus Ypbi33 sebagai berikut :
M p  Mt p
Y pbi 
St q
Keterangan :
Ypbi = koefisien korelasi biserial
Mp = rerata skor dari subjek yang menjawab betul bagi item yang dicari validitasnya
Mt = rerata skor total
St = standar deviasi dari skor total
p = proporsi siswa yang menjawab benar
banyaknya..siswa.. yang..benar
(p  )
jumlah..seluruh..siswa
q = proporsi siswa yang menjawab salah
(q = 1 – p)
Contoh perhitungan dengan menggunakan mencari validitas item nomor 6
8  3  5  6  7  8 37
1. Mencari M p    6,17
6 6
8  5  3  5  6  4  7  8 46
2. Mencari M t    5,75
8 8
3. Harga standar deviasi, yaitu  n  1,7139 atau  n 1  1,8323 . Untuk n kecil,
diambil standar deviasi yang  n  1,7139

33
Anas Sudijono, Pengantar Statistik Pendidikan, op. cit., hlm. 185. Lihat juga Suharsimi
Arikunto, op. cit., hlm. 78-79.

12
6
4. Menentukan harga p, yaitu  0,17
8
2
5. Menentukan harga q, yaitu  0,25 atau 1 – 0,75 = 0,25
8
6. Memasukkan ke rumus Ypbi
M p  Mt p
Y pbi 
St q

6,17  5,75 0,75 0,42


......   1,7321  0,4224
1,7139 0,25 1,7139
Dari perhitungan validitas item soal nomor 6 dengan menggunakan dua cara
tersebut diatas, ternyata hasilnya berbeda tetapi sangat kecil yaitu 0,0034. mungkin
hal ini disebabkan karena adanya pembulatan angka.
3. Indeks distraktor
Untuk mengetahui efektifitas distraktor pada suatu butir dapat ditempuh
dengan cara memilah testee menjadi dua kelompok, yaitu satu kelompok untuk testee
yang mendapat skor tinggi (kelompok tinggi) dan satu kelompok lainnya untuk testee
yang mendapat skor rendah (kelompok rendah).
Dalam menentukan kelompok tinggi dan kelompok rendah, jika jumlah testee
mencapai 400-an, maka dapat ditempuh dengan mengambil 27% dari keseluruhan
jumlah testee yang memiliki skor tertinggi (diawali dari yang tertinggi), dan 27% dari
testee yang memiliki skor terendah (diawali dari yang paling tinggi). Namun jika
jumlah testee tidak terlalu banyak, maka dalam menentukan kelompok tinggi dan
kelompok rendah dapat dilakukan secara langsung terhadap testee tersebut menjadi
dua kelompok. Kemudian memeriksa apakah distraktor (pilihan jawaban bukan
kunci) ada yang memilih atau tidak. Jika kelompok tinggi banyak memilih distraktor,
maka distraktor tersebut tidak berfungsi. Sebaliknya jika yang terbanyak memilih
distraktor adalah kelompok rendah, maka distraktor tersebut telah berfungsi
sebagaimana mestinya34.

34
Saefuddin Azwar, Tes Prestasi, op. cit., 141.

13
E. FAKTOR-FAKTOR YANG MEMPENGARUHI VALIDITAS
Menurut Retno, ada beberapa hal yang mempengaruhi validitas alat
pengukur, sebagai berikut :
1. Faktor di dalam tes itu sendiri
1.1. Petunjuk pengerjaan tes yang tidak jelas.
1.2. Istilah/kata-kata dan susunan kalimat dalam item (soal) terlalu
sukar.
1.3. Tingkat kesukaran dari item-item tes yang tidak memenuhi
syarat .
1.4. Susunan item tes yang kurang baik.
1.5. Kekaburan dalam statemen (pernyataan/ungkapan) yang
menyebabkan salah tafsir.
1.6. Kualitas dari item-item tes yang tidak memadai untuk mengukur
hasil belajar.
1.7. Tes terlalu pendek.
1.8. Cara menyusun item-item tes tidak runtut.
1.9. Dalam tes obyektif, pola susunannya, urutan jawaban muah
ditebak.
2. Faktor berfungsinya isi dan prosedur mengajar
3. Faktor dalam respons siswa, ini terjadi jika :
3.1. Siswa mengalami gangguan emosional dalam menjawab tes.
3.2. Siswa hanya cenderung menerka-nerka dalam menjawab tes.
4. Faktor dalam mengadministrasi tes dan pembijian
4.1. Karena kekurangan waktu
4.2. Karena Karena siswa mendapat “pertolongan” yang tidak sah.
4.3. cara pembijian hasil tes yang tidak reliable.
4.4. Gangguan situasi sekitar pada saat tes.
5. Status dari kelompok dan kriterium
5.1. Tes yang cukup valid untuk kelompok tertentu belum tentu valid
untuk kelompok lain, karena factor usia, jenis kelamin, tingkat
kemampuan, latar belakang pendidikan dan kebudayaan.
5.2. Penggunaan kriterium. Dalam menilai koefisien validitas kita
diharuskan mempertimbangkan hakekat penggunaan kriterium,
contoh: tes bakat matematik hanya valid untuk meramal
pencapaian belajar siswa dalam pelajaran fisika yang banyak
menuntut perhitungan angka, dan tidak valid meramal
kemampuan/penguasaan bahan fisika yang lain35.

35
Retno Sriningsih Satmoko, op. cit., 46-48.

14
C. PENUTUP
Dari uraian-uraian yang terdapat dalam pembahasan di atas maka dapat ditarik
kesimpulan sebagai berikut :
1. Dalam menggunakan konsep validitas dalam kaitannya dengan tes dan
penilaian, maka ada tiga pokok pengertian yang harus dipegang, yaitu, (1)
validitas berkenaan dengan hasil dari suatu alat tes atau alat evaluasi dan tidak
menyangkut alat itu sendiri; (2) validitas adalah persoalan yang menyangkut
tingkat (derajat); dan (3) validitas selalu dibatasi pada pengkhususannya
dalam penggunaan, dan tidak pernah dalam arti kualitas umum.
2. Untuk mengetahui sejauh mana validitas sebuah tes dapat ditempuh dengan
dua teknik, yaitu pertama, analisis rasional; dan kedua, analisis empiris. Dan
teknik yang digunakan untuk mengetahui kesejajaran hasil tes tersebut dengan
kriterium adalah dengan menggunakan teknik korelasi product moment.
Sedangkan untuk mengetahui validitas butir adalah dengan menggunakan tiga
parameter, yaitu: pertama, indeks kesukaran butir; kedua, indeks daya
pembeda; dan ketiga, indeks dikstraktor.
3. Ada 5 (lima) faktor yang mempengaruhi validitas dalam arti mengurangi
validitas, yaitu: (1) faktor di dalam tes itu sendiri; (2) faktor berfungsinya isi
dan prosedur mengajar; (3) faktor dalam respon siswa; (4) faktor dalam
mengadministrasi tes dan pembijian; (5) status dari kelompok dan kriterium.

15
DAFTAR PUSTAKA

Anas Sudijono, Pengantar Statistik Pendidikan, Jakarta, Raja Grafindo, cet. IX, 1999.
……………, Pengantar Evaluasi Pendidikan, Jakarta, Raja Grafindo, cet. III, 2001.
Dani K., Kamus Lengkap Bahasa Indonesia, Surabaya, Putra Hasan, 2002.
http.//www.id.wikipedia.org
Khairon Rosyadi, Pendidikan Profetik, Jakarta, Pustaka Pelajar Offset, 2004.
Masrun, Analisis Item dalam Metodologi Penelitian, Yogyakarta, Lembaga
Pendidikan Doktor, 1975.
Max Darsono, et all, Belajar dan Pembelajaran, Semarang, IKIP Semarang Press,
2000.
Retno Sriningngsih Satmoko, Proses Belajar Mengajar II: Penilaian Hasil Belajar,
Semarang IKIP Semarang Press, 1999
Saefuddin Azwar, Reliabilitas dan Validitas, Yogyakarta, Pustaka Pelajar, cet. III,
2001.
……………, Tes Prestasi, Fungsi dan Pengembangan Pengukuran Prestasi Belajar,
Yogyakarta, Pustaka Pelajar, 2000.
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, Jakarta, P.T. Bumi Aksara,
cet. IV, 2003.
Sumadi Suryabrata, Pengembangan Alat Ukur Psikologis, Yogyakarta, Andi, 2000.

16

You might also like