You are on page 1of 31

BAB I

PENDAHULUAN
A. Latar Belakang Masalah
Tes dan assessmen adalah bagian integral dari proses sebuah konseling,
bagian yang akan sangat bisa membantu kinerja seorang konselor.
Perkembangan tes sudah dimulai sejak abad ke-19 dimana hal yang lebih
dalam pada konteks ini adalah bagian dari profesi kelompok psikologi, sejalan
dengan kebutuhan dan perkembangan yang semakin canggih berbagai tes telah
banyak dapat diciptakan oleh para ahli dan digunakan sejalan dengan
kebutuhan di berbagai aspek kehidupan, karena pada dasarnya menurut
Glading (2012:377) fungsi utama sebuah tes adalah untuk membantu klien agar
dia dapat mengambil keputusan yang lebih baik mengenai masa depannya.
Secara lebih rinci fungsi tes diantaranya ialah membantu klien memahami diri
sendiri, membantu konselor memutuskan apakah kebutuhan klien dalam batas
keahliannya, membantu konselor memahami klien lebih baik, membantu
konselor memprediksikan kinerja klien di masa depan dalam suatu bidang
tertentu, membantu konselor merangsang minat baru dalam diri klien,
membantu konselor untuk mengevaluasi hasil dari upaya konselingnya
(Shertzer & Stone dalam Glading, 2012:377).
Dapat disimpulkan bahwa sebuah tes membantu seseorang dalam
melihat kembali potensi dan gambaran secara umum atas penilaian dari dirinya
sendiri yang bisa diambil manfaatnya seperti membuat sebuah peningkatan
arah ataupun membuat sebuah keputusan dalam kehidupannya.
Pada saat sekarang ini perkembangan tes di Indonesia khususnya
bidang bimbingan dan konseling cukup memiliki perkembangan namun tidak
sekuat bidang ahli psikologi, namun yang diharapkan adalah bagaimana
kerjasama antara kedua kelompok ini sehingga satu sama lainnya bisa
menunjang tujuan kebaikan, karena pada dasarnya ada kesamaan antara tes
yang diberikan oleh psikolog dan konselor sebagaimana dinyatakan oleh
Abubenzer, Zimpfer, & Mahrle dalam Glading (2012:375). Namun yang

1

menjadi perbedaan dari kesuksesan ini adalah bagaimana tujuan penggunaan
dan interpretasinya.
Terlepas dari siapa yang paling berhak dan memiliki lisensi dalam
pelaksanaan sebuah tes maka dasar yang paling utama tentang sebuah tes itu
apa? Maka yang paling dasar adalah apakah tes tersebut memiliki validitas,
reliabilitas, standarisasi, dan norma-norma, yang memfalasilitasi interpretasi
skor (Aiken & Groth-Marnat, Hogan dalam Glading, 2012:377). Maka apakah
tes tersebut valid dan reliabel untuk bagian yang sangat vital ini seorang
pengguna tes (testee) atau tester harus
1 mengetahui hal tersebut kapan tes itu
dikatakan valid dan reliabel dan khususnya seorang konselor harus mampu
memahami hal tersebut. Maka penting untuk dipahami ulasan mengenai
“Reliabilitas dalam sebuah tes” secara utuh khususnya bagi profesi yang akan
berhadapan dengan hal tersebut.
B. Rumusan Masalah
Dari latar belakang yang dikemukakan di atas, dapat dibuat rumusan
masalah sebagai berikut:
1.
2.
3.
4.
5.

Apakah pengertian reliabilitas ?
Apa saja jenis reliabilitas ?
Apa saja metode pengujian reliabilitas ?
Apa yang menjadi penyebab rendahnya reliabilitas ?
Bagaimana urgensi dan reliabilitas ?

C. Tujuan Penulisan
Berdasarkan rumusan masalah diatas, maka tujuan dari penulisan makalah
ini ialah sebagai berikut:
1. Untuk mengetahui pengertian reliabilitas.
2. Untuk mengetahui jenis-jenis reliabilitas.
3. Untuk mengetahui metode pengujian reliabilitas.
4. Untuk mengetahui penyebab rendahnya reliabilitas.
5. Untuk mengetahui urgensi reliabilitas.
BAB II
PEMBAHASAN
A. Reliabilitas Tes

2

1. Pengertian Reliabilitas
Dalam Kamus Besar Bahasa Indonesia, reliabilitas artinya perihal
sesuatu yang bersifat reliabel (bersifat andal); ketelitian dan ketepatan
teknik pengukuran; keterandalan.
Dalam bahasa Inggris sehari-hari, reliabilitas berarti dapat dipercaya
atau dapat diandalkan. Artinya tetap sama jika istilah tersebut digunakan
untuk menggambarkan ukuran (Gay el al., 2006 dalam Gladding, 2012:379).
Jadi reliabilitas adalah suatu ukuran dari tingkat konsistensi tes dalam
menghasilkan skor tes jika orang-orang dites ulang memakai instrumen
yang sama atau setara (Anastasi & Urbina, 1997; Hogan, 2007; Urbina,
2005 dalam Gladding, 2012:379).
Menurut Hood & Johnson (2001) dalam Drummond, Reliabilitas
didefinisikan sebagai sejauh mana skor tes konsisten, dapat diandalkan, dan
berulang. Oleh karena itu, itu reliability mengacu pada seberapa konsisten
langkah-langkah tes dan sejauh mana menghilangkan perubahan dan faktorfaktor luar lainnya dalam hasil.
Kesalahan pengukuran mengurangi reliabilitas dan generalisasi dari
skor yang diperoleh pada tes yang diberikan; semakin tinggi kesalahan
pengukuran, semakin rendah reliabilitas. Namun, tujuan penggunaan hasil
tes mempengaruhi keputusan akhir dari keandalan tes. Sebuah tes mungkin
memiliki keandalan yang cukup untuk menilai tingkat pencapaian sebuah
distrik sekolah tetapi mungkin tidak memiliki keandalan yang cukup untuk
layar individu untuk keputusan penempatan khusus. Pengembang tes
memikul tanggung jawab utama untuk memberikan bukti dari uji ini
keandalan dan kesalahan pengukuran di setiap penggunaan yang
dimaksudkan.
Menurut Drummond (2006) kesalahan pengukuran didefinisikan
sebagai perbedaan antara seseorang yang diamati, atau diperoleh, skor dan
atau skor yang sebenarnya. Dengan demikian, skor yang diperoleh sebagian
merupakan tingkat sejati kemampuan, keterampilan, atau pengetahuan dan

3

Alat ukur panjang dari karet ialah contoh instrumen yang tidak reliabel/ tidak konsisten. Jenis Reliabilitas Suharsimi Arikunto (2010:222) menyatakan bahwa secara garis besar ada dua jenis reliabilitas. Jika ukuran atau kriteriumnya berada di luar instrumen maka dari hasil pengujian ini diperoleh reliabilitas eksternal. Skor benar dan skor kesalahan keduanya teoritis. Metode Pengujian Reliabilitas 4 . akan menghasilkan data yang sama. Berkenaan dengan cara atau metode yang digunakan untuk menguji reliabilitas instrumen sendiri yang menjadi dasar akan dibahas pada bagian 3. dua nama ini sebenarnya menunjuk pada caracara menguji tingkat reliabilitas instrumen. 2.sebagian komponen kesalahan yang mungkin menaikkan atau menurunkan skor. namun di peristiwa yang berbeda. kita hanya bisa berhipotesis apa skor yang benar mungkin. maka akan menghasilkan reliabilitas internal. yaitu reliabilitas eksternal dan reliabilitas internal. 3. Dari pemaparan beberapa ahli tersebut maka dapat disimpulkan bahwa reliabilitas adalah tingkat konsistensi dan keakuratan suatu instrumen sehingga suatu instrumen (tes maupun non-tes) tersebut dapat dipercaya dan diandalkan untuk terus digunakan berulang kali karena selalu menunjukkan hasil yang sama walaupun digunakan pada peristiwa atau waktu yang berbeda pada populasi atau objek yang sama. Sugiyono (2013:121) menyatakan bahwa instrumen yang reliabel adalah instrumen yang bila digunakan beberapa kali untuk mengukur obyek yang sama. Reliabilitas instrumen memampukan konselor atau pengguna lainnya menentukan taraf dimana padanya prediksi berbasis konsistensi tes bisa dilakukan. Seperti halnya pada pembicaraan validitas. Sebaliknya jika perhitungan dilakukan berdasarkan data dari instrumen tersebut saja. Selanjutnya Gibson & Mitchell (2011:357) menyatakan bahwa reliabilitas mengacu pada konsistensi yang dengannya sebuah tes memperoleh hasil yang sama dari populasi yang sama.

Pengujian cara ini sering juga disebut stability. respondennya sama. Metode Format Alternatif (Alternative Form) 5 . Sugiyono (2013:130) menjelaskan bahwa instrumen yang reliabilitasnya diuji dengan test-retest dilakukan dengan cara mencobakan instrumen beberapa kali pada responden. maka berikut akan dipaparkan penjelasannya. b. Pertama adalah metode tes-retes dan kedua adalah menetapkan konsistensi interval instrumen. Reliabilitas diukur dari koefisien korelasi antara percobaan pertama dengan yang berikutnya. Metode tes ulang (test-retest) Gladding (2012:379) menjelaskan bahwa tes-tes ulang yaitu tes yang sama diberikan lagi setelah jangka waktu tertentu. Sedangkan Sugiyono (2013:130) membagi metode pengujian reliabilitas menjadi pengujian secara eksternal dan internal. Secara eksternal pengujian dapat dilakukan dengan test-retest (stability). dan gabungan keduanya.Gibson & Mitchell (2011:357) mengatakan bahwa ada dua teknik yang populer digunakan untuk menetapkan reliabilitas. pewaktuan antar-tes sangat krusial karena pertumbuhan atau kemerosotan performa bisa muncul jika intervalnya terlalu panjang. dan waktunya yang berbeda. Gladding (2012:379) menyatakan ada tiga cara tradisional untuk menentukan reliabilitas yaitu tes-tes ulang. Penjelasan di atas sesuai dengan Gibson & Mitchell (2011:357) yang mengatakan bahwa dalam metode tes-retes. equivalent. Secara internal dengan menganalisis konsistensi butir-butir yang ada pada instrumen dengan teknik tertentu. sedangkan pengingatan item tes orisinil bisa muncul jika intervalnya terlalu pendek. Untuk lebih jelas mengenai metode-metode yang disebutkan di atas. Bila koefisien korelasi positif dan signifikan maka instrumen tersebut sudah dinyatakan reliabel. bentuk paralel atau bentuk alternatif. Jadi dalam hal ini instrumennya sama. a. dan analisis konsistensi internal. ketika metode ini digunakan.

Reliabilitas instrumen dihitung dengan cara mengkorelasikan antara data instrumen yang satu dengan data instrumen yang dijadikan equivalent.Gladding (2012:379) mengatakan bahwa bentuk paralel atau bentuk alternatif yaitu diberikan dua bentuk tes yang setara. setelah itu dikorelasikan pada pengujian kedua. Sebagai contoh (untuk satu butir saja). Berapa tahun pengalaman kerja anda di lembaga ini?. Reliabilitas instrumen dilakukan dengan mengkorelasikan dua instrumen. instrumen berbeda. Jadi cara ini merupakan gabungan pertama dan kedua. Tahun berapa anda mulai bekerja di lembaga ini? Sugiyono menambahkan bahwa reliabilitas instrumen dengan cara ini cukup dilakukan sekali. Pertanyaan tersebut dapat ekuivalen dengan pertanyaan berikut. Hal ini dapat digambarkan seperti gambar berikut (Sugiyono. Bila korelasi positif dan signifikan. tetapi maksudnya sama. maka instrumen dapat dinyatakan reliabel. 2013:130): 6 . c. waktu sama. dan selanjutnya dikorelasikan secara silang. Metode Ekuivalen (Equivalent) Sugiyono (2013:130) menjelaskan bahwa instrumen yang ekuivalen adalah pertanyaan yang secara bahasa berbeda. Metode Gabungan (Test-retest dengan Equivalent) Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua instrumen yang equivalent itu beberapa kali. ke responden yang sama. tetapi instrumennya dua. pada responden yang sama. d.

Bila keenam koefisien korelasi itu semuanya positif dan signifikan. dilakukan dengan cara mencobakan instrumen sekali saja. selain dengan rumus KR20 dan KR21 serta teknik Alpha. Metode Konsistensi Internal (Internal Consistency Method) Gladding (2012:379) menjelaskan bahwa analisis konsistensi internal yaitu membandingkan skor dari dua paruhan tes yang dipilih secara acak. konsistensi ini ditetapkan dengan membandingkan respons pengambil tes terhadap pertanyaan nomorganjil dengan konsistensi respons mereka bagi pertanyaan nomorgenap.Jika dengan dua kali pengujian dalam waktu yang berbeda. Berkenaan dengan teknik pengujian reliabilitas dengan konsistensi internal. akan dapat dianalisis enam koefisien reliabilitas. dapat pula menggunakan teknik belah dua dari 7 . Sedangkan Gibson & Mitchell (2011:357) menjelaskan bahwa dalam konsistensi internal. maka dapat dinyatakan bahwa instrumen tersebut reliabel. kemudian data yang diperoleh dianalisis dengan teknik tertentu. Hasil analisis dapat digunakan untuk memprediksi reliabilitas instrumen (Sugiyono. Pengujian reliabilitas dengan internal consistency. 2013:131). e.

2013:131) KEANDALAN (Raiken. Akibatnya. skor pada instrumen bervariasi lumayan dari waktu ke waktu atau situasi ke situasi. 2010:223-238. Hal ini juga diasumsikan dalam teori tes klasik bahwa varians dari skor yang diamati dari sekelompok orang adalah sama dengan varians skor sejati mereka ditambah varians karena kesalahan sistematis pengukuran. tes ini mungkin terlalu diandalkan bukanlah hal yang sama stabilitas: dalam menentukan keandalan alat ukur. Karena 8 . Tidak seperti ketidakstabilan.00: R11 = 1. Skor benar didefinisikan sebagai rata-rata dari skor seseorang akan dicapai jika ia mengambil tes jumlah tak terbatas kali. 1997: 86) Tidak ada perangkat penilaian dapat menjadi nilai kecuali itu adalah konsisten. harus estimed dari skor mengamati seseorang pada tes. Sugiyono. dengan tidak adanya perubahan permanen dalam diri seseorang karena pertumbuhan. salah satu hal pertama yang harus ditentukan tentang instrumen penilaian yang baru dibangun adalah cuaca cukup handal untuk mengukur apa yang dirancang untuk mengukur. atau cedera. atau kondisi eksternal. pembelajaran. Keandalan seperangkat nilai tes dinyatakan sebagai angka desimal positif mulai dari 00 sampai 1. Rulon dan Anova Hoyt (Suharsimi Arikunto. Teori Keandalan klasik Dalam teori tes klasik. Jika.00 inicates berjumlah tidak dapat diandalkan pengukuran. penyakit.Spearman Brown (Split half). diasumsikan bahwa seseorang diamati skor pada tes terdiri dari skor "benar" ditambah beberapa kesalahan sistematis pengukuran.00 menunjukkan keandalan yang sempurna. seperti motivasi rendah atau sakit. tidak dapat diandalkan adalah hasil dari kesalahan pengukuran yang dihasilkan oleh negara internal sementara. diasumsikan bahwa instrumen yang mengukur karakteristik yang relatif stabil. ukuran sesuatu. dan R11 = 0. Perlu ditekankan bahwa skor sejati seseorang tidak dapat diukur dengan tepat. atau dapat diandalkan. seperti mengganggu atau lingkungan pengujian tidak nyaman. rumus Flanagan.

Prosedur tes-tes ulang memperhitungkan kesalahan rekening pengukuran yang dihasilkan dari perbedaan kondisi yang berhubungan dengan dua kesempatan di mana tes diberikan. kehandalan tidak dipengaruhi oleh perubahan sistematis dalam skor yang memiliki efek yang sama pada semua peserta ujian. daripada panjang (bulan atau tahun). Hal ini jelas mempengaruhi tanggapan mereka di 9 . Masing-masing dari beberapa metode estimasi reliabilitas (test-retest. bentuk paralel. Karena tes yang sama diberikan pada kesempatan kedua. koefisien test-retest ditentukan. Akibatnya. besarnya koefisien reliabilitas test-retest cenderung lebih besar ketika interval antara tes awal dan tes ulang pendek (beberapa hari atau minggu).varians skor sejati tidak dapat dihitung secara langsung. perbedaan antara kondisi administrasi cenderung menjadi lebih besar setelah interval waktu yang lama dari satu pendek. peserta ujian biasanya ingat banyak tanggapan mereka dibuat pada tes awal. Paralel-bentuk Koefisien (Raiken. Faktor-faktor sistematis seperti mempengaruhi varians kesalahan dan karenanya keandalan skor yang diperoleh pada tes. Test-Retest Koefisien (Raiken. kesalahan karena sampel yang berbeda dari item tes tidak tercermin dalam koefisien tes-tes ulang. 1997: 88) Ketika waktu interval antara tes awal dan tes ulang pendek. 1997: 87) Untuk menentukan apakah langkah-langkah instrumen konsisten dari satu waktu ke lain. Selanjutnya. konsistensi internal) memperhitungkan kondisi yang agak berbeda yang dapat menghasilkan perubahan sistematis dalam nilai tes dan akibatnya mempengaruhi besarnya varians kesalahan dan indeks reliabilitas diperoleh saat tes diberikan dalam kondisi tertentu kepada sekelompok orang tertentu. ditemukan dengan menghubungkan nilai pada pemerintahan kedua. Sebagaimana dicatat sebelumnya. kehandalan biasanya estimed dengan menganalisis efek dari variasi dalam kondisi administrasi dan konten pengujian pada hasil tes. tetapi hanya oleh perubahan sistematis yang memiliki efek yang berbeda pada peserta ujian yang berbeda. Koefisien ini stabilitas.

bagaimanapun. bakat khusus). dapat dihitung sebagai indeks keandalan. kecerdasan. 10 . termasuk metode Sperman split-setengah. dan alpha Cronbach.pemerintahan kedua. fakta Wich dengan sendirinya tidak akan mengubah koefisien reliabilitas jika semua orang ingat jumlah yang sama dari respon. memperhitungkan kesalahan account karena waktu yang berbeda administrasi dan item tes yang berbeda. Konsistensi Koefisien internal Paralel-bentuk yang tersedia untuk sejumlah tes. Untuk mengontrol efek pembaur bentuk tes dengan waktu administrasi. salah satu bentuk harus diberikan pertama yang setengah kelompok mengambil bentuk kedua dan kelompok kedua mengambil bentuk pertama. beberapa orang biasanya ingat jawaban lebih daripada yang lain. metode yang kurang langsung dengan mempertimbangkan efek pada keandalan sampel yang berbeda dari item tes itu dibuat. Kemudian koefisien paralelbentuk. terutama uji kemampuan (prestasi. rumus Kuder-Richardson. Korelasi yang dihasilkan antara skor pada dua bentuk. Tetapi karena bentuk paralel tes mahal dan sering sangat sulit untuk membangun. Paralel-bentuk ide yang masuk akal pada prinsipnya: dengan pemberian bentuk paralel setelah interval yang sesuai setelah pemberian bentuk pertama. Namun. mengurangi korelasi antara tes dan tes ulang. yang disebabkan oleh kondisi yang berbeda atau waktu administrasi. yang dikenal sebagai koefisien stabilitas dan kesetaraan. yang. Apa yang tampaknya diperlukan untuk oversome sumber kesalahan adalah bentuk paralel tes. koefisien reliabilitas mencerminkan kesalahan pengukuran karena item yang berbeda dan waktu yang berbeda administrasi dapat dihitung. koefisien konsistensi internal tidak dapat dilihat sebagai benar-benar setara dengan baik tes-tes ulang atau paralel-bentuk koefisien. tidak tercermin dalam koefisien konsistensi internal. Akibatnya. Ini adalah metode konsistensi internal. juga dikenal sebagai koefisien kesetaraan. salah satu yang terdiri dari barang serupa. buut tidak item yang sama. Kesalahan pengukuran.

Misalnya. bila digunakan berkali-kali akan menghasilkan data yang sama (reliabel) tetapi selalu tidak valid. Dengan demikian. karena kenyataannya jamunya tidak manjur. karena hal ini masih akan dipengaruhi oleh kondisi obyek yang diteliti dan kemampuan orang yang menggunakan instrumen untuk mengumpulkan data. sedangkan instrumen sikap jawabannya tidak ada yang "salah atau 11 . Instrumen yang reliabel belum tentu valid. Jadi instrumen yang valid dan reliabel merupakan syarat mutlak untuk mendapatkan hasil tes yang valid dan reliabel. tetapi pengujian reliabilitas instrumen perlu dilakukan (Sugiyono. yang masing-masing mengukur hal yang sama. otomatis hasil (data) tes menjadi valid dan reliabel. Hal ini tidak berarti bahwa dengan menggunakan instrumen yang telah teruji validitas dan reliabilitasnya. Reliabilitas instrumen merupakan syarat untuk pengujian validitas instrumen. Penjual jamu berbicara di mana-mana kalau obatnya manjur (reliabel) tetapi selalu tidak valid. Hal ini disebabkan karena instrumen (meteran) tersebut rusak.Split-setengah Metode ini sering nyaman untuk konsep tes tunggal sebagai terdiri dari dua bagian (bentuk paralel). tes dapat diberikan dan skor terpisah ditugaskan untuk setiap ujian pada dua bagian sewenang-wenang dipilih dari tes. Oleh karena itu tester harus mampu mengendalikan obyek yang dites dan meningkatkan kemampuan dalam menggunakan instrumen untuk mengukur variabel yang diteliti/ dites. Maka korelasi antara dua set nilai adalah bentuk paralel koefisien reliabilitas untuk tes setengah selama pengujian awal. B. Oleh karena itu walaupun instrumen yang valid umumnya pasti reliabel. Urgensi Reliabilitas Dengan menggunakan instrumen yang valid dan reliabel dalam pengumpulan data. item ganjil dapat dinilai secara terpisah dari item genap. maka diharapkan hasil tes pun akan menjadi valid dan reliabel. Meteran yang putus di bagian ujungnya. Instrumen yang berupa test jawabannya adalah "salah atau benar". Pada dasarnya terdapat dua macam instrumen. yaitu instrumen yang berbentuk test untuk mengukur prestasi belajar dan instrumen yang nontest untuk mengukur sikap. 2013:122).

benar" tetapi bersifat "positif dan negatif. Skema tentang instrumen yang baik dan cara pengujiannya sebagaimana yang telah dijelaskan sebelumnya dapat ditunjukkan pada skema berikut ini. APLIKASI RELIABILITAS PENGEMBANGAN ALAT UKUR 12 . C.

Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Dalam metode Paruh. atau seandainya hasilnya berubah-ubah. Besarnya ketetapan itulah menunjukkan tingginya reliabilitas instrumen. perubahan yang terjadi dapat dikatakan tidak berarti. Dalam metode Tes – Retes pengujian (uji coba) dilakukan dua atau tiga kali terhadap sampel yang sama. si A juga berada lebih rendah dari B. yaitu salam dalam kedudukan sisa di antara aggota kelompok yang lain. Penafsirannya sama dengan Tes – Retes. maka jika diadakan pengukuran ulang. artinya bahwa data tersebut benar. Tentu saja tidak dituntut semuanya tetap. sesuai dengan kenyataan. Instrumen yang baik adalah instrumen yang dapat dengan ajeg memberikan data yang sesuai dengan kenyataan. Hasilnya dihitung dengan uji korelasimenggunakan rumus Product Moment dari Pearson. Maka pengertian reliabilitas tes berhubungan dengan masalah ketetapan hasil tes. dan kedua metode Paruh. pertama metode Tes – Retes. pengukuran uji coba hanya dilakukan satu kali. Bila korelasi atau r-nya signifikan. bila instrumen tersebut digunakan mengukur aspek yang diukur beberapa hali hasilnya sama atau relatif sama. Itulah yang dikatakan ajeg atau tetap. Jika keadaan si A awalnya berada lebih rendah dibandingkan dengan B. maka instrumen tersebut memiliki reliabilitas yang memadai dan bisa digunakan untk pengukuran selanjutanya. Tuntutan bahwa instrumen evaluasi harus valid menyangkut harapan diperolehnya data yang valid. skor dari nomor-nomro butir pertanyaan (soal) ganjil dikorelasikan dengan skor tes dari butir-butir soal genap. Minilai ada metode untuk menguji reliabilitas suatu instrumen. maka konsep reliabilitas terkait dengan pemotretan berkali-kali. Jika validitas terkait dengan kegiatan objek yang tidak lain adalah tidak menyimpangnya data dari kenyataan. Ajeg atau tetap tidak selalu harus sama. tetapi mengikuti perubahan secara ajeg.Reliabilitas berhubungan dengan masalah kepercayaan. Reliabilitas berkenaan dengan tingkat keajegan atau ketetapan hasil pengukuran. Suatu instrumen memiliki tingkat reliabilitas yang memadai. 13 .

maka relibilitasnya semakin tinggi. maka semakin panjang tes. sebaliknya sebuah tes yang valid biasanya reliabel. Rumusnya adalah r nn= nr 1+ ( n−1 ) r Di mana: rnn : besarya koefisien reliabilitas sesudah tes tersebut ditambahka butir soal baru n : berapa kali butir-butir soal itu ditambah r : besarnya koefisien reliabilitas sebelum butir-butir soalya ditambah Contoh: Suatu tes terdiri atas 40 butir soal. A reliable measure in one that provides consistent and stable indication of the characteristic being investigated. Dalam hal ini validitas lebih penting dak reliabilitas ini perlu. Tinggi rendahnya validitas menunjukkan tinggi rendahnya reliabilitas tes.70. Scarvia B. Kemudian butir-butir soal itu ditambah menjadi 60 butir soal.Sehubungan dengan reliaibilitas ini. Hal yang berhubungan dengan tes itu sendiri. Maka koefisien reliabilitas baru adalah 14 . yaitu panjang tes dan kualitas butir-butir soalnya Tes yang terdiri dari banyak butir. karena menyokong terbentuknya validita. Dalam menghitung besarnya reliabilitas berhubungan dengan penambaha banyaknya butir soal dalam tes ini ada sebuah rumus yang diberika oleh Sperman dan Brown sehingga terkenal dengan rumus Sperman – Brown. Dengan demikian. dapat dikelompokkan menjadi 3 hal: 1. mempunyai koefisien reliabilitas 0. Sebuah tes mungkin reliabel tetapi tidak valid. yaitu validitas dan reliabilitas ini penting. tentu saja lebih valid dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal. Anderson (dalam Arikunto. Beberapa hal yang mempengaruhi tes. Suharsimi 2009: 87) menyatakan bahwa persyartan bagi tes.

akan mencerminkan keragaman hasil yang menggambarkan besar-kecilnya reliabilitas tes.r nn= nr 1. biaya dan teaga yang dikeluarkan utuk itu. sehingga mudah dan cepat dikerjakan.35 Dengan demikian. apabila diteskan kepada subjek yang sama. Hal yang berhubungan dengan penyelenggaraan tes Sudah disebutka bahwa faktor penyelenggaraan tes yang bersifat admiistratif. 15 . kesejajaran hasil dalam reliabilitas tes. Sampai pada suatu batas tertentu. akan menunjukkan reliabilitas yang lebih besar daripada yang dicobakan pada kelompok tertenu yang diambil secara dipilih. Seperti halnya beberapa teknik juga menggunakan rumus korelasi product moment untuk mengetahui validitas. Hal ini disebabkan karena: a. secara tidak langsung akan mempengaruhi reliabilitas soal tes 2.09. Hal yang berhubungan dengan tercoba (testee) Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa. Penambahan tingginya reliabilitas tes tidak sebanding nilainya dengan waktu. Adanya hal-hal yang mempengaruhi hasil tes ini semua. Kualitas butir-butir soal ditentukan oleh: 1) Jelas tidaknya rumusan soal 2) Baik-tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan salah jawab. Cara Mencari Besarnya Reliabilitas Reliabilitas adalah ketetapan suatu tes. penabahan banyaknya butir soal sudah tidak menambah tinggi reliabilitas tes b.5−1 ) × 0. b.05 = = =0.79 1 ( n−1 ) r 1+ ( 1. Tes yang dicobakan kepada buka kelompok terpilih.70 1. maka penambahan sebanyak 20 butir soal dari 40 butir eperbesar koefisien reliabilitas sebesar 0. sangat menentukan hasil tes.5 × 0. a. Akan tetapi penambahan butirbutir soal tes adakalanya tidak berarti bahka adakalanya merugikan. Untuk mengetahui ketetapn ini pada dasarnya dilihat dari kesejajaran hasil.70 1. 3) Petunjuknya jelas.

Oleh karena tesnya hanya satu dan dicobakan dua kali. 2) Metode tes ulang (tes-retest method) Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. dua buah tes yang paralel. Kemudian hasil dari kedua tes tersebut. Penggunaan metode ini baik. ada orang menyebutnya sebagai double tes-double trial method. Kelemaham metode ii adalah pengetes harus menyusun dua tes sekaligus. dan masing-masing dicobakan pada kelompok siswa yang sama. sehingga tidak ada faktor “masih ingat soalnya” yang dalam evaluasi disebut practice effect dancarry over effect. Ini dikarenakan adanya predictice effect dan carry over effect. karena siswa dihadapkan kepada dua macam tes.Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada di luar tes (consistency external) dan pada tes itu sendiri (consistency internal). Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes. misalnya tes Matematika seri A yang akan dicari reliabilitasnya dan tes seri B diteskan kepada sekelompok siswa yang sama. tetapi dicobakan dua kali. kemudian hasilnya dikorelasikan. tingkat kesukaran dan susunan. untuk mencobakan dua kali tes. Dalam istilah bahasa Inggris disebut alternate-forms method (oarallel forms). pengetes harus menyiapkan dua buah tes. Oleh karena itu. Pada umumya hasil tes yang kedua cenderung lebih baik daripada hasil tes pertama. Yang 16 . Dengan metode bentuk paralel ini. tetapi butir-butir soalnya berbeda. artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut. dihitung korelasinya. Dalam menggunakan metode tes paralel ini. maka metode ini dapat disebut dengan single tes-double trial method. Jika koefisiennya tinggi maka tes tersebut sudah reliabel dan dapat digunakan sebagai alat pengetes yang andal. Koefisien korelasi dari kedua hasil inilah yang menunjukkan koefisien reliabilitas tes seri A. 1) Tes Bentuk Paralel (equivalent) Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaajn tujuan. Dan harus memiliki waktu yang luang. sebagai 2 seri.

Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman-Brown: 2r1 1 r 11 = 22 (1+r ) 11 22 Di mana: r1 1 22 r 11 : korelasi antara skor-skor setiap belahan tes : koefisien reliabilitas yang sudah disesuaikan Contoh: Korelasi antara belahan tes = 0. Contoh: Siswa A B C D E Tes Pertama Tes Kedua Skor Ranking Skor Ranking 15 20 9 18 12 3 1 5 2 4 20 25 15 23 18 3 1 5 2 4 Walaupun tampak skornya naik.penting adalah adanya kesejajaran hasil atau keteteapan hasil yang ditunjukkan ole koefisien korelasi yang tinggi. Oleh karena itu. namun kenaikannya dialami oleh semua siswa.60 17 . 3) Metode belah dua atau Split Half Method Dalam menggunakan metode ini. disebut juga single-test-single-trial method. pengetes hanya menggunakan sebuah tes dan dicobakan satu kali. baru diketahui reliabilitas separo tes. Pada waktu membelah dua dan mengkorelasikan dua belahan. Metode ini juga disebut self-correlation method (korelasi diri sendiri) karena mengkorelasikan hasil dari tes yang sama.

9) X 1 2 3 Her u Har 5 3 0 Item genap (2. untuk selanjutnya dihitung dengan korelasi product moment. Yang benar adalah membelah item ini harus ingat bahwa banyaknya butir soal harus genap agar dapat dibelah. 8.60 1.4.60 1.75 1+0.3. Skor-skor untuk seluruh subjek dan seluruh item ini diterakan dalam tabel analisis. Pembelahannya hanya memilih salah satu saja. yaitu: a) Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut belahan ganji.10) Y 3 2 4 18 . Contoh Perhitungan Reliabilitas dengan Metode Belah Dua Langkah pertama yang harus dilakukan adalah mengadakan analisis butir soal yang lebih terkenal dengan nama analisis item. Yang mereka lakukan adalah mengelompokkan hasil separo subjek peserta tes dan separo lain kemudian hasil kedua kelompok ini dikorelasikan. Penyajiann contoh membelah di atas berarti baha perhitungan reliabilitas dilakukan dengan membelah dengan dua caara.5 . dan b) Membelah atas item-item awal dan item-item akhir. Item yang dapat dijawab dengan benar diberi skor dan bagi yang salah dibero skor 0.60 Banyak pemakai metodE ini salah membelah hasil tes pada waktu menganalisis.6. Ada dua cara membelah butir soal.20 = =0.7.Maka reliabilitas tes = 2 × 0. yaitu separo jumlah pada nomot-nomor aal dan separo pada nomor-nomor akhir yang selanjutnya disebut belahan awal-akhir. 1) Pembelahan genap-ganjil Tabel persiapan perhitungan reliabilitas dengan belah dua ganjil-genap: N o Na ma Item ganjil (1.-genap.

diketahui bahwa ΣX = 25 ΣX2 = 93 ΣY = 22 ΣY2 = 76 ΣXY = 63 Setelah dihitung dengan rumus korelasi product moment dengan angka kasar diketahui bahwa r xy =−0.5493 1+ (−0. Oleh karena itu.3786 .3786 −0.4 5 6 7 8 i Hen i Her a Her i Her o Hur a Hur e 3 3 4 4 3 2 3 0 3 5 Dengan menggunakan kalkulator.3786 ) 1.3786 19 . Untuk mencari reliabilitas seluruh tes digunakan rumus Spearman-Brown.7572 = =−0. Jika koefisien reliabilitas separo tes ini dimasukkan ke dalam rumus hitungannya demikian: 2r1 1 r 11 = 22 (1+r ) 11 22 ¿ 2×−0. Harga tersebut menunjukkan angka kasar relibilitas separo tes. istilah r1 1 22 atau r¿ r xy singkatan dari untuk belahan ini disebut dengan r ganjil− genap .

Selain menggunakan rumus korelasi product moment.5538 22 .3 .8. 9. Dengan rumus Spearman-Bron diperoleh .4.3831 kasar diperoleh r 11 =−0.2.2) Pembelahan Awal Akhir Dengan data yang tertera pada tabel analisis item tes matematika dikethui jumlah skor belahan aal akhir adalah: N o Na ma 1 2 3 4 5 6 7 8 Her u Har i Hen i Her a Her i Her o Hur a Hur e Item awal (1.10) Y 3 2 1 3 5 3 5 3 5 3 3 2 1 1 2 5 Dengan menggunakan kalkulator diketahui: ΣX = 25 ΣX2 = 91 ΣY = 22 ΣY2 = 78 ΣXY = 63 Setelah dimasukkan ke dalam rumus korelasi product moment dengan angka r 1 1 =−0. Seorang bernama Flanagan menemukan rumus yang 20 .7. dua orang ahli mengajuka rumus lain.5) X Item akhir (6.

Dalam kalkulator tertera simbol σ. 3) Penggunaan rumus Flanagan S 21 +S 22 r =2 1− Rumus 11 S2t ( ) Di mana: r 11 = reliabilitas tes S 21 = varians belahan pertama (1) yang dalam hal ini varians skor item ganjil 2 S2 = varians belahan kedua (2) yaitu varian skor item genap S 2t = varians total yaitu varian skor total Secara sederhana dapat dipahami bahwa varians adalah standar deviasi kuadrat. 21 . Untuk mereka yang tidak menggunakan kalkulator statistik. Namun huruf S B (besar) juga dapat dikatakan sudah menyebut standar deviasi. maka varians dapat dicari dengan rumus: X ∑ ¿2 ¿ ¿ N ¿ X 2−¿ ∑¿ S 2=¿ Standar Deviasi (SD) dapat disebut dengan istilah Indonesia Simpangan Baku (SB).perhitungannya menggunakan belah dua ganjil-genap. Dengan demikian bagi peminat yang menghitung dengan kalkulator statistik varians ini diperoleh dengan mengkuadratkan standar deviasi. dan seorang lagi bernama Rulon yang rumusnya diterapkan pada data belahan awal-akhir.

359 ) 4) Penggunaan Rumus Rulon 2 r 11 =1− Rumus Sd 2 St Di mana: S 2d = varians beda (variants difference) 22 .937 =−2 ( 1−1.859 8 = 76−60. yaitu: √∑ x S= 2 N S = standar deviasi x = simpangan dari X dari X´ . dapat menggunakan rumus S. karena standar deviasi kuadrat N = banyaknya subjek pengikut tes Berdasarkan data tabel belahan ganjil-genap perhitungannya adalah sebagai berikut: S 21= S 22= S 2t = 252 8 93− 93−78.937 8 8 = 76− 222 8 8 295− 8 47 8 2 = 295−276. maka diperoleh ( r 11 =2 1− 1.13 =2.218 2.859+1.5 =1.125 =1.609 )=−1. yang dicari dengan X − X´ S2 = varians selalu dituliskan dalam bentuk kuadrat.Bagi yang berminat mencari S dulu untuk mencari varian.36 8 Dimasukkan ke dalam rumus.

00. Untuk memperjelas keterangan.36 Dari perhitungan dengan rumus Flanagan maupun rulon. keduanya lebih besar dari 1. ternyata hasilnya sama. Secara teoritik koefisien ini 23 .218=−1. diketahui bahwa: ∑ d =3 ∑ d 2=43 Dari perhitungan terdahulu diketahui: Varians total = 2.234 =1−2.75 d ∑ ¿2 ¿ ¿ N ¿ ∑ d 2−¿ 2 S d=¿ Dimasukkan ke dalam rumus Rulon r 11 =1− 5.218 2.d = difference yaitu perbedaan antara skor belahan pertama (awal) dengan skor belahan kedua (akhir). maka tabel belahan awal-akhir dikutip di sini lagi N o Nama 1 2 3 4 5 6 7 8 Heru Hari Heni Hera Heri Hero Hura Hure awal akhir 3 2 1 3 5 3 5 3 5 3 3 2 1 1 2 5 d -2 -1 -2 1 4 2 3 -2 Dengan kalkulator atau hitungan biasa.

56 S 2−∑ pq 7 1. Rumus yang digunakan untuk mencari reliabilitas dan banyak digunakan orang ada dua rumus.Kedua ahli ini menemukan banyak rumus yang diberi nomor. maka reliabilitas dapat dicari dengan rumus yang ditemukan oleh Kuder dan Richardson. tetapi karena pembulatan-pembulatan dalam perhitungan. item-item yang membentuk soal tes harus homogen atau paling tidak setelah dibelah terdapat keseimbangan antara belahan pertama dengan belahan kedua Untuk mengatasi kesulitas memenuhi persyaratan ini.21 5) Penggunaan rumus K-R. Salah satu syarat untuk dapat menggunakan metode belah dua adalah bahwa banyaknya item harus genap agar dapat dibelah. yaitu rumus K-R.31 = × 6 S2 1. Syarat yang kedua.362−1.20 ( )( n r 11 = n−1 S=1. dicari dengan menarik akar varians 24 . hasil seperti ini dapat terjadi.salah.362 ) (dicari dengan kalkulator. 20 dan rumus K-R.20 ( )( n r 11 = n−1 Rumus s 2−∑ pq S2 ) Di mana: r11 : reliabilitas tes secara keseluruhan p : proporsi subjek yang menjawab item dengan benar q : proporsi subjek yang menjawab item dengn salah q=1− p Σpq : jumlah hasil perkalian antara p dan q n : banyaknya item S : standar deviasi dari tes (standar deviasi adalah akar varians) Dimasukkan ke dalam rumus K-R.

17 × 0.20 dan K-R. dibulatkan 1.17 × =1.25 × 1− =1.06329 dibulatkan 0.17 × 0.95 12.342 6) Penggunaan Rumus K-R.5 12.0633 Jika dibandingkan reliabilitas yang dihitung dengan K-R.946 )=1.85 12.17 × 1.85 0. Memang menggunakan rumus K-R. yaitu dengan menggunakan rumus Hoyt.3415 .31 0.29=0.¿ 1.21 M ( n−M ) n 1− n−1 nS21 ( )( r 11 = Rumus ) M = Mean atau rerata skor total r 11 = 3. 21 lebih besar yang pertama.20 cenderung memberikan hasil yang lebih tinggi.54 =1.85−1.85 1.95 ( ) ( ) ( ) ¿ 1.5 ) 7 3.5 ( 7−3.17 × ( 1−0. 7) Penggunaan Rumus Hoyt Masih ada satu cara lain untuk mencari reliabilitas. namun pekerjaan lebih rumit. Rumus r 11 =1− Vs Vr atau r 11 = v r−v s vr Keterangan: r11 = reliabilitas seluruh soal Vr = Varians responden Vs = Varians siswa Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah sebagai berikut: 25 .17 × 1− 7−1 7 ×1.5 ×3.0541 ¿ 0.17 × 1− =1.

Mencari jumlah kuadrat item dengan rumus: Xt ∑ ¿2 ¿ ¿ ∑ B2 −¿ Jk (i)= N Keterangan: Jk(i) = jumlah kuadrat item ΣB2 = jumlah kuadrat jaab benar seluruh item (ΣXt)2 = Kuadrat dari jumlah skor total Langkah 3. Mencari jumlah kuadrat total dengan rumus: Jk (t )= (∑ B )( ∑ S ) ( ∑ B )+(∑ S ) Keterangan: Jk(t) = jumlah kuadrat total ΣB = jumlah jawab benar untuk seluruh item ΣS = jumlah jawab salah untuk seluruh item 26 .Langkah 1. Mencari jumlah kuadrat responden dengan rumus: Xt ∑ ¿2 ¿ ¿ 2 Xt ∑ Jk (r )= −¿ k Keterangan: Jk(r) = jumlah kuadrat responden Xt = skor total tiap responden k = banyaknya item N = banyaknya responden atau subjek Langkah 2.

Memasukkan ke dalam rumus r 11 Contoh Perhitungan Dengan menggunakan tabel analisis item yang digunakan untuk mencari reliabilitas tes dengan rumus K-R.b = banyaknya N setiap sumber variansi dikurangi 1 Jadi Variansi = jumlah kuadrat d . Dalam mencari varians ini diperlukan d. melalui langkah-langkah sebagai berikut: Langkah 1.643 7 7 ×10 27 .b ini digunakan sebagai penyebut terhadat setiap jumlah kuadrat untuk memperoleh variansi.b (derajat kebebasan) dari masingmasing sumber varians kemudian d.5=2. Mencari jumlah kuadrat responden Xt ∑ ¿2 ¿ ¿ X 2t ∑ Jk (r )= −¿ k 141 35 2 ¿ − =20. d. Mencari Varians responden dan varians sisa dengan tabel F.143−17. Namun karena bilangan-bilangan yang diperlukan dalam tabel tersebut belum lengkap. dengan rumus Jk (s ) =Jk (t )−Jk (r )−Jk (i ) Langkah 5. kiranya lebih baik dikutipkan lagi dalam tabel berikut: Berdasarkan tabel ini. maka dapat dicari reliabilitas soal dengan rumus Hoyt. Mencari jumlah kuadra sisa.Langkah 4. 20 dapat dicari reliabilitas dengan rumus Hyot.b Langkah 6.

457 =0.457 Langkah 5.4 10 7 ×10 Langkah 3. Mencari jumlah kuadrat item Xt ∑ ¿2 ¿ ¿ 2 B ∑ Jk (i)= −¿ N 2 ¿ 219 35 − =21.4 =0. Mencari jumlah kuadrat total Jk (t )= ¿ (∑ B )( ∑ S ) ( ∑ B )+(∑ S ) ( 35 ) ( 25 ) 1225 = =17.5=4.4 6 ( 7−1 ) 4.9−17.19 54 Sisa Total 17. Mencari Varians responden dan Varians sisa dengan tabel F Tabel F Sumber Variansi Responden Item Jumlah Kuadrat d.294 9 4.634 9 ( 10−1 ) 2.b Varians 2.5 28 .733 6 10.5 ( 35 )+ (35 ) 70 Langkah 4.457 54 ( 69−9−6 ) 10.634 =0.643−4.5−2. Mencari jumlah kuadrat sisa Jk (s ) =Jk (t )−Jk (r )−Jk (i ) ¿ 17.Langkah 2.4=10.

658+ 0.342 0.b total - d.1936 =1−0. harus dicari d. b item=69−9−6=54 N−1=10−1=9 Langkah 6.b total−d .69 ( 70−1 ) Untuk mencari d. b responden−d .b total dahulu baru dikurangi d.b responden = - d.b sisa = d .b sisa.b item = k × N −1+ 7 ×10−1=70−1=69 - d. Memasukkan ke dalam rumus r 11 =1− ¿ 1− Vs Vr 0.294 29 .b item = k −1=7−1=6 - d.b responden dan d.

BAB III PENUTUP A. 30 . Kesimpulan Reliabilitas merupakan tingkat konsistensi dan keakuratan suatu instrumen sehingga suatu instrumen (tes maupun non-tes) tersebut dapat dipercaya dan diandalkan untuk terus digunakan berulang kali karena selalu menunjukkan hasil yang sama walaupun digunakan pada peristiwa atau waktu yang berbeda pada populasi atau objek yang sama. Validitas dan reliabilitas sesuatu yang sangat penting untuk diperhatikan sebagai ukuran baik tidaknya suatu instrument tes. 2. B. Apalagi instrumen tes psikologi merupakan suatu hal yang memerlukan proses panjang untuk mencapai tingkat kebakuannya sehingga dapat digunakan banyak pihak yang berwenang dan berkompeten. Bagi pembaca pada umumnya diharapkan jika akan membuat suatu instrumen (tes maupun non tes) untuk dapat memperhatikan secara utuh terkait kriteria instrumen yang baik termasuk yang memiliki tingkat validitas dan reliabilitas yang tinggi sehingga instrumen tersebut bermutu. Bagi pengguna instrumen tes pemula diharapkan untuk dapat menggunakan tes yang sudah teruji validitas dan reliabilitasnya sebelum digunakan untuk suatu kepentingan yang bertanggungjawab. Saran 1. Reliabilitas dapat diukur dengan macam-macam metode yang membuatnya terbagi menjadi dua jenis yaitu internal dan eksternal.

1997.Psychological Testing and Assesment (9 thed). 2011.H. Suharsimi Arikunto.Boston. Bandung: Alfabeta.L. Konseling Profesi yang Menyeluruh. 2013.& Jones.J.Inc. Prosedur Penelitian: Suatu Pendekatan Praktik. Gibson. T. Sugiyono. Assessment Procedures For Counselors And Helping Professionals. 2012. Drummod. New Jersey: Pearson Education. K. Bimbingan dan Konseling: Terjemahan Introduction to Counseling and Guidance (Edisi Ketujuh). R. Samuel.L.D. Metode Penelitian Kuantitatif dan R&D. Jakarta: Indeks. M. 2006. Jakarta: Rineka Cipta. 31 .Allyn and Bacon. Gladding. 2010. Yogyakarta: Pustaka Pelajar. dan Mitchell.DAFTAR PUSTAKA Aiken.R. R.