You are on page 1of 20

TEORI VALIDITAS

Konsep Validitas Menurut Azwar (1986) para ahli psikometri telah menetapkan kriteria bagi suatu alat ukur psikologis untuk dapat dinyatakan sebagai alat ukur yang baik dan mampu memberikan informasi yang tidak menyesatkan. Kriteria itu antara lain adalah valid, reliabel, norma dan praktis. Sifat reliabel dan valid diperlihatkan oleh tingginya reliabilitas dan validitas hasil ukur suatu tes. Suatu alat ukur yang tidak reliabel atau tidak valid akan memberikan informasi yang keliru mengenai keadaan subjek atau individu yang dikenai tes itu. Apabila informasi yang keliru itu dengan sadar atau tidak dengan sadar digunakan sebagai dasar pertimbangan dalam pengambilan suatu keputusan, maka keputusan itu tentu bukan merupakan suatu keputusan yang tepat. Seringkali pula keputusan itu tidak menyangkut individu secara langsung akan tetapi mengenai suatu kelompok. Dalam berbagai studi dan penelitian tidak jarang dipergunakan alat ukur untuk mengetahui keadaan atau status psikologis sekelompok individu tertentu. Berikut ini akan dibahas antara lain adalah pengertian validitas, koefisien validitas, tipe-tipe umum pengukuran validitas, dan konsep pengukuran validitas. a. Pengertian Validitas Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya (Azwar 1986). Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran. Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel A' atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A' atau B (Azwar 1986).

Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut. Cermat berarti bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang sekecil-kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas agar hasil penimbangannnya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak akan terlihat pada alat ukur berat badan. Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam perjalanan dari satu kota ke kota lainnya, maka sebuah jam tangan biasa adalah cukup cermat dan karenanya akan menghasikan pengukuran waktu yang valid. Akan tetapi, jam tangan yang sama tentu tidak dapat memberikan hasil ukur yang valid mengenai waktu yang diperlukan seorang atlit pelari cepat dalam menempuh jarak 100 meter dikarenakan dalam hal itu diperlukan alat ukur yang dapat memberikan perbedaan satuan waktu terkecil sampai kepada pecahan detik yaitu stopwatch. Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai angka yang sebenarnya atau angka yang mendekati keadaan sebenarnya (Azwar 1986). Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Dengan demikian, anggapan valid seperti dinyatakan dalam "alat ukur ini valid" adalah kurang lengkap. Pernyataan valid tersebut harus diikuti oleh keterangan yang menunjuk kepada tujuan (yaitu valid untuk mengukur apa), serta valid bagi kelompok subjek yang mana? Istilah validitas ternyata memiliki keragaman kategori. Ebel (dalam Nazir 1988) membagi validitas menjadi concurrent validity, construct validity, face validity, factorial validity, empirical validity, intrinsic validity, predictive validity, content validity, dan curricular validity. Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan kinerja. Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa yang diukur oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat dapat menyebabkan kinerja yang baik dalam pengukuran.

Face Validity adalah validitas yang berhubungan apa yang nampak dalam mengukur sesuatu dan bukan terhadap apa yang seharusnya hendak diukur. Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktorfaktor yang yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya, dimana validitas ini diperoleh dengan menggunakan teknik analisis faktor. Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran. Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti kuantitatif dan objektif untuk mendukung bahwa suatu alat ukur benar-benar mengukur apa yang seharusnya diukur. Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerja seseorang di masa mendatang. Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi. Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan menilai seberapa jauh pengukuran tersebut merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional. Sementara itu, Kerlinger (1990) membagi validitas menjadi tiga yaitu content validity (validitas isi), construct validity (validitas konstruk), dan criterion-related validity (validitas berdasar kriteria). b. Koefisien Validitas Bila skor pada tes diberi lambang x dan skor pada kriterianya mempunyai lambang y maka koefisien antara tes dan kriteria itu adalah rxy inilah yang digunakan untuk menyatakan tinggi-rendahnya validitas suatu alat ukur. Koefisien validitas pun hanya punya makna apabila apalagi mempunyai harga yang positif. Walaupun semakin tinggi mendekati angka 1 berarti suatu tes semakin valid hasil ukurnya, namun dalam kenyataanya suatu koefisien validitas tidak akan pernah mencapai angka maksimal atau mendekati angka 1. Bahkan suatu koefisien validitas yang tinggi adalah lebih sulit untuk dicapai daripada koefisien reliabilitas. Tidak semua pendekatan dan estimasi terhadap validitas tes akan menghasilkan suatu koefisien. Koefisien validitas diperoleh hanya dari komputasi statistika secara empiris antara skor tes dengan skor kriteria yang besarnya disimbolkan oleh rxy tersebut. Pada pendekatan-pendekatan tertentu tidak dihasilkan suatu koefisien akan tetapi diperoleh indikasi validitas yang lain. c. Tipe-tipe Umum Pengukuran Validitas

Tipe validitas sebagaimana disajikan sebelumnya, pada umumnya digolongkan dalam tiga kategori, yaitu content validity (validitas isi), construct validity (validitas konstruk), dan criterion-related validity (validitas berdasar kriteria). 1). Validitas Isi Validitas isi merupakan validitas yang diperhitumgkan melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi ini adalah "sejauhmana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?" atau berhubungan dengan representasi dari keseluruhan kawasan. Pengertian "mencakup keseluruhan kawasan isi" tidak saja menunjukkan bahwa alat ukur tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi yang relevan dan tidak keluar dari batasan tujuan ukur. Walaupun isi atau kandungannya komprehensif tetapi bila suatu alat ukur mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri validitas yang sesungguhnya.

Konstruk Pengukuran

Gambar 3. Validitas Isi Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak tergantung pada penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak melibatkan komputasi statistik, melainkan hanya dengan analisis rasional maka

tidak diharapkan bahwa setiap orang akan sependapat dan sepaham dengan sejauhmana validitas isi suatu alat ukur telah tercapai. Selanjutnya, validitas isi ini terbagi lagi menjadi dua tipe, yaitu face validity (validitas muka) dan logical validity (validitas logis). Face Validity (Validitas Muka). Validitas muka adalah tipe validitas yang paling rendah signifikasinya karena hanya didasarkan pada penilaian selintas mengenai isi alat ukur. Apabila isi alat ukur telah tampak sesuai dengan apa yang ingin diukur maka dapat dikatakan validitas muka telah terpenuhi. Dengan alasan kepraktisan, banyak alat ukur yang pemakaiannya terbatas hanya mengandalkan validitas muka. Alat ukur atau instrumen psikologi pada umumnya tidak dapat menggantungkan kualitasnya hanya pada validitas muka. Pada alat ukur psikologis yang fungsi pengukurannya memiliki sifat menentukan, seperti alat ukur untuk seleksi karyawan atau alat ukur pengungkap kepribadian (asesmen), dituntut untuk dapat membuktikan validitasnya yang kuat. Konstruk
Komunitas Ilmiah

?
Pengukuran

Gambar 4. Validitas Muka Logical Validity (Validitas Logis). Validitas logis disebut juga sebagai validitas sampling (sampling validity). Validitas tipe ini menunjuk pada sejauhmana isi alat ukur merupakan representasi dari aspek yang hendak diukur. Untuk memperoleh validitas logis yang tinggi suatu alat ukur harus dirancang sedemikian rupa sehingga benar-benar berisi hanya item yang relevan dan perlu menjadi bagian alat ukur secara

keseluruhan. Suatu objek ukur yang hendak diungkap oleh alat ukur hendaknya harus dibatasi lebih dahulu kawasan perilakunya secara seksama dan konkrit. Batasan perilaku yang kurang jelas akan menyebabkan terikatnya item-item yang tidak relevan dan tertinggalnya bagian penting dari objek ukur yang seharusnya masuk sebagai bagian dari alat ukur yang bersangkuatan. Validitas logis memang sangat penting peranannya dalam penyusunan tes prestasi dan penyusunan skala, yaitu dengan memanfaatkan blue-print atau tabel spesifikasi. 2). Validitas Konstruk Validitas konstruk adalah tipe validitas yang menunjukkan sejauhmana alat ukur mengungkap suatu trait atau konstruk teoritis yang hendak diukurnya (Allen & Yen, dalam Azwar 1986). Pengujian validitas konstruk merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur. Walaupun pengujian validitas konstruk biasanya memerlukan teknik analisis statistik yang lebih kompleks daripada teknik yang dipakai pada pengujian validitas empiris lainnya, akan tetapi validitas konstruk tidaklah dinyatakan dalam bentuk koefisien validitas tunggal. Konsep validitas konstruk sangatlah berguna pada alat ukur yang mengukur trait yang tidak memiliki kriteria eksternal. Konstruk Konstruk yang berlawanan

Gambar 5. Validitas Konstruk

3). Validitas Berdasar Kriteria Pendekatan validitas berdasar kriteria menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor alat ukur.

Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi antara skor alat ukur dengan skor kriteria. Koefisien ini merupakan koefisien validitas bagi alat ukur yang bersangkutan, yaitu rxy, dimana x melambangkan skor alat ukur dan y melambangkan skor kriteria. Dilihat dari segi waktu untuk memperoleh skor kriterianya, prosedur validasi berdasar kriteria menghasilkan dua macam validitas yaitu validitas prediktif (predictive validity) dan validitas konkuren (concurrent validity).

Konstruk Teoritis Pengukuran Pengukuran lama Hasil sama Perilaku yang akan datang

Gambar 6. Validitas Berdasar Kriteria Validitas Prediktif. Validitas prediktif sangat penting artinya bila alat ukur dimaksudkan untuk berfungsi sebagai prediktor bagi kinerja di masa yang akan datang. Contoh situasi yang

menghendaki adanya prediksi kinerja ini antara lain adalah dalam bimbingan karir; seleksi mahasiswa baru, penempatan karyawan, dan semacamnya. Contohnya adalah sewaktu kita melakukan pengujian validitas alat ukur kemampuan yang digunakan dalam penempatan karyawan. Kriteria yang terbaik antara lain adalah kinerjanya setelah ia betul-betul ditempatkan sebagai karyawan dan melaksanakan tugasnya selama beberapa waktu. Skor kinerja karyawan tersebut dapat diperoleh dari berbagai cara, misalnya menggunakan indeks produktivitas atau rating yang dilakukan oleh atasannya. Koefisien korelasi antara skor alat ukur dan kriteria merupakan petunjuk mengenai saling hubungan antara skor alat ukur dengan skor kriteria dan merupakan koefisien validitas prediktif. Apabila koefisien ini diperoleh dari sekelompok individu yang merupakan sampel yang representatif, maka alat ukur yang telah teruji validitasnya akan mempunyai fungsi prediksi yang sangat berguna dalam prosedur alat ukur di masa datang. Prosedur validasi prediktif pada umumnya memerlukan waktu yang lama dan mungkin pula beaya yang tidak sedikit dikarenakan prosedur ini pada dasarnya bukan pekerjaan yang dianggap selesai setelah melakukan sekali tembak, melainkan lebih merupakan kontinuitas dalam proses pengembangan alat ukur. Sebagaimana prosedur validasi yang lain, validasi prediktif pada setiap tahapnya haruslah diikuti oleh usaha peningkatan kualitas item alat ukur dalam bentuk revisi, modifikasi, dan penyusunan item-item baru agar prosedur yang dilakukan itu mempunyai arti yang lebih besar dan bukan sekedar pengujian secara deskriptif saja. Validitas Konkuren. Apabila skor alat ukur dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkuren. Suatu contoh dimana validitas konkuren layak diuji adalah apabila kita menyusun suatu skala kecemasan yang baru. Untuk menguji validitas skala tersebut kita dapat mengunakan skala kecemasan lain yang telah lebih dahulu teruji validitasnya, yaitu dengan alat ukur TMAS (Tylor Manifest Anxiety Scale). Validitas konkuren merupakan indikasi validitas yang memadai apabila alat ukur tidak digunakan sebagai suatu prediktor dan merupakan validitas yang sangat penting dalam situasi diagnostik. Bila alat ukur dimaksudkan sebagai prediktor maka validitas konkuren tidak cukup memuaskan dan validitas prediktif merupakan keharusan. Konsep Pengukuran Validitas Pengukuran validitas sebenarnya dilakukan untuk mengetahui seberapa besar (dalam arti kuantitatif) suatu aspek psikologis terdapat dalam diri seseorang, yang dinyatakan oleh skor pada instrumen pengukur yang bersangkutan.

Dalam hal pengukuran ilmu sosial, validitas yang ideal tidaklah mudah untuk dapat dicapai. Pengukuran aspek-aspek psikologis dan sosial mengandung lebih banyak sumber kesalahan (error) daripada pengukuran aspek fisik. Kita tidak pernah dapat yakin bahwa validitas instrinsik telah terpenuhi dikarenakan kita tidak dapat membuktikannya secara empiris dengan langsung. Pengertian validitas alat ukur tidaklah berlaku umum untuk semua tujuan ukur. Suatu alat ukur menghasilkan ukuran yang valid hanya bagi satu tujuan ukur tertentu saja. Tidak ada alat ukur yang dapat menghasilkan ukuran yang valid bagi berbagai tujuan ukur. Oleh karena itu, pernyataan seperti "alat ukur ini valid" belumlah lengkap apabila tidak diikuti oleh keterangan yang menunjukkan kepada tujuannya, yaitu valid untuk apa dan valid bagi siapa. Itulah yang ditekankan oleh Cronbach (dalam Azwar 1986) bahwa dalam proses validasi sebenarnya kita tidak bertujuan untuk melakukan validasi alat ukur akan tetapi melakukan validasi terhadap interpretasi data yang diperoleh oleh prosedur tertentu. Dengan demikian, walaupun kita terbiasa melekatkan predikat valid bagi suatu alat ukur akan tetapi hendaklah selalu kita pahami bahwa sebenarnya validitas menyangkut masalah hasil ukur bukan masalah alat ukurnya sendiri. Sebutan validitas alat ukur hendaklah diartikan sebagi validitas hasil pengukuran yang diperoleh oleh alat ukur tersebut.
http://violetatniyamani.blogspot.com/2007/09/teori-validitas.html

Sabtu, 29 September 2007

Validitas dan Reliabilitas

Jun 10, '08 9:36 AM for everyone

Dalam setiap penelitian selalu terjadi proses pengumpulan data dan dalam proses pengumpulan data tersebut akan menggunakan satu atau beberapa metode. Jenis metode yang dipilih dan digunakan dalam pengumpulan data, tentunya harus sesuai dengan sifat dan karakteristik penelitian yang dilakukan. Instrumen adalah alat yang digunakan untuk mengumpulkan data-data tersebut. Instrumen dapat dianalogikan sebagai ujung tombak untuk membidik data dalam sebuah penelitian. Melalui instrumenlah akhirnya terkumpul data yang nantinya diolah menjadi sebuah informasi hasil penelitian. Untuk itulah, perlu kiranya memilih dan merumuskan instrumen secara tepat. Hal ini sejalan dengan ungkapan garbage tool garbage result. Jadi, pada dasarnya salah satu hal yang mempengaruhi hasil penelitian

terletak pada instrumennya. Semakin baik konstruksi sebuah instrumen, maka semakin baik pula data yang berhasil dijaring, begitu pula sebaliknya.

PEMBAHASAN

Sebelum diuraikan mengenai seluk beluk instrumen, maka akan diinformasikan terlebih dahulu judul buku yang dibahas dalam tugas ini, antara lain : Manajemen Penelitian (Suharsimi Arikunto), Menyusun dan Mengevaluasi Laporan Penelitian (Soetarlinah Sukadji), Reliabilitas dan Validitas (Saifuddin Azwar), dan Psychological Testing (Anne Anastasi dan Susana Urbina). A. Manajemen Penelitian (Suharsimi Arikunto) 1. Validitas Instrumen (halaman 219) Validitas adalah keadaan yang menggambarkan tingkat instrumen bersangkutan yang mampu mengukur apa yang akan diukur. Ada dua jenis validitas, yaitu : a. Validitas Logis Apabila instrumen tersebut secara analisis akal sudah sesuai dengan isi dan aspek yang diungkapkan. Instrumen yang sudah sesuai dengan isi dikatakan sudah memiliki validitas isi, sedangkan instrumen yang sudah sesuai dengan aspek yang diukur dikatakan sudah memiliki validitas konstruksi. b. Validitas Empiris 2. Reliabilitas Instrumen (halaman 220 222) Ada tiga teknik untuk menguji reliabilitas instrumen, yaitu : a. Teknik Paralel (Paralel Form Atau Alternate Form) Disebut juga teknik double test double trial. Sejak awal peneliti harus sudah menyusun dua perangkat instrumen yang paralel (ekuivalen), yaitu dua buah instrumen yang disusun berdasarkan satu kisi-kisi. Setiap butir soal dari instrumen yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua

instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil kedua instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson). b. Teknik Ulang (test re-test) Disebut juga teknik single test double trial. Menggunakan sebuah instrumen, namun diteskan dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas. Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson. c. Teknik Belah Dua (split halve method) 1) Disebut juga teknik single test single trial. Peneliti boleh hanya memiliki seperangkat instrumen saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrumen menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomer ganjil-genap, atas dasar nomer awal-akhir, dan dengan cara undian. B. Menyusun dan Mengevaluasi Laporan Penelitian (Soetarlinah Sukadji) 1. Validitas (halaman 30 31) Validitas adalah derajat yang menyatakan suatu tes mengukur apa yang seharusnya diukur. Validitas suatu tes tidak begitu saja melekat pada tes itu sendiri, tetapi tergantung penggunaan dan subyeknya. Validitas dipecah lagi menjadi berbagai jenis yang akan dijabarkan berikut ini : a. Validitas Isi Adalah seberapa besar derajat tes mengukur representasi isi yang dikehendaki untuk diukur. Validitas aitem berkaitan dengan apakah aitem mewakili pengukuran dalam area isi sasaran yang diukur, dan validitas sampling adalah seberapa baik sampel isi tes mewakili keseluruhan isi sasaran yang diukur. Biasanya dinilai dengan menggunakan pertimbangan pakar. b. Validitas Konstruk/Teoretik Adalah seberapa besar derajat tes mengukur konstruk hipotesis yang dikehendaki untuk diukur. Konstruk adalah perangai yang tidak dapat diamati, yang menjelaskan perilaku. Menguji validitas konstruk mencakup uji hipotesis yang dideduksi dari suatu teori yang mengajukan konstruk tersebut.

c. Validitas Konkruen Validitas ini menunjukkan seberapa besar derajat skor tes berkorelasi dengan skor yang diperoleh dari tes lain yang sudah mantap, bila disajikan pada saat yang sama, atau dibandingkan dengan kriteria lain yang valid yang diperoleh pada saat yang sama. d. Validitas Prediktif Adalah seberapa besar derajat tes berhasil memprediksi kesuksesan seseorang pada situasi yang akan datang. Validitas prediktif ditentukan dengan mengungkap hubungan antara skor tes dengan hasil tes atau ukuran lain kesuksesan dalam satu situasi sasaran. 2. Reliabilitas (halaman 31 32) Reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas tinggi. Reliabilitas dapat dibagi lagi menjadi : a. Reliabilitas Tes Re-Tes Adalah seberapa besar derajat skor tes konsisten dari waktu ke waktu. Reliabilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda. b. Reliabiltas Belah-Dua Reliabiltas ini diukur dengan menentukan hubungan antara skor dua paruh yang ekuivalen suatu tes, ang disajikan kepada seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat. c. Reliabilitas Rasional Ekuivalen Reliabilitas ini tidak ditentukan menggunakan korelasi tetapi menggunakan estimasi konsistensi internal. Reliabilitas ini diukur menggunakan Kuder-Richardson, biasanya Formula-20 (KR-20) atau Formula-

21 (KR-21). Kedua rumus ini hanya dapat dipakai untuk tes yang aitem-aitemnya diskor dikotomi, yaitu benar atau salah, 0 atau 1. d. Reliabilitas Penyekor/Penilai Adalah reliabilitas dua (atau lebih) penyekor independen. Reliabilitas ini biasa ditentukan menggunakan teknik korelasi, tetapi juga dapat hanya dinyatakan dalam persentase kesepakatan.

C. Reliabilitas dan Validitas (Saifuddin Azwar) 1. Validitas (halaman 45 - 53)

a. Validitas Isi Merupakan validitas yang diestimasi lewat pengujian terhadap isi tes dengan analisis rasional atau lewat professional judgement. Pertanyaan yang dicari jawabannya dalam validasi ini adalah sejauhmana aitemaitem dalam tes mencakup keseluruhan kawasan isi (dengan catatan tidak keluar dari batasan tujuan ukur) objek yang hendak diukur atau sejauhmana isi tes mencerminkan ciri atribut yang hendak diukur. Selanjutnya validitas isi terbagi menjadi 2 (dua), yaitu : 1) Validitas muka (face validity) Tipe validitas yang paling rendah signifikansinya karena hanya didasarkan pada penilaian terhadap format penampilan (appearance) tes. Apabila penampilan tes telah meyakinkan dan memberikan kesan mampu mengungkap apa yang hendak diukur maka dapat dikatakan bahwa validitas muka telah terpenuhi. 2) Validitas logik (logical/sampling validity) Validitas ini menunjuk pada sejauh mana isi tes merupakan representasi dari ciri-ciri atribut yang hendak diukur. Untuk memperoleh validitas logik yang tinggi, suatu tes harus dirancang sedemikian rupa sehingga benar-benar berisi hanya aitem yang relevan dan perlu menjadi bagian tes secara keseluruhan. Penggunaan blueprint sangat membantu tercapainya validitas logik. b. Validitas Konstrak

Adalah tipe validitas yang menunjukkan sejauh mana tes mengungkap suatu trait atau konstrak teoritik yang hendak diukurnya (Allen & Yen, 1979). Pengujian validitas konstrak merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur. Hasil estimasi validitas konstrak tidak dinyatakan dalam bentuk suatu koefisien validitas. Dukungan terhadap adanya validitas konstrak, menurut Magnusson, dapat dicapai melalui beberapa cara antara lain : 1) Studi mengenai perbedaan diantara kelompok-kelompok yang menurut teori harus berbeda Apabila teori mengatakan bahwa antara suatu kelompok dengan kelompok lainnya harus memiliki skor yang berbeda. 2) Studi mengenai pengaruh perubahan yang terjadi dalam diri individu dan lingkungannya terhadap hasil tes Apabila teori mengatakan bahwa hasil tes dipengaruhi oleh kondisi subjek dikarenakan faktor kematangan. 3) Studi mengenai korelasi diantara berbagai variabel yang menurut teori mengukur aspek yang sama Studi ini dapat diperluas dengan mengikutsertakan korelasi antara berbagai skor tes yang mengukur aspek yang berbeda. 4) Studi mengenai korelasi antaraitem atau antar belahan tes Interkorelasi yang tinggi antarbelahan dari suatu tes dapat dianggap sebagai bukti bahwa tes mengukur satu variabel satuan (unitary variable). c. Validitas Berdasar Kriteria Menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor tes. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor tes atau berupa suatu ukuran lain yang relevan. Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi antara skor tes dengan skor kriteria. Koefisien ini merupakan koefisien validitas bagi tes yang bersangkutan, yaitu r xy, dimana X melambangkan skor tes dan Y melambangkan skor kriteria. Prosedur validasi berdasar kriteria menghasilkan dua macam validitas, yaitu :

1)

Validitas prediktif, sangat penting artinya bila tes dimaksudkan untuk berfungsi sebagai prediktor bagi performansi diwaktu yang akan datang.

2)

Validitas konkruen, apabila skor tes dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkruen.

2. Reliabilitas (halaman 36 43) a. Pendekatan Tes Ulang (test-retest) Dilakukan dengan menyajikan tes dua kali pada satu kelompok subjek dengan tenggang waktu diantara kedua penyajian tersebut. Asumsi yang menjadi dasar dalam cara ini adalah bahwa suatu tes yang reliabel tentu akan menghasilkan skor~tampak yang relatif sama apabila dikenakan dua kali pada waktu yang berbeda. b. Pendekatan Bentuk Paralel Tes yang akan diestimasi reliabilitasnya harus ada paralelnya, yaitu tes lain yang sama tujuan ukurnya dan setara isi aitemnya baik secara kualitas maupun kuantitasnya. Dengan bahasa sederhana dapat dikatakan bahwa kita harus punya dua tes yang kembar. Sebenarnya, dua tes yang paralel hanya ada secara teoritik, tidak benar-benar paralel secara empirik. Untuk membuat dua tes menjadi paralel, penyusunannya haruslah didasarkan pada satu spesifikasi yang sama. Secara empirik, kemudian dua tes yang paralel itu haruslah menghasilkan mean skor dan varians yang setara dan korelasi yang juga tidak berbeda dengan suatu variabel ketiga. Hanya itulah bukti terpenuhinya sifat paralel antara dua tes yang dapat diperoleh dalam penyusunan tes. Untuk membuktikan bahwa kedua tes menghasilkan dua skor murni yang sama bagi setiap subjek serta memberikan dua varians eror yang sama sebagaimana dituntut oleh teori skor murni klasikal, tidaklah dapat dilakukan. c. Pendekatan Konsistensi Internal Dilakukan dengan menggunakan satu bentuk tes yang dikenakan hanya sekali saja pada sekelompok subjek (single trial administration). Dengan menyajikan satu tes hanya satu kali, maka problem yang mungkin timbul pada dua pendekatan reliabilitas terdahulu dapat dihindari.

Pendekatan reliabilitas konsistensi internal bertujuan melihat konsistensi antaraitem atau antarbagian dalam tes itu sendiri. Untuk itu, setelah skor setiap aitem diperoleh dari sekelompok subjek, tes dibagi menjadi beberapa belahan. Untuk melihat kecocokan atau konkordansi diantara belahan-belahan tes dilakukan komputasi statistik melalui teknik-teknik korelasi, analisis varians antarbelahan, analisis varians perbedaan skor, dan lainlainnya. D. Psychological Testing (Anne Anastasi dan Susana Urbina) 1. Validitas (halaman 86 101)

a. Prosedur Deskripsi-Isi Pada dasarnya melibatkan pengujian sistematik atas isi tes untuk menetukan apakah tes itu mencakup sampel representatif dari domain perilaku yang harus diukur. Validitas isi janganlah dikacaukan dengan validitas nominal (face validity). Validitas nominal bukanlah validitas dalam pengertian teknis; validitas ini merujuk pada apa yang nampaknya diukur. Validitas nominal berhubungan dengan apakah tes itu kelihatan valid bagi peserta tes yang mengikutinya. Validitas nominal kerap kali dapat diperbaiki dengan merumuskan kembali butir-butir soal tes dalam istilah-istilah yang nampak relevan dan masuk akal dalam lingkungan tertentu dimana tes-tes itu akan digunakan. b. Prosedur Prediksi Kriteria Prosedur validasi prediksi kriteria menunjukkan efektivitas sebuah tes untuk memprediksi kinerja seseorang dalam aktivitas-aktivitas tertentu. Ukuran kriteria yang menjadi tolak ukur validasi skor-skor tes divalidasikan bisa diperoleh pada saat yang hampir sama dengan pemberi skor tes atau setelah suatu interval ditetapkan. Validitas prediksi kriteria kerapkali digunakan dalam studi-studi validasi lokal, yang padanya efektivitas sebuah tes untuk program tertentu harus dinilai. Validitas prediksi kriteria bisa dicirikan sebagai validitas praktis sebuah tes untuk maksud tertentu. c. Prosedur Identifikasi Konstruk

Validitas konstruk suatu tes adalah lingkup sejauhmana tes bisa dikatakan mengukur suatu konstruk atau sifat yang teoritis. Tiap konstruk dikembangkan untuk menjelaskan dan mengorganisir konsistensikonsistensi respons yang teramati. Konstruk-konstruk tersebut berasal dari hubungan-hubungan tetap antara ukuran-ukuran perilaku. Validasi konstruk membutuhkan akumulasi informasi secara bertahap dari berbagai sumber. 2. Reliabilitas (halaman 63 74) Reliabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika mereka diujiulang dengan tes yang sama pada kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau di bawah kondisi pengujian yang berbeda. a. Reliabilitas Tes Retes Metode paling jelas untuk menemukan reliabilitas skor tes adalah dengan mengulang tes yang sama pada kesempatan kedua. Reliabilitas tes ulang menunjukkan sejauh mana skor pada tes dapat digeneralisasikan untuk berbagai kesempatan yang berbeda; makin tinggi reliabilitasnya, makin rentanlah skor terhadap perubahan sehari-hari yang acak dalam kondisi peserta tes atau lingkungan testing. b. Reliabilitas Bentuk Alternatif Satu cara untuk menghindari kesulitan yang ditemukan dalam reliabilitas tes dan tes ulang adalah melalui penggunaan bentuk-bentuk tes lainnya. Dengan demikian, orang yang sama bisa ditest dengan satu bentuk pada kesempatan pertama dan dengan bentuk lainnya yang ekuivalen pada kesempatan kedua. Korelasi antara skor-skor yang didapatkan pada dua bentuk itu merupakan koefisien reliabilitas tes. Perlu dicatat bahwa koefisien reliabilitas semacam itu adalah ukuran stabilitas temporal dan konsistensi respons terhadap berbagai butir soal contoh (atau bentuk-bentuk tes). c. Reliabilitas Belah Separuh (Split-Half Reliability) Dengan cara ini, dua skor didapatkan untuk setiap orang dengan membagi tes menjadi paruhanparuhan yang ekuivalen. Jenis reliabilitas ini kadangkala disebut koefisien konsistensi internal, karena hanya dibutuhkan penyelenggaraan tunggal atas satu bentuk tes saja. Untuk mendapatkan reliabilitas belah-separuh, masalah pertamanya adalah bagaimana membagi tes dalam rangka mendapatkan paruhan-paruhan yang paling ekuivalen.

Efek yang akan dihasilkan pada koefisiennya dengan memperpanjang atau memperpendek sebuah tes, dapat diperkirakan dengan rumus Spearman-Brown, seperti berikut : rnn = nrtt

1 + (n 1)rtt

rnn rtt n

: koefisien yang diperkirakan : koefisien yang diperoleh : jumlah waktu tes diperpanjang/diperpendek

Ketika diterapkan pada reliabilitas belah separuh, rumus ini selalu melibatkan penggandaan panjang tes. Dalam kondisi ini, rumus itu dapat disederhanakan sebagai berikut : rtt = 2rhh 1 + rhh

Untuk rhh adalah korelasi dari tes-tes paruhan Metode alternatif untuk mendapatkan reliabilitas belah separuh dikembangkan oleh Rulon (1939). Hanya dibutuhkan varians dari perbedaan antara skor-skor tiap orang pada dua tes-tes separuh (SDx2) dan varians skor total (SDd2) dua nilai ini disubstitusikan dalm rumus berikut, yang menghasilkan reliabilitas seluruh tes secara langsung : rtt = SDx2

SDd2 1 Menarik untuk memperhatikan hubungan rumus ini

dengan varians kesalahan. Perbedaan apapun antara skor-skor seseorang pada dua tes paruhan

menampilkan varians kesalahan atau varians yang tidak relevan. Varians-varians perbedaan-perbedaan ini, dibagi dengan varians skor-skor total, memberikan proporsi varians kesalahan dalam skor-skor itu. Ketika varians skor ini dikurangkan dari 1,00, hasilnya adalah proporsi varians benar untuk penggunaan tes tertentu, yang sama dengan koefisien reliabilitas. d. Reliabilitas Kuder-Richardson dan Koefisien Alpha Metode ini didasarkan pada konsistensi respons terhadap semua butir soal dalam tes. Konsistensi antar soal ini dipengaruhi oleh dua sumber varians kesalahan : (1) pencuplikan isi (sebagaimana dalam bentuk alternatif dan reliabilitas belah separuh) ; dan (2) heterogenitas dari domain yang disampelkan. Semakin homogen domainnya, semakin tinggilah konsistensi antar soal. Dari berbagai rumus yang diturunkan dalam artikel aslinya, rumus yang paling luas diterapkan, umumnya dikenal sebagai rumus 20 Kuder-Richardson, adalah sebagai berikut : rtt = n n1 SD t2 pq SD t2 rtt n SDt p q : proporsi orang-orang yang tidak lulus : koefisien reliabilitas seluruh tes : jumlah soal dalam tes : simpangan baku skor-skor total tes : proporsi orang-orang yang lulus

pq

: hasil tabulasi antara p dan q Rumus Kuder-Richardson dapat diterapkan pada tes-tes yang soal-soalnya diskor benar atau salah,

atau tergantung pada suatu sistem all or none (semua atau tidak sama sekali) lainnya. e. Reliabilitas Pemberi Skor Reliabilitas pemberi skor dapat ditentukan dengan memiliki sampel lembaran tes yang diskor secara terpisah oleh dua penguji. Dengan demikian dua skor yang didapatkan oleh masing-masing peserta tes ini kemudian dikorelasikan dengan cara biasa, dan koefisien korelasi yang dihasilkannya adalah ukuran reliabilitas pemberi skor. Jenis reliabilitas ini umumnya dihitung ketika instrumen-instrumen yang diskor secara subjektif digunakan dalam riset. http://lussysf.multiply.com/journal/item/137

You might also like