Professional Documents
Culture Documents
PENGUKURAN
SEJARAH: 4 GENERASI
PEMAHAMAN
PRA – 1930
• Woody and others (1935): “curricular validity” (usually measured by a panel of curriculum
experts. It's not measured statistically, but rather by a rating of “valid” or “not valid
• Cronbach (1949): “empirical validity”, “logical validity”, “factorial validity”, dan “curricular
validity”
1954 - 1984
Jenis validitas sesuai tujuan tes:
1. To determine how an individual would perform Content validity
at present in a given universe of situations
2. To predict an individual’s future performance
Predictive validity
on an external variable
3. To estimate an individual’s present status on
an external variable Concurrent validity
3 c:
1. Content-related evidence of validity
2. Criterion-related evidence of validity
3. Construct-related evidence of validity
1999 -
“Modern theory of validity”
• Tidak mengenal jenis-jenis validitas yang berbeda antara satu dengan yang
lainnya
TEORI TERBARU
(1999/2014)
DEFINISI VALIDITAS
Interview
Interpretasi/
Construct Asesmen
Alat Ukur Hasil/Skor
Penggunaan
Validitas
Evidence Evidence
based on the based on
Consequenc Response
es of Testing Processes
Validitas
Evidence
based on Evidence
Relations Based on
Internal
to Other Structure
Variables (Test Standards, 1999)
Evidence
Content validity based on Test
Content
Evidence Evidence
Validitas
Concurrent validity
Evidence
based on Evidence
Based on
Construct validity
Relations to
Other Internal
Variables Structure
PERUBAHAN 2014
Evidence based
on Test Content
Validitas
Evidence based
on Relationship
Evidence based
with
on Response
conceptually
Processes
related
construct
Evidence Based
on Internal
Structure
• Prosedur:
Logical analysis, dan expert review terhadap
• Representativeness isi tes (test spec/blue print)
• Kesesuaian isi tes dengan definsi construct
• Relevansi, tingkat kepentingan. Clarity, dan bias dari item
EVIDENCE BASED ON COGNITIVE
PROCESSES
• Prosedur:
• Interview
• Observasi
• Thinking aloud protocol
EVIDENCE BASED ON INTERNAL
STRUCTURE
• Prosedur:
• Analisis faktor: confirmatory
• Analisis cluster
• Analisis hubungan antar item
• DIF study
EVIDENCE BASED ON RELATIONSHIP WITH
CONCEPTUALLY RELATED CONSTRUCT
• PENELAHAAN SEJAUH MANA HASIL YANG DIPEROLEH
BERHUBUNGAN DENGAN HASIL LAIN YANG MERUPAKAN
NOMOLOGICAL NETWORK DARI CONSTRUCT YANG DIUKUR.
• PROSEDUR:
• KORELASI DENGAN KRITERIA EKSTERNAL (CONCURRENT MAUPUN
PREDICTIVE)
• ANALISIS PERBEDAAN KELOMPOK
• CONVERGENT AND DISCRIMINANT VALIDITY STUDIES
• MTMM
• STUDI-STUDI EKSPERIMENTAL MAUPUN KORELASIONAL BERDASARKAN
NOMOLOGICAL NETWORK CONSTRUCT YANG DIUKUR
EVIDENCE BASED ON RELATIONSHIP WITH
CRITERIA
• Penelahaan sejauh mana skor yang diperoleh berhubungan atau
tidak berhubungan dengan skor lain yang dipergunakan sebagai
kriteria.
• Prosedur:
• Korelasi dengan kriteria eksternal (concurrent maupun
predictive)
• Analisis perbedaan kelompok
• Convergent and discriminant validity studies
• MTMM (Multitrait Multimethod)
• Studi-studi eksperimental maupun korelasional berdasarkan
nomological network construct yang diukur
FAKTOR-FAKTOR YANG MEMPENGARUHI
VALIDITAS
• Construct underrepresentation
• Construct irrelevance
UNIFIED APPROACH
☼
BAGAIMANA HUBUNGAN ANTARA VALIDITAS DAN RELIABILITAS?
• Validitas
mempermasalahkan kesesuaian
antara konsep dan kenyataan empiris
• Reliabilitas
kesesuaian hasil-hasil pengukuran di
tingkat kenyataan empiris
• Karena itu valid pasti reliable, tapi tidak sebaliknya
Reliabilitas pada teori tes klasik
• Metode pengujian ini dilakukan dengan menggunakan satu form tes dengan 2 kali sesi
pengujian. Hasil pengujian dari kedua tes tersebut nantinya akan menghasilkan 2
distribusi skor tes yaitu skor tes dari sesi pengujian yang pertama dan skor tes dari tes
yang sama namun dari sesi pengujian yang kedua. Koefisien reliabilitas diperoleh
dengan cara melakukan perhitungan korelasi antar kedua distribusi skor tersebut,
• Kendala yang dihadapi adalah bagaimana menentukan interval waktu yang pas antara
tes pertama dan kedua, sehingga tidak terjadi carry over effect (efek bawaan) yang
mempengaruhi besaran koefisien yang dihasilkan.
PARALLEL-FORM
• Di buku referensi dasar psikometri seperti allen & yen (1979) dan crocker &
algina (1986) ditulis mengenai reliabilitas butir (item reliability).
• Reliabilitas aitem didapatkan dari perkalian antara deviasi standar aitem dan
Korelasi biserial aitem dengan total. Semakin banyak aitem yang memiliki
indeks Reliabilitas aitem yang tinggi, semakin tinggi nilai reliabilitas
keseluruhan aitem. Yang dihasilkan (misalnya ditunjukkan melalui koefisien
alpha).
• Jika alpha > 0,90 maka reliabilitas sempurna
• Jika alpha antara 0,70 – 0,90 maka reliabilitas tinggi
• Jika alpha antara 0,50 – 0,70 maka reliabilitas moderat
• Jika alpha < 0,50 maka reliabilitas rendah
NB: Cronbach's alpha tergantung pada asumsi bahwa masing-masing variabel indikator
memberikan kontribusi yang sama terhadap faktor, yaitu, semua pemuatan (yang tidak
standar) harus sama (tau-ekivalen). Jika asumsi ini dilanggar, keandalan yang sebenarnya
akan diremehkan. Cronbach's alpha tidak melibatkan asumsi seperti unidimensionality.
Asumsi kedua untuk alpha adalah bahwa varian kesalahan indikator harus tidak
berkorelasi. Dengan kata lain, satu faktor harus menjelaskan semua varian umum dari
indikator. Jika ini tidak terjadi, alpha akan melebih-lebihkan keandalan.