Professional Documents
Culture Documents
Tugasan 2
Tugasan 2
1.0 Pengenalan
Kesahan merupakan istilah yang biasa ditemui dalam pelbagai disiplin ilmu. Dalam bidang
pengukuran, kesahan ditakrifkan sebagai penilaian terhadap sejauh mana ujian atau
instrumen dapat mengukur apa yang sepatutnya diukur (Gregory, 2015). Bagi Devellis
(2017) pula, kesahan merujuk kepada sejauh mana instrumen dapat membuat kesimpulan
daripada skala yang dibina, keupayaan untuk meramal situasi atau menjelaskan hubungan
antara konstruk. Skor yang diperoleh daripada hasil penilaian kesahan akan membolehkan
inferens dibuat terhadap ujian yang telah dilaksanakan atau instrumen yang dibina
(Mehrens & Lehmann, 1991; Cohen et al., 2013). Antara tujuan lain kesahan dilakukan
ialah untuk mengumpul bukti bagi menyokong inferens yang dibuat berdasarkan skor yang
diperoleh daripada instrumen (Cronbach, 1971; Crocker & Algina, 2008) hasil maklum
balas responden. Secara ringkasnya, penilaian yang dibuat bagi mendapatkan kesahan
sesuatu alat ukur atau instrumen dapat memastikan alat ukur atau instrumen yang dibina
benar-benar mengandungi konstruk yang hendak diukur secara tepat dan seterusnya
Konsep kesahan dapat diperjelaskan melalui usaha pengkaji bagi mendapatkan jawapan
kepada soalan kajian yang telah dibina. Dalam mendapatkan jawapan tersebut,
pentadbiran terhadap instrumen dilaksanakan ke atas responden yang telah dikenal pasti
bagi mendapatkan skor instrumen. Ketepatan skor merupakan elemen penting bagi
1
merumuskan skor yang diterima dan seterusnya dapat memberi jawapan kepada soalan
kajian. Ini sejajar dengan konsep kesahan oleh Standards for Educational and
Psychological Testing (AERA, APA, & NCME, 1999, 2014) yang mana kesahan
menunjukkan bukti dan teori yang menyokong secara khusus interpretasi skor yang
menyokong inferens yang dibuat (Mehrens et al., 1991). Namun, menurut Crocker et al.
(2008), tidak terdapat persetujuan yang mutlak berkaitan cara kesahan dikonsepsikan dan
isu berkenaan jenis bukti kesahan mana yang paling tepat untuk menjelaskan interpretasi
skor instrumen masih samar. Malah, pengkategorian kesahan mempunyai pelbagai versi
Sebagai contoh, Cohen et al. (2013) mengkategorikan kesahan kepada empat jenis
iaitu kesahan muka, kesahan kandungan, kesahan konstruk dan kesahan kriteria seperti
yang digambarkan menerusi Rajah 1. Cohen et al. (2013) berpendapat, kesahan konstruk
merupakan kategori yang paling utama dan mendasari jenis-jenis kesahan yang lain. Ini
bermaksud, bukti kesahan konstruk akan menjadi asas dalam mendapatkan bukti kesahan
lain.
Kesahan
Kesahan
Kesahan Muka Kesahan Kriteria Kesahan Konstruk
Kandungan
2
Seterusnya, Borgatti (2012) mengkategorikan kesahan kepada dua jenis iaitu
kesahan konstruk dan kesahan inferens. Kesahan konstruk dibahagikan pula kepada
pula kepada dua kategori iaitu kesahan muka dan kesahan kandungan manakala kesahan
kriteria pula dibahagikan kepada empat jenis kesahan iaitu kesahan ramalan, kesahan
serentak, kesahan konvergen dan kesahan diskriminan. Sementara itu, kesahan inferens
dikategorikan kepada dua jenis merangkumi kesahan dalaman dan kesahan luaran. Rajah
Kesahan
C r o c k e r e t
Kesahan Kesahan Inferens
Konstruk
Kesahan Kesahan
Terjemahan Kesahan Kriteria Dalaman
Kesahan Konvergen
Kesahan Diskriminan
dilaksanakan untuk mengumpul bukti mengenai kegunaan skor bagi menyokong inferens
yang telah dikenal pasti. Crocker et al. (2008) menyatakan terdapat tiga jenis kesahan
utama iaitu kesahan kandungan, kesahan kriteria dan kesahan konstruk. Konsep kesahan
Crocker et al. (2008) ini juga dikonsepsikan sebagai satu proses untuk memeriksa
3
kesahan kandungan dan kesahan konstruk memainkan peranan penting dalam penyatuan
konsep kesahan.
Kesahan
Rajah 3: Jenis kesahan menurut Crocker et al. (2008) dan Devellis (2017)
Sama seperti Crocker et al. (2008), Devellis (2017) juga membahagikan kesahan
kepada tiga kategori utama berdasarkan tiga intipati definisi kesahannya. Intipati pertama
merujuk kepada kesahan kandungan iaitu kesimpulan yang diperoleh daripada cara skala
dibina. Intipati kedua merujuk kepada kesahan kriteria berdasarkan keupayaan meramal
situasi tertentu dan intipati terakhir merujuk kepada kesahan konstruk bagi melihat
Biarpun sarjana terdahulu memberi pandangan yang berbeza tentang jenis kesahan,
definisi dan konsep setiap jenis kesahan masih dalam konteks yang sama sebagaimana
perincian berikut:
4
Secara umumnya, kesahan kandungan merujuk kepada sejauh mana instrumen yang
dibina mewakili aspek yang ingin diukur. Ini bertujuan untuk memastikan setiap item benar-
benar mewakili aspek yang hendak diukur. Menurut Devellis (2017), kesahan kandungan
memberi tumpuan terhadap pensampelan item bagi mengenal pasti sejauh mana item
efikasi kendiri, pakar akan memeriksa sama ada item efikasi menepati konstruk atau tidak.
Secara umumnya, item bagi instrumen berkaitan efikasi kendiri mesti diungkap dengan
ungkapan “boleh lakukan” dan bukannya “akan lakukan”. Ini kerana, efikasi kendiri merujuk
dilaksanakan oleh pakar, satu jadual spesifikasi instrumen yang menjelaskan definisi
konseptual konstruk dan juga padanan item dengan senarai objektif perlu disediakan
terlebih dahulu. Ini untuk memudahkan pakar melaksanakan penilaian dan mengelakkan
Kesahan kriteria melibatkan hubungan atau korelasi antara skor ujian dengan skor lain
yang mewakili kriteria yang telah dikenal pasti. Kesahan kriteria dilaksanakan dengan cara
membandingkan skor instrumen yang baru dibina dengan instrumen lain yang sudah
dikenal pasti mempunyai ukuran sifat atau kemahiran yang sama. Berdasarkan pandangan
Cohen et al. (2013) dan Devellis (2017), kesahan kriteria terbahagi kepada dua kategori
5
Kesahan serentak merujuk kepada sejauh mana instrumen yang baru dibina
mempunyai hubungan dengan kriteria pada instrumen sedia ada yang diukur secara
serentak pada masa yang sama (Devellis, 2017; Cohen et al., 2013). Jika kriteria yang ada
pada instrumen baharu mempunyai korelasi yang baik dengan kriteria instrumen sedia ada
maka, kriteria instrumen baharu tersebut dikatakan memiliki kesahan serentak (Coaley,
2010).
Kesahan jangkaan pula bertujuan untuk menentukan sejauh mana instrumen dapat
meramalkan skor pada kriteria yang diukur (Coaley, 2010; Cohen et al., 2013). Ukuran
jangkaan atau yang diramalkan tersebut harus mempunyai kaitan dengan tingkah laku atau
situasi akan datang (Devellis, 2017). Namun begitu, timbul masalah berkaitan kesahan
jangkaan yang mana jarak masa antara pengukuran pertama dengan pengukuran prestasi
jangkaan boleh dipengaruhi oleh faktor lain seperti kematangan dan pengalaman.
Kesahan konstruk dilakukan bagi memastikan hubungan antara konstruk dibuktikan secara
empirikal berdasarkan penggunaan yang konsisten dengan teori (Devellis, 2017). Dengan
erti kata lain, kesahan konstruk mempunyai perkaitan dengan konstruk psikologi yang
berkaitan dengan skor instrumen. Konstruk merujuk kepada trait, atribut atau kualiti
psikologi yang merupakan suatu elemen yang tidak dapat diperhatikan secara langsung
diramal akan berbeza daripada aspek demografi, prestasi atau ukuran lain yang mana
hubungannya telah disahkan. Hipotesis ini bukanlah dibina berdasarkan logik akal semata
6
tetapi perlu dibina berdasarkan teori yang mendasari konstruk dengan disertakan definisi
sintaksis. Seterusnya, instrumen yang mengandungi item bagi mewakili tingkah laku yang
spesifik dan menggambarkan konstruk dipilih sebelum data empirikal dikumpulkan untuk
menguji hipotesis. Setelah hipotesis diuji, pertimbangan pemilihan item dilakukan bagi
membuat keputusan sama ada untuk mengekalkan atau menghapuskan item berdasarkan
keperluan kajian.
dilakukan. Sebagai contoh, untuk membuktikan hubungan antara skor ujian kecerdasan
dengan prestasi, prosedur korelasi antara konstruk boleh dilaksanakan. Prosedur ini
dilakukan dengan dua cara iaitu melalui regresi berganda dan melakukan hipotesis ukuran
relatif korelasi untuk ukuran konstruk dan pemboleh ubah. Seterusnya, prosedur
pembezaan kumpulan boleh dilakukan untuk melihat perbezaan skor antara jantina yang
mana jika perbezaan yang dijangkakan tidak wujud, mungkin berlaku kesilapan pada teori
atau kekurangan instrumen untuk mengukur konstruk atau kegagalan rawatan (bagi kajian
eksperimen).
Terdapat dua lagi prosedur dalam pelaksanaan kesahan konstruk iaitu prosedur
analisis faktor dan prosedur matriks kepelbagaian trait dan kaedah (multitrait-multimethod
matrix). Prosedur analisis faktor dilakukan untuk mengenal pasti beberapa bilangan
pemboleh ubah melalui matrix of item intercorrelations dan correlation matrix. Prosedur
matriks kepelbagaian trait dan kaedah pula dilakukan untuk menentukan dua cara atau
lebih untuk mengukur konstruk dan mengenal pasti konstruk lain yang berbeza tetapi boleh
diukur melalui kaedah sama yang digunakan untuk konstruk. Prosedur analisis faktor dan
prosedur matriks kepelbagaian trait dan kaedah ini digunakan oleh Gibson dan Dembo
(1984) dalam validasi instrumen Skala Efikasi Kendiri Guru yang dibina oleh mereka.
7
Menurut Cohen et al. (2013), penilaian kesahan konstruk akan dapat dijelaskan
dalam tiga jenis bukti kesahan konstruk merangkumi bukti kehomogenan, bukti konvergen
dan bukti diskriminan. Bukti kehomogenan merujuk kepada sejauh mana item-item dalam
instrumen dapat mengukur satu konstruk tunggal (Gregory, 2015). Bukti kehomogenan
dapat diperoleh melalui kaedah analisis korelasi antara item dengan jumlah skor item
Bukti konvergen pula bertujuan untuk melihat sejauh mana instrumen berkorelasi
secara positif dengan instrumen lain dalam mengukur konstruk yang sama. Ini bagi
menunjukkan pemboleh ubah atau instrumen berkongsi ciri-ciri konstruk yang sama
(Gregory, 2015). Bukti konvergen diperoleh melalui dua kaedah iaitu pemeriksaan
pemuatan faktor dan purata varians yang diekstrakkan (AVE). Bukti terakhir iaitu bukti
diskriminan dapat dibuktikan apabila satu instrumen tidak berkorelasi dengan pemboleh
ubah atau instrumen yang tidak berkongsi ciri-ciri konstruk yang sama (Gregory, 2015).
Untuk mendapatkan bukti diskriminan, dua kaedah boleh digunakan iaitu analisis faktor
Kesahan muka merujuk kepada penilaian yang dilakukan untuk memeriksa format,
kejelasan makna item, laras bahasa, saiz tulisan, arahan, ejaan dan kesesuaian item
dengan objektif kajian. Kesahan muka dapat dipertingkatkan dengan menjadikan item-item
(Anastasi, 1985). Kesahan muka boleh dilakukan oleh mana-mana individu walaupun tidak
memiliki kepakaran dalam bidang yang dikaji. Oleh sebab kesahan muka boleh
8
dilaksanakan oleh sesiapa sahaja, kesahan muka dilihat tidak mempunyai kepentingan
4.0 Rumusan
Secara ringkasnya, biarpun sarjana berselisih pendapat tentang jenis-jenis kesahan namun
mereka sebenarnya sepakat menyatakan terdapat empat kesahan utama iaitu kesahan
muka, kesahan kandungan, kesahan kriteria dan kesahan konstruk. Kesahan muka tidak
diberi perhatian oleh kebanyakan sarjana terdahulu kerana hanya melibatkan ulasan umum
tentang kualiti item dan dinilai oleh siapa sahaja walaupun tanpa memiliki latihan formal
dalam bidang yang dikaji. Ini berbeza dengan kesahan kandungan yang mana kualiti item
perlu diulas oleh pakar yang mempunyai kepakaran dalam aspek yang ingin dikaji.
Kesahan kriteria pula yang dibahagikan kepada kesahan serentak dan kesahan jangkaan
lebih memberi tumpuan kepada korelasi dengan ukuran gold standard dan kemampuan
instrumen membuat jangkaan terhadap pemerhatian masa depan. Manakala, jenis kesahan
terakhir iaitu kesahan konstruk pula lebih tertumpu kepada ukuran secara teori tentang
Rujukan
Anastasi, A. 1985. Psychological Testing. Ed. Ke-5. New York: MacMillan Publishing
Co Inc.
9
Coaley, K. 2010. An introduction to psychological assessment and psychometrics. Ed. ke-2.
London: SAGE Publications Inc.
Crocker, L. & Algina, J. 2008. Introduction to classical & modern test theory. Ohio :
Cengage Learning.
Cronbach, L. J. 1951. Coefficient alpha and the internal structure of tests. Psychometrika,
16(3): 297–334.
DeVellis, R. . (2017). Scale development : theory and applications (4th ed.). SAGE
Publications Inc.
Gregory, R. J. 2015. Psychological testing: history, principles, and applications. Ed. ke-6.
Boston, MA: Pearson Education, Inc.
10