You are on page 1of 10

Tugasan 2: Kesahan

1.0 Pengenalan

Kesahan merupakan istilah yang biasa ditemui dalam pelbagai disiplin ilmu. Dalam bidang

pengukuran, kesahan ditakrifkan sebagai penilaian terhadap sejauh mana ujian atau

instrumen dapat mengukur apa yang sepatutnya diukur (Gregory, 2015). Bagi Devellis

(2017) pula, kesahan merujuk kepada sejauh mana instrumen dapat membuat kesimpulan

daripada skala yang dibina, keupayaan untuk meramal situasi atau menjelaskan hubungan

antara konstruk. Skor yang diperoleh daripada hasil penilaian kesahan akan membolehkan

inferens dibuat terhadap ujian yang telah dilaksanakan atau instrumen yang dibina

(Mehrens & Lehmann, 1991; Cohen et al., 2013). Antara tujuan lain kesahan dilakukan

ialah untuk mengumpul bukti bagi menyokong inferens yang dibuat berdasarkan skor yang

diperoleh daripada instrumen (Cronbach, 1971; Crocker & Algina, 2008) hasil maklum

balas responden. Secara ringkasnya, penilaian yang dibuat bagi mendapatkan kesahan

sesuatu alat ukur atau instrumen dapat memastikan alat ukur atau instrumen yang dibina

benar-benar mengandungi konstruk yang hendak diukur secara tepat dan seterusnya

membuktikan instrumen tersebut memiliki darjah kesahan yang baik.

2.0 Konsep dan Jenis Kesahan

Konsep kesahan dapat diperjelaskan melalui usaha pengkaji bagi mendapatkan jawapan

kepada soalan kajian yang telah dibina. Dalam mendapatkan jawapan tersebut,

pentadbiran terhadap instrumen dilaksanakan ke atas responden yang telah dikenal pasti

bagi mendapatkan skor instrumen. Ketepatan skor merupakan elemen penting bagi

1
merumuskan skor yang diterima dan seterusnya dapat memberi jawapan kepada soalan

kajian. Ini sejajar dengan konsep kesahan oleh Standards for Educational and

Psychological Testing (AERA, APA, & NCME, 1999, 2014) yang mana kesahan

menunjukkan bukti dan teori yang menyokong secara khusus interpretasi skor yang

digunakan sebagaimana cadangan penggunaan instrumen tersebut. Dalam konteks

pengesahan instrumen, kesahan juga melibatkan proses mengumpul bukti untuk

menyokong inferens yang dibuat (Mehrens et al., 1991). Namun, menurut Crocker et al.

(2008), tidak terdapat persetujuan yang mutlak berkaitan cara kesahan dikonsepsikan dan

isu berkenaan jenis bukti kesahan mana yang paling tepat untuk menjelaskan interpretasi

skor instrumen masih samar. Malah, pengkategorian kesahan mempunyai pelbagai versi

mengikut pandangan pakar yang berbeza.

Sebagai contoh, Cohen et al. (2013) mengkategorikan kesahan kepada empat jenis

iaitu kesahan muka, kesahan kandungan, kesahan konstruk dan kesahan kriteria seperti

yang digambarkan menerusi Rajah 1. Cohen et al. (2013) berpendapat, kesahan konstruk

merupakan kategori yang paling utama dan mendasari jenis-jenis kesahan yang lain. Ini

bermaksud, bukti kesahan konstruk akan menjadi asas dalam mendapatkan bukti kesahan

lain.

Kesahan

Kesahan
Kesahan Muka Kesahan Kriteria Kesahan Konstruk
Kandungan

Rajah 1: Jenis kesahan menurut Cohen et al. (2013)

2
Seterusnya, Borgatti (2012) mengkategorikan kesahan kepada dua jenis iaitu

kesahan konstruk dan kesahan inferens. Kesahan konstruk dibahagikan pula kepada

kesahan terjemahan dan kesahan kriteria. Kesahan terjemahan seterusnya dikategorikan

pula kepada dua kategori iaitu kesahan muka dan kesahan kandungan manakala kesahan

kriteria pula dibahagikan kepada empat jenis kesahan iaitu kesahan ramalan, kesahan

serentak, kesahan konvergen dan kesahan diskriminan. Sementara itu, kesahan inferens

dikategorikan kepada dua jenis merangkumi kesahan dalaman dan kesahan luaran. Rajah

2 memberikan gambaran tentang jenis-jenis kesahan menurut Borgatti (2012).

Kesahan
C r o c k e r e t
Kesahan Kesahan Inferens
Konstruk

Kesahan Kesahan
Terjemahan Kesahan Kriteria Dalaman

Kesahan Muka Kesahan Ramalan Kesahan


Luaran
Kesahan Kesahan Serentak
Kandungan

Kesahan Konvergen

Kesahan Diskriminan

Rajah 2: Jenis kesahan menurut Borgatti (2012)


inferens yang diinginkan perlu dikenal pasti dengan jelas sebelum kajian empirikal

dilaksanakan untuk mengumpul bukti mengenai kegunaan skor bagi menyokong inferens

yang telah dikenal pasti. Crocker et al. (2008) menyatakan terdapat tiga jenis kesahan

utama iaitu kesahan kandungan, kesahan kriteria dan kesahan konstruk. Konsep kesahan

Crocker et al. (2008) ini juga dikonsepsikan sebagai satu proses untuk memeriksa

sumbangan komponen tertentu bagi penyatuan konstruk. Justeru, kesahan kriteria,

3
kesahan kandungan dan kesahan konstruk memainkan peranan penting dalam penyatuan

konsep kesahan.

Kesahan

Kesahan Kesahan Kesahan


Kandungan Kriteria Konstruk

Rajah 3: Jenis kesahan menurut Crocker et al. (2008) dan Devellis (2017)

Sama seperti Crocker et al. (2008), Devellis (2017) juga membahagikan kesahan

kepada tiga kategori utama berdasarkan tiga intipati definisi kesahannya. Intipati pertama

merujuk kepada kesahan kandungan iaitu kesimpulan yang diperoleh daripada cara skala

dibina. Intipati kedua merujuk kepada kesahan kriteria berdasarkan keupayaan meramal

situasi tertentu dan intipati terakhir merujuk kepada kesahan konstruk bagi melihat

hubungan antara konstruk.

3.0 Definisi dan Konsep Setiap Jenis Kesahan

Biarpun sarjana terdahulu memberi pandangan yang berbeza tentang jenis kesahan,

definisi dan konsep setiap jenis kesahan masih dalam konteks yang sama sebagaimana

perincian berikut:

3.1 Kesahan Kandungan

4
Secara umumnya, kesahan kandungan merujuk kepada sejauh mana instrumen yang

dibina mewakili aspek yang ingin diukur. Ini bertujuan untuk memastikan setiap item benar-

benar mewakili aspek yang hendak diukur. Menurut Devellis (2017), kesahan kandungan

memberi tumpuan terhadap pensampelan item bagi mengenal pasti sejauh mana item

menggambarkan kandungan domain dengan tepat. Kesahan kandungan perlu dilakukan

oleh individu yang mempunyai kepakaran dalam bidang yang dikaji.

Sebagai contoh, dalam memastikan kesahan kandungan bagi instrumen berkaitan

efikasi kendiri, pakar akan memeriksa sama ada item efikasi menepati konstruk atau tidak.

Secara umumnya, item bagi instrumen berkaitan efikasi kendiri mesti diungkap dengan

ungkapan “boleh lakukan” dan bukannya “akan lakukan”. Ini kerana, efikasi kendiri merujuk

kepada keupayaan untuk melaksanakan tindakan. Sebelum kesahan kandungan

dilaksanakan oleh pakar, satu jadual spesifikasi instrumen yang menjelaskan definisi

konseptual konstruk dan juga padanan item dengan senarai objektif perlu disediakan

terlebih dahulu. Ini untuk memudahkan pakar melaksanakan penilaian dan mengelakkan

daripada tersilap tafsir.

3.2 Kesahan Kriteria

Kesahan kriteria melibatkan hubungan atau korelasi antara skor ujian dengan skor lain

yang mewakili kriteria yang telah dikenal pasti. Kesahan kriteria dilaksanakan dengan cara

membandingkan skor instrumen yang baru dibina dengan instrumen lain yang sudah

dikenal pasti mempunyai ukuran sifat atau kemahiran yang sama. Berdasarkan pandangan

Cohen et al. (2013) dan Devellis (2017), kesahan kriteria terbahagi kepada dua kategori

iaitu kesahan serentak dan kesahan jangkaan.

5
Kesahan serentak merujuk kepada sejauh mana instrumen yang baru dibina

mempunyai hubungan dengan kriteria pada instrumen sedia ada yang diukur secara

serentak pada masa yang sama (Devellis, 2017; Cohen et al., 2013). Jika kriteria yang ada

pada instrumen baharu mempunyai korelasi yang baik dengan kriteria instrumen sedia ada

maka, kriteria instrumen baharu tersebut dikatakan memiliki kesahan serentak (Coaley,

2010).

Kesahan jangkaan pula bertujuan untuk menentukan sejauh mana instrumen dapat

meramalkan skor pada kriteria yang diukur (Coaley, 2010; Cohen et al., 2013). Ukuran

jangkaan atau yang diramalkan tersebut harus mempunyai kaitan dengan tingkah laku atau

situasi akan datang (Devellis, 2017). Namun begitu, timbul masalah berkaitan kesahan

jangkaan yang mana jarak masa antara pengukuran pertama dengan pengukuran prestasi

jangkaan boleh dipengaruhi oleh faktor lain seperti kematangan dan pengalaman.

3.3 Kesahan Konstruk

Kesahan konstruk dilakukan bagi memastikan hubungan antara konstruk dibuktikan secara

empirikal berdasarkan penggunaan yang konsisten dengan teori (Devellis, 2017). Dengan

erti kata lain, kesahan konstruk mempunyai perkaitan dengan konstruk psikologi yang

berkaitan dengan skor instrumen. Konstruk merujuk kepada trait, atribut atau kualiti

psikologi yang merupakan suatu elemen yang tidak dapat diperhatikan secara langsung

tetapi boleh disimpulkan melalui teori psikologi.

Kesahan konstruk dilaksanakan melalui rumusan hipotesis tentang konstruk yang

diramal akan berbeza daripada aspek demografi, prestasi atau ukuran lain yang mana

hubungannya telah disahkan. Hipotesis ini bukanlah dibina berdasarkan logik akal semata

6
tetapi perlu dibina berdasarkan teori yang mendasari konstruk dengan disertakan definisi

sintaksis. Seterusnya, instrumen yang mengandungi item bagi mewakili tingkah laku yang

spesifik dan menggambarkan konstruk dipilih sebelum data empirikal dikumpulkan untuk

menguji hipotesis. Setelah hipotesis diuji, pertimbangan pemilihan item dilakukan bagi

membuat keputusan sama ada untuk mengekalkan atau menghapuskan item berdasarkan

keperluan kajian.

Bagi mendapatkan kesahan konstruk, terdapat beberapa prosedur yang boleh

dilakukan. Sebagai contoh, untuk membuktikan hubungan antara skor ujian kecerdasan

dengan prestasi, prosedur korelasi antara konstruk boleh dilaksanakan. Prosedur ini

dilakukan dengan dua cara iaitu melalui regresi berganda dan melakukan hipotesis ukuran

relatif korelasi untuk ukuran konstruk dan pemboleh ubah. Seterusnya, prosedur

pembezaan kumpulan boleh dilakukan untuk melihat perbezaan skor antara jantina yang

mana jika perbezaan yang dijangkakan tidak wujud, mungkin berlaku kesilapan pada teori

atau kekurangan instrumen untuk mengukur konstruk atau kegagalan rawatan (bagi kajian

eksperimen).

Terdapat dua lagi prosedur dalam pelaksanaan kesahan konstruk iaitu prosedur

analisis faktor dan prosedur matriks kepelbagaian trait dan kaedah (multitrait-multimethod

matrix). Prosedur analisis faktor dilakukan untuk mengenal pasti beberapa bilangan

pemboleh ubah melalui matrix of item intercorrelations dan correlation matrix. Prosedur

matriks kepelbagaian trait dan kaedah pula dilakukan untuk menentukan dua cara atau

lebih untuk mengukur konstruk dan mengenal pasti konstruk lain yang berbeza tetapi boleh

diukur melalui kaedah sama yang digunakan untuk konstruk. Prosedur analisis faktor dan

prosedur matriks kepelbagaian trait dan kaedah ini digunakan oleh Gibson dan Dembo

(1984) dalam validasi instrumen Skala Efikasi Kendiri Guru yang dibina oleh mereka.

7
Menurut Cohen et al. (2013), penilaian kesahan konstruk akan dapat dijelaskan

dalam tiga jenis bukti kesahan konstruk merangkumi bukti kehomogenan, bukti konvergen

dan bukti diskriminan. Bukti kehomogenan merujuk kepada sejauh mana item-item dalam

instrumen dapat mengukur satu konstruk tunggal (Gregory, 2015). Bukti kehomogenan

dapat diperoleh melalui kaedah analisis korelasi antara item dengan jumlah skor item

dalam satu konstruk atau subkonstruk (Cohen et al., 2013).

Bukti konvergen pula bertujuan untuk melihat sejauh mana instrumen berkorelasi

secara positif dengan instrumen lain dalam mengukur konstruk yang sama. Ini bagi

menunjukkan pemboleh ubah atau instrumen berkongsi ciri-ciri konstruk yang sama

(Gregory, 2015). Bukti konvergen diperoleh melalui dua kaedah iaitu pemeriksaan

pemuatan faktor dan purata varians yang diekstrakkan (AVE). Bukti terakhir iaitu bukti

diskriminan dapat dibuktikan apabila satu instrumen tidak berkorelasi dengan pemboleh

ubah atau instrumen yang tidak berkongsi ciri-ciri konstruk yang sama (Gregory, 2015).

Untuk mendapatkan bukti diskriminan, dua kaedah boleh digunakan iaitu analisis faktor

penerokaan dan analisis faktor pengesahan.

3.4 Kesahan Muka

Kesahan muka merujuk kepada penilaian yang dilakukan untuk memeriksa format,

kejelasan makna item, laras bahasa, saiz tulisan, arahan, ejaan dan kesesuaian item

dengan objektif kajian. Kesahan muka dapat dipertingkatkan dengan menjadikan item-item

dalam instrumen sentiasa relevan dan munasabah dengan situasi penggunaannya

(Anastasi, 1985). Kesahan muka boleh dilakukan oleh mana-mana individu walaupun tidak

memiliki kepakaran dalam bidang yang dikaji. Oleh sebab kesahan muka boleh

8
dilaksanakan oleh sesiapa sahaja, kesahan muka dilihat tidak mempunyai kepentingan

berbanding kesahan kandungan dan kesahan-kesahan lain.

4.0 Rumusan

Secara ringkasnya, biarpun sarjana berselisih pendapat tentang jenis-jenis kesahan namun

mereka sebenarnya sepakat menyatakan terdapat empat kesahan utama iaitu kesahan

muka, kesahan kandungan, kesahan kriteria dan kesahan konstruk. Kesahan muka tidak

diberi perhatian oleh kebanyakan sarjana terdahulu kerana hanya melibatkan ulasan umum

tentang kualiti item dan dinilai oleh siapa sahaja walaupun tanpa memiliki latihan formal

dalam bidang yang dikaji. Ini berbeza dengan kesahan kandungan yang mana kualiti item

perlu diulas oleh pakar yang mempunyai kepakaran dalam aspek yang ingin dikaji.

Kesahan kriteria pula yang dibahagikan kepada kesahan serentak dan kesahan jangkaan

lebih memberi tumpuan kepada korelasi dengan ukuran gold standard dan kemampuan

instrumen membuat jangkaan terhadap pemerhatian masa depan. Manakala, jenis kesahan

terakhir iaitu kesahan konstruk pula lebih tertumpu kepada ukuran secara teori tentang

kepentingan instrumen berdasarkan penyelidikan lepas.

Rujukan

Anastasi, A. 1985. Psychological Testing. Ed. Ke-5. New York: MacMillan Publishing
Co Inc.

9
Coaley, K. 2010. An introduction to psychological assessment and psychometrics. Ed. ke-2.
London: SAGE Publications Inc.

Cohen, R. J., Swerdlik, M. E. & Sturman, E. D. 2013. Psychological testing and


assessment: an introduction to test and measurement. Ed. ke-8. New York:
McGraw-Hill.

Crocker, L. & Algina, J. 2008. Introduction to classical & modern test theory. Ohio :
Cengage Learning.

Cronbach, L. J. 1951. Coefficient alpha and the internal structure of tests. Psychometrika,
16(3): 297–334.

DeVellis, R. . (2017). Scale development : theory and applications (4th ed.). SAGE
Publications Inc.

Gregory, R. J. 2015. Psychological testing: history, principles, and applications. Ed. ke-6.
Boston, MA: Pearson Education, Inc.

Mehrens, W. A. & Lehmann, I. J. 1991.Measurement and evaluation in education and


psychology. Ed. Ke-4. Belmont CA : Wadsworth/Thomson Learning.

10

You might also like