Tugasan 2

Tugasan 2: Kesahan
1.0 Pengenalan
Kesahan merupakan istilah yang biasa ditemui dalam pelbagai disiplin ilmu. Dalam bidang
pengukuran, kesahan ditakrifkan sebagai penilaian terhadap sejauh mana ujian atau
instrumen dapat mengukur apa yang sepatutnya diukur (Gregory, 2015). Bagi Devellis
(2017) pula, kesahan merujuk kepada sejauh mana instrumen dapat membuat kesimpulan
daripada skala yang dibina, keupayaan untuk meramal situasi atau menjelaskan hubungan
antara konstruk. Skor yang diperoleh daripada hasil penilaian kesahan akan membolehkan
inferens dibuat terhadap ujian yang telah dilaksanakan atau instrumen yang dibina
(Mehrens & Lehmann, 1991; Cohen et al., 2013). Antara tujuan lain kesahan dilakukan
ialah untuk mengumpul bukti bagi menyokong inferens yang dibuat berdasarkan skor yang
diperoleh daripada instrumen (Cronbach, 1971; Crocker & Algina, 2008) hasil maklum
balas responden. Secara ringkasnya, penilaian yang dibuat bagi mendapatkan kesahan
sesuatu alat ukur atau instrumen dapat memastikan alat ukur atau instrumen yang dibina
benar-benar mengandungi konstruk yang hendak diukur secara tepat dan seterusnya
membuktikan instrumen tersebut memiliki darjah kesahan yang baik.
2.0 Konsep dan Jenis Kesahan
Konsep kesahan dapat diperjelaskan melalui usaha pengkaji bagi mendapatkan jawapan
kepada soalan kajian yang telah dibina. Dalam mendapatkan jawapan tersebut,
pentadbiran terhadap instrumen dilaksanakan ke atas responden yang telah dikenal pasti
bagi mendapatkan skor instrumen. Ketepatan skor merupakan elemen penting bagi
1
merumuskan skor yang diterima dan seterusnya dapat memberi jawapan kepada soalan
kajian. Ini sejajar dengan konsep kesahan oleh Standards for Educational and
Psychological Testing (AERA, APA, & NCME, 1999, 2014) yang mana kesahan
menunjukkan bukti dan teori yang menyokong secara khusus interpretasi skor yang
digunakan sebagaimana cadangan penggunaan instrumen tersebut. Dalam konteks
pengesahan instrumen, kesahan juga melibatkan proses mengumpul bukti untuk
menyokong inferens yang dibuat (Mehrens et al., 1991). Namun, menurut Crocker et al.
(2008), tidak terdapat persetujuan yang mutlak berkaitan cara kesahan dikonsepsikan dan
isu berkenaan jenis bukti kesahan mana yang paling tepat untuk menjelaskan interpretasi
skor instrumen masih samar. Malah, pengkategorian kesahan mempunyai pelbagai versi
mengikut pandangan pakar yang berbeza.
Sebagai contoh, Cohen et al. (2013) mengkategorikan kesahan kepada empat jenis
iaitu kesahan muka, kesahan kandungan, kesahan konstruk dan kesahan kriteria seperti
yang digambarkan menerusi Rajah 1. Cohen et al. (2013) berpendapat, kesahan konstruk
merupakan kategori yang paling utama dan mendasari jenis-jenis kesahan yang lain. Ini
bermaksud, bukti kesahan konstruk akan menjadi asas dalam mendapatkan bukti kesahan
lain.
Kesahan
Kesahan
Kesahan Muka Kesahan Kriteria Kesahan Konstruk
Kandungan
Rajah 1: Jenis kesahan menurut Cohen et al. (2013)
2
Seterusnya, Borgatti (2012) mengkategorikan kesahan kepada dua jenis iaitu
kesahan konstruk dan kesahan inferens. Kesahan konstruk dibahagikan pula kepada
kesahan terjemahan dan kesahan kriteria. Kesahan terjemahan seterusnya dikategorikan
pula kepada dua kategori iaitu kesahan muka dan kesahan kandungan manakala kesahan
kriteria pula dibahagikan kepada empat jenis kesahan iaitu kesahan ramalan, kesahan
serentak, kesahan konvergen dan kesahan diskriminan. Sementara itu, kesahan inferens
dikategorikan kepada dua jenis merangkumi kesahan dalaman dan kesahan luaran. Rajah
2 memberikan gambaran tentang jenis-jenis kesahan menurut Borgatti (2012).
Kesahan
C r o c k e r e t
Kesahan Kesahan Inferens
Konstruk
Kesahan Kesahan
Terjemahan Kesahan Kriteria Dalaman
Kesahan Muka Kesahan Ramalan Kesahan

Luaran
Kesahan Kesahan Serentak
Kandungan
Kesahan Konvergen
Kesahan Diskriminan
Rajah 2: Jenis kesahan menurut Borgatti (2012)

inferens yang diinginkan perlu dikenal pasti dengan jelas sebelum kajian empirikal
dilaksanakan untuk mengumpul bukti mengenai kegunaan skor bagi menyokong inferens
yang telah dikenal pasti. Crocker et al. (2008) menyatakan terdapat tiga jenis kesahan
utama iaitu kesahan kandungan, kesahan kriteria dan kesahan konstruk. Konsep kesahan
Crocker et al. (2008) ini juga dikonsepsikan sebagai satu proses untuk memeriksa
sumbangan komponen tertentu bagi penyatuan konstruk. Justeru, kesahan kriteria,
3
kesahan kandungan dan kesahan konstruk memainkan peranan penting dalam penyatuan
konsep kesahan.
Kesahan
Kesahan Kesahan Kesahan

Kandungan Kriteria Konstruk
Rajah 3: Jenis kesahan menurut Crocker et al. (2008) dan Devellis (2017)
Sama seperti Crocker et al. (2008), Devellis (2017) juga membahagikan kesahan
kepada tiga kategori utama berdasarkan tiga intipati definisi kesahannya. Intipati pertama
merujuk kepada kesahan kandungan iaitu kesimpulan yang diperoleh daripada cara skala
dibina. Intipati kedua merujuk kepada kesahan kriteria berdasarkan keupayaan meramal
situasi tertentu dan intipati terakhir merujuk kepada kesahan konstruk bagi melihat
hubungan antara konstruk.
3.0 Definisi dan Konsep Setiap Jenis Kesahan
Biarpun sarjana terdahulu memberi pandangan yang berbeza tentang jenis kesahan,
definisi dan konsep setiap jenis kesahan masih dalam konteks yang sama sebagaimana
perincian berikut:
3.1 Kesahan Kandungan
4
Secara umumnya, kesahan kandungan merujuk kepada sejauh mana instrumen yang
dibina mewakili aspek yang ingin diukur. Ini bertujuan untuk memastikan setiap item benar-
benar mewakili aspek yang hendak diukur. Menurut Devellis (2017), kesahan kandungan
memberi tumpuan terhadap pensampelan item bagi mengenal pasti sejauh mana item
menggambarkan kandungan domain dengan tepat. Kesahan kandungan perlu dilakukan
oleh individu yang mempunyai kepakaran dalam bidang yang dikaji.
Sebagai contoh, dalam memastikan kesahan kandungan bagi instrumen berkaitan
efikasi kendiri, pakar akan memeriksa sama ada item efikasi menepati konstruk atau tidak.
Secara umumnya, item bagi instrumen berkaitan efikasi kendiri mesti diungkap dengan
ungkapan “boleh lakukan” dan bukannya “akan lakukan”. Ini kerana, efikasi kendiri merujuk
kepada keupayaan untuk melaksanakan tindakan. Sebelum kesahan kandungan
dilaksanakan oleh pakar, satu jadual spesifikasi instrumen yang menjelaskan definisi
konseptual konstruk dan juga padanan item dengan senarai objektif perlu disediakan
terlebih dahulu. Ini untuk memudahkan pakar melaksanakan penilaian dan mengelakkan
daripada tersilap tafsir.
3.2 Kesahan Kriteria
Kesahan kriteria melibatkan hubungan atau korelasi antara skor ujian dengan skor lain
yang mewakili kriteria yang telah dikenal pasti. Kesahan kriteria dilaksanakan dengan cara
membandingkan skor instrumen yang baru dibina dengan instrumen lain yang sudah
dikenal pasti mempunyai ukuran sifat atau kemahiran yang sama. Berdasarkan pandangan
Cohen et al. (2013) dan Devellis (2017), kesahan kriteria terbahagi kepada dua kategori
iaitu kesahan serentak dan kesahan jangkaan.
5
Kesahan serentak merujuk kepada sejauh mana instrumen yang baru dibina
mempunyai hubungan dengan kriteria pada instrumen sedia ada yang diukur secara
serentak pada masa yang sama (Devellis, 2017; Cohen et al., 2013). Jika kriteria yang ada
pada instrumen baharu mempunyai korelasi yang baik dengan kriteria instrumen sedia ada
maka, kriteria instrumen baharu tersebut dikatakan memiliki kesahan serentak (Coaley,
2010).
Kesahan jangkaan pula bertujuan untuk menentukan sejauh mana instrumen dapat
meramalkan skor pada kriteria yang diukur (Coaley, 2010; Cohen et al., 2013). Ukuran
jangkaan atau yang diramalkan tersebut harus mempunyai kaitan dengan tingkah laku atau
situasi akan datang (Devellis, 2017). Namun begitu, timbul masalah berkaitan kesahan
jangkaan yang mana jarak masa antara pengukuran pertama dengan pengukuran prestasi
jangkaan boleh dipengaruhi oleh faktor lain seperti kematangan dan pengalaman.
3.3 Kesahan Konstruk
Kesahan konstruk dilakukan bagi memastikan hubungan antara konstruk dibuktikan secara
empirikal berdasarkan penggunaan yang konsisten dengan teori (Devellis, 2017). Dengan
erti kata lain, kesahan konstruk mempunyai perkaitan dengan konstruk psikologi yang
berkaitan dengan skor instrumen. Konstruk merujuk kepada trait, atribut atau kualiti
psikologi yang merupakan suatu elemen yang tidak dapat diperhatikan secara langsung
tetapi boleh disimpulkan melalui teori psikologi.
Kesahan konstruk dilaksanakan melalui rumusan hipotesis tentang konstruk yang
diramal akan berbeza daripada aspek demografi, prestasi atau ukuran lain yang mana
hubungannya telah disahkan. Hipotesis ini bukanlah dibina berdasarkan logik akal semata
6
tetapi perlu dibina berdasarkan teori yang mendasari konstruk dengan disertakan definisi
sintaksis. Seterusnya, instrumen yang mengandungi item bagi mewakili tingkah laku yang
spesifik dan menggambarkan konstruk dipilih sebelum data empirikal dikumpulkan untuk
menguji hipotesis. Setelah hipotesis diuji, pertimbangan pemilihan item dilakukan bagi
membuat keputusan sama ada untuk mengekalkan atau menghapuskan item berdasarkan
keperluan kajian.
Bagi mendapatkan kesahan konstruk, terdapat beberapa prosedur yang boleh
dilakukan. Sebagai contoh, untuk membuktikan hubungan antara skor ujian kecerdasan
dengan prestasi, prosedur korelasi antara konstruk boleh dilaksanakan. Prosedur ini
dilakukan dengan dua cara iaitu melalui regresi berganda dan melakukan hipotesis ukuran
relatif korelasi untuk ukuran konstruk dan pemboleh ubah. Seterusnya, prosedur
pembezaan kumpulan boleh dilakukan untuk melihat perbezaan skor antara jantina yang
mana jika perbezaan yang dijangkakan tidak wujud, mungkin berlaku kesilapan pada teori
atau kekurangan instrumen untuk mengukur konstruk atau kegagalan rawatan (bagi kajian
eksperimen).
Terdapat dua lagi prosedur dalam pelaksanaan kesahan konstruk iaitu prosedur
analisis faktor dan prosedur matriks kepelbagaian trait dan kaedah (multitrait-multimethod
matrix). Prosedur analisis faktor dilakukan untuk mengenal pasti beberapa bilangan
pemboleh ubah melalui matrix of item intercorrelations dan correlation matrix. Prosedur
matriks kepelbagaian trait dan kaedah pula dilakukan untuk menentukan dua cara atau
lebih untuk mengukur konstruk dan mengenal pasti konstruk lain yang berbeza tetapi boleh
diukur melalui kaedah sama yang digunakan untuk konstruk. Prosedur analisis faktor dan
prosedur matriks kepelbagaian trait dan kaedah ini digunakan oleh Gibson dan Dembo
(1984) dalam validasi instrumen Skala Efikasi Kendiri Guru yang dibina oleh mereka.
7
Menurut Cohen et al. (2013), penilaian kesahan konstruk akan dapat dijelaskan
dalam tiga jenis bukti kesahan konstruk merangkumi bukti kehomogenan, bukti konvergen
dan bukti diskriminan. Bukti kehomogenan merujuk kepada sejauh mana item-item dalam
instrumen dapat mengukur satu konstruk tunggal (Gregory, 2015). Bukti kehomogenan
dapat diperoleh melalui kaedah analisis korelasi antara item dengan jumlah skor item
dalam satu konstruk atau subkonstruk (Cohen et al., 2013).
Bukti konvergen pula bertujuan untuk melihat sejauh mana instrumen berkorelasi
secara positif dengan instrumen lain dalam mengukur konstruk yang sama. Ini bagi
menunjukkan pemboleh ubah atau instrumen berkongsi ciri-ciri konstruk yang sama
(Gregory, 2015). Bukti konvergen diperoleh melalui dua kaedah iaitu pemeriksaan
pemuatan faktor dan purata varians yang diekstrakkan (AVE). Bukti terakhir iaitu bukti
diskriminan dapat dibuktikan apabila satu instrumen tidak berkorelasi dengan pemboleh
ubah atau instrumen yang tidak berkongsi ciri-ciri konstruk yang sama (Gregory, 2015).
Untuk mendapatkan bukti diskriminan, dua kaedah boleh digunakan iaitu analisis faktor
penerokaan dan analisis faktor pengesahan.
3.4 Kesahan Muka
Kesahan muka merujuk kepada penilaian yang dilakukan untuk memeriksa format,
kejelasan makna item, laras bahasa, saiz tulisan, arahan, ejaan dan kesesuaian item
dengan objektif kajian. Kesahan muka dapat dipertingkatkan dengan menjadikan item-item
dalam instrumen sentiasa relevan dan munasabah dengan situasi penggunaannya
(Anastasi, 1985). Kesahan muka boleh dilakukan oleh mana-mana individu walaupun tidak
memiliki kepakaran dalam bidang yang dikaji. Oleh sebab kesahan muka boleh
8
dilaksanakan oleh sesiapa sahaja, kesahan muka dilihat tidak mempunyai kepentingan
berbanding kesahan kandungan dan kesahan-kesahan lain.
4.0 Rumusan
Secara ringkasnya, biarpun sarjana berselisih pendapat tentang jenis-jenis kesahan namun
mereka sebenarnya sepakat menyatakan terdapat empat kesahan utama iaitu kesahan
muka, kesahan kandungan, kesahan kriteria dan kesahan konstruk. Kesahan muka tidak
diberi perhatian oleh kebanyakan sarjana terdahulu kerana hanya melibatkan ulasan umum
tentang kualiti item dan dinilai oleh siapa sahaja walaupun tanpa memiliki latihan formal
dalam bidang yang dikaji. Ini berbeza dengan kesahan kandungan yang mana kualiti item
perlu diulas oleh pakar yang mempunyai kepakaran dalam aspek yang ingin dikaji.
Kesahan kriteria pula yang dibahagikan kepada kesahan serentak dan kesahan jangkaan
lebih memberi tumpuan kepada korelasi dengan ukuran gold standard dan kemampuan
instrumen membuat jangkaan terhadap pemerhatian masa depan. Manakala, jenis kesahan
terakhir iaitu kesahan konstruk pula lebih tertumpu kepada ukuran secara teori tentang
kepentingan instrumen berdasarkan penyelidikan lepas.
Rujukan
Anastasi, A. 1985. Psychological Testing. Ed. Ke-5. New York: MacMillan Publishing
Co Inc.
9
Coaley, K. 2010. An introduction to psychological assessment and psychometrics. Ed. ke-2.
London: SAGE Publications Inc.
Cohen, R. J., Swerdlik, M. E. & Sturman, E. D. 2013. Psychological testing and

assessment: an introduction to test and measurement. Ed. ke-8. New York:
McGraw-Hill.
Crocker, L. & Algina, J. 2008. Introduction to classical & modern test theory. Ohio :
Cengage Learning.
Cronbach, L. J. 1951. Coefficient alpha and the internal structure of tests. Psychometrika,
16(3): 297–334.
DeVellis, R. . (2017). Scale development : theory and applications (4th ed.). SAGE
Publications Inc.
Gregory, R. J. 2015. Psychological testing: history, principles, and applications. Ed. ke-6.
Boston, MA: Pearson Education, Inc.
Mehrens, W. A. & Lehmann, I. J. 1991.Measurement and evaluation in education and

psychology. Ed. Ke-4. Belmont CA : Wadsworth/Thomson Learning.
10

Tugasan 2

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Tugasan 2

Uploaded by

Copyright:

Available Formats

Tugasan 2: Kesahan

membuktikan instrumen tersebut memiliki darjah kesahan yang baik.

2.0 Konsep dan Jenis Kesahan

digunakan sebagaimana cadangan penggunaan instrumen tersebut. Dalam konteks

pengesahan instrumen, kesahan juga melibatkan proses mengumpul bukti untuk

mengikut pandangan pakar yang berbeza.

Rajah 1: Jenis kesahan menurut Cohen et al. (2013)

kesahan terjemahan dan kesahan kriteria. Kesahan terjemahan seterusnya dikategorikan

2 memberikan gambaran tentang jenis-jenis kesahan menurut Borgatti (2012).

Kesahan Muka Kesahan Ramalan Kesahan

Rajah 2: Jenis kesahan menurut Borgatti (2012)

sumbangan komponen tertentu bagi penyatuan konstruk. Justeru, kesahan kriteria,

Kesahan Kesahan Kesahan

hubungan antara konstruk.

3.0 Definisi dan Konsep Setiap Jenis Kesahan

3.1 Kesahan Kandungan

menggambarkan kandungan domain dengan tepat. Kesahan kandungan perlu dilakukan

oleh individu yang mempunyai kepakaran dalam bidang yang dikaji.

Sebagai contoh, dalam memastikan kesahan kandungan bagi instrumen berkaitan

kepada keupayaan untuk melaksanakan tindakan. Sebelum kesahan kandungan

daripada tersilap tafsir.

3.2 Kesahan Kriteria

iaitu kesahan serentak dan kesahan jangkaan.

3.3 Kesahan Konstruk

tetapi boleh disimpulkan melalui teori psikologi.

Kesahan konstruk dilaksanakan melalui rumusan hipotesis tentang konstruk yang

Bagi mendapatkan kesahan konstruk, terdapat beberapa prosedur yang boleh

dalam satu konstruk atau subkonstruk (Cohen et al., 2013).

penerokaan dan analisis faktor pengesahan.

3.4 Kesahan Muka

dalam instrumen sentiasa relevan dan munasabah dengan situasi penggunaannya

berbanding kesahan kandungan dan kesahan-kesahan lain.

kepentingan instrumen berdasarkan penyelidikan lepas.

Cohen, R. J., Swerdlik, M. E. & Sturman, E. D. 2013. Psychological testing and

Mehrens, W. A. & Lehmann, I. J. 1991.Measurement and evaluation in education and

You might also like