You are on page 1of 24

BAB 8

KEBOLEHPERCAYAAN DAN KESAHAN

OBJEKTIF BAB
Setelah mempelajari bab ini, anda sepatutnya dapat:
1.
Menerangkan konsep kebolehpercayaan dan konsep kesahan.
2.
Menerangkan beberapa metod meneliti kebolehpercayaan.
3.
Menerangkan beberapa jenis dan metod kesahan ujian.
4.
Mengenal pasti metod yang sesuai untuk menerangkan
kesahan sesuatu ujian.
5.
Membuat pertimbangan berhubung dengan kebolehpercayaan
dan kesahan ujian sebelum menggunakan sesuatu ujian.
8.1

PENGENALAN

Untuk anda memahami dengan lebih mendalam bahawa data yang anda
kumpul dalam penyelidikan dapat dijadikan maklumat yang dapat
dipertanggungjawabkan, anda mestilah terlebih dahulu meneliti bahawa
data tersebut boleh dipercayai dan ujian yang anda gunakan dapat
dipastikan sah untuk mengukur apa yang anda ingin ukur. Perkataan
boleh dipercayai adalah merujuk kepada konsep kebolehpercayaan,
manakala persoalan sah atau tidaknya ujian merujuk konsep kesahan.
Konsep kebolehpercayaan dan kesahan berkait rapat dengan persoalan
sama ada data atau maklumat yang diperolehi daripada sesuatu ujian
boleh dipercayai mengukur sesuatu pembolehubah atau tingkah laku
yang diukur. Sebagai contoh, data yang diperolehi daripada ujian yang
dikatakan mengukur motivasi seharusnya boleh dipercayai
menggambarkan gagasan motivasi.
Sebaliknya jika markah yang
dihasilkan daripada ujian tersebut diragui, maka kesahan ujian motivasi
tersebut sukar untuk dipertahankan.
8.2

DEFINISI KEBOLEHPERCAYAAN

Kebolehpercayaan sering dirujuk sebagai ketakalan dan kestabilan


(Anastasi & Urbina, 1997). Ketakalan pula merujuk kepada keadaan di
mana tindak balas atau markah daripada item-item ujian tekal di antara
satu dengan yang lain. Kestabilan pula akan wujud apabila tindak balas
115

terhadap item atau ujian itu tekal mengikut masa atau keadaan, iaitu
tindak balas pada hari ini sama dengan esok dan hari-hari berikutnya.
Tindak balas begitulah yang dikatakan stabil. Kedua-dua keadaan ini
menunjukkan bahawa data ujian itu boleh dipercayai dan mempunyai
nilai kebolehpercayaan yang baik ataupun tinggi.
Nilai petunjuk untuk menerangkan kebolehpercayaan dinamakan sebagai
pekali kebolehpercayaan. Nilai pekali kebolehpercayaan boleh ditakrif
seperti pekali korelasi. Ia merupakan petunjuk kepada darjah ketekalan
item-item ujian atau kestabilan markah mengikut keadaan dan situasi.
Secara serentak, nilai pekali menggambarkan darjah kebolehpercayaan
sama ada rendah, sederhana ataupun tinggi. Nilai pekali
kebolehpercayaan mempunyai julat di antara sifar (0) hingga satu (1.0).
Nilai sifar membawa data yang sukar dipercayai kerana pekalinya amat
rendah, manakala nilai .5 menunjukkan sederhana, dan nilai 1.0 pula
menunjukkan kebolehpercayaan yang paling tinggi.
8.3

METOD MENILAI KEBOLEHPERCAYAAN

Terdapat beberapa metod yang dianggap mudah untuk meneliti


kebolehpercayaan data dan menganggar nilai pekali kebolehpercayaan.
Anda akan didedahkan dengan empat jenis metod sahaja dalam modul
ini, iaitu:
i)
ii)
iii)
iv)

Metod ketekalan dalaman


Metod bahagi dua
Metod ujian kembali
Kebolehpercayaan antara koder

8.3.1

Metod Ketekalan Dalaman

Metod ketekalan dalaman menganggar kebolehpercayaan markah atau


data ujian berdasarkan item-item yang terdapat dalam set sesuatu ujian
yang boleh diperolehi daripada satu tadbiran. Ketekalan dalaman item
ujian tersebut boleh diangar melalui berbagai-bagai cara. Anda akan
didedahkan dengan dua caraa sahaja dalam modul ini, iaitu:
(a)
(b)

dengan formula pekali alfa, dan


dengan formula Kuder Richardson.

a.

Pekali Alfa

Metod pekali alfa diperkenalkan oleh Cronbach pada tahun 1951.


Formula untuk mengira pekali alfa Cronbach adalah seperti berikut:
116

K
=
K 1
di mana

=
s2i
=
2
=
s
K
=

s2 - si 2

2
s

pekali alfa
jumlah varians setiap item
varians markah keseluruhan ujian
jumlah item ujian

Pekali alfa sesuai digunakan kepada ujian yang menggunakan format


jawapan pelbagai pilihan seperti format Likert yang menunjukkan darjah
persetujuan daripada sangat tidak setujuk (skor 1) hingga sangat setuju
(skor 5). Format ini banyak terdapat dalam inventori dan ujian mengukur
pendapat, sikap, nilai, personaliti dan lain-lain. Pekali alfa boleh juga
digunakan kepada ujian berbentuk esei yang menggunakan sistem
permarkahan selanjar misalnya daripada 0 hingga 10. Pekali alfa boleh
juga digunakan kepada ujian yang menggunakan hanya dua pilihan yang
berbentuk dikotomi seperti YA dan TIDAK (Crocker dan Algina, 1986).
Jadual 8.1 menunjukkan data yang dikumpulkan berdasarkan 5 item ujian
yang boleh dianalisis dengan metod alfa. Pakej komputer statistik sepertti
SPSS for Windows mampu membantu anda menganalisis statistik ini
dengan mudah.
Jadual 8.1
Jawapan Subjek Terhadap 5 Item Ujian
Subjek
1
2
3
4
5
6
7

Item 1
4
2
2
1
5
4
3

Item 2
1
3
2
4
3
4
3

Item 3
3
2
5
2
4
3
4

Item 4
5
4
3
4
3
5
4

Item 5
1
3
2
3
2
2
4

Jika anda ingin menganalisis data di atas dengan pakej SPSS for
Windows, arahan yang terdapat dalam tetingkap adalah seperti berikut:
Analyze

Scale

Reliability Analysis

Guna model Alpha

117

Katakanlah nilai pekali alfa yang diperolehi ialah 71. Apa maknanya?
Nilai alfa ini adalah sederhana tinggi. Bolehlah kita katakan bahawa
kebolehpercayaan ketekalan dalaman ujian yang menggunakan 5 item itu
mempunyai kebolehpercayaan yang sederhana tinggi. Data daripada ujian
motivasi yang digunakan seragam mengukur motivasi dan ia boleh
dipercayai.

b.

Formula Kuder Richarson

Anda telah diberi kefahaman tentang cara menggunakan formula alfa


untuk ujian yang menggunakan format pelbagai pilihan. Bagaimana
sekiranya ujian menggunakan format dua pilihan ataupun format binari
seperti YA atau TIDAK, SALAH atau BENAR? Jika format sebegini
yang digunakan, anda hendaklah menggunakan formula yang
dicadangkan oleh Kuder dan Richardson (1937). Kuder dan Richardson
telah mencadangkan dua jenis formula terkenal yang dikenali dengan
nama KR20 dan KR21. Formula KR20 adalah seperti berikut:
2
K s pq
KR20 =

s2
K 1

di mana
=
s2
pq =
p
=
I
q
=
K
=

varians markah keseluruhan


jumlah varians item berdasarkan nilai p dan q
peratus individu menjawab YA atau BENAR kepada item
1p
bilangan item

Formula KR20 adalah sama dnegan formula alfa yang dibincangkan


sebelum ini. Yang berbeza ialah komponen pq bagi menggantikan s2i.
Sekiranya kesemua item ujian mempunyai aras kepayahan yang sama,
Kuder dan Richardson menyediakan formula lebih mudah yang diberi
nama KR21. Formula KR21 lebih mudah dikira secara manual kerana
anda tidak perlu mengira varians bagi setiap item, tetapi memadai dengan
hanya mengira nilai varians keseluruhan individu (s2) dan min markah
keseluruhan (X ) / Formula KR21 ialah:
2
K Ks X(K X)
KR21 =

Ks 2
K 1

Nilai pekali kepebolehpercayaan yang dikira dengan formula KR20 dan


KR21 akan sama apabila kesemua item mempunyai aras kepayahan yang
sama. Namun demikian, apabila aras kepayahannya berbeza nilai KR21
118

menjadi lebih rendah berbanding dengan nilai KR20. Oleh kerana itu,
mana-mana ujian yang digunakan untuk mengukur prestasi akademik
ataupun dalam proses pembejaran adalah digalakkan supaya dapat
melaporkan kedua-dua nilai pekali KR20 dan KR21 bersama-sama
dengan aras kepayahan bagi setiap item ujian.
Anda boleh menggunakan pakej SPSS for Windows tetapi data yang
perlu dimasukkan adalah menggunakan nilai 0 untuk jawapan TIDAK
dan 1 untuk jawapan YA bagi setiap item.
Jadual 8.2
Jawapan Subjek Terhadap 5 Item Ujian
Subjek
1
2
3
4
5
6
7

Item 1
0
1
1
0
1
0
1

Item 2
1
0
0
1
1
0
1

Item 3
1
1
1
0
1
1
1

Item 4
15
0
0
1
1
1
1

Item 5
1
0
0
0
1
1
1

Interprestasi kepada pekali KR20 dan KR21 adalah sama seperti pekali
alfa.
8.3.2

Metod Bahagi Dua

Anda telah didedahkan dengan metod kebolehpercayaan ketekalan


dalaman dengan formula alfa dan KR20 atau KR21 dalam perbincangan
kita sebelum ini. Selain daripada metod yang saya nyatakan itu, metod
bahagi dua juga boleh digunakan untuk tujuan yang sama. Melalui metod
ini, markah ujian dibahagikan kepada dua bahagian secara seimbang atau
selari. Sekiranya satu set ujian itu mengandungi 30 item, maka setiap
bahagian akan mengandungi 15 item. Perkara penting yang perlu diawasi
semasa membahagikan item kepada dua bahagian adalah dengan
memastikan bahawa kedua-kedua bahagian itu mestilah seragam. Oleh
kerana itu, tidak semua item ujian boleh dibahagi dua secara keseluruhan
dengan begitu sahaja. Tambahan pula jika ujian itu mempunyai banyak
subskala. Pembahagian mestilah dibuat bagi setiap subskala dan bukan
berdasarkan keseluruhan ujian.
Untuk membahagikan item kepada dua bahagian, Crocker dan Algina
(1986) mencadangkan empat cara ia boleh dilakukan, iaitu dengan:
i)

membahagikan item berpandukan kepada item genap dan item


ganjil. Subujian pertama terdiri daripada item genap, manakala
subujian kedua terdiri daripada item ganjil;
119

ii)

menyusun item secara tertib berdasarkan aras kepayahan item.


Selepas itu bahagikan mengikut item genap dan item genap;

iii)

membahagikan item kepada dua bahagian secara rawak. Ini


membolehkan setiap item mempunyai peluang yang sama terpilih
dalam setiap bahagian; dan

iv)

membahagikan item mengikut kandungan. Kandungan bahagian


pertama haruslah sepadan dengan kandungan bahagian kedua.

Setelah dua bahagian ujian itu ditentukan, data bahagian pertama dan
kedua dikorelasikan dengan metod analisis korelasi formula Pearson.
Pekali korelasi yang dikira merupakan petunjuk kepada pekali
kebolehpercayaan ketekalan dalaman bahagi dua. Namun demikian pekali
kebolehpercayaan yag diperolehi perlu diperbaiki dengan formula
Spearman-Brown kerana pekali korelasi yang dikira berdasarkan dua
bahagian itu adalah di bawah jangkaan dan ia tidak melibatkan
keseluruhan ujian. Oleh kerana itu, formula Spearman-Brown membuat
pembetulan kepada nilai pekali tersebut. Formula Spearman Brown
membuat pembetulan kepada nilai pekali tersebut. Formula Spearman
Brown Spearman Brown adalah seperti berikut:
Rajah 8.1
Formula Spearman-Brown
rSB

di mana
rSB
=
=
r12

2r12
1 + r12
pekali kebolehpercayaan Spearman-Brown
pekali korelari dua bahagian

Pekali kepebolehpercayaan yang telah diperbaiki dengan formula


Spearman-Brown lebih tinggi daripada korelasi dua bahagian. Katakanlah
korelasi dua bahagian yang dikira dengan formula Pearson ialah .60. Kita
boleh mengira pekali Spearman Brown seperti berikut:
rSB

=
=
=

2(.60)
1 + .60
1.20
1.60
.75

Nilai pekali kebolehpercayaan yang diperbaiki inilah yang dilaporkan oleh


pembuat ujian sama ada dalam manual ataupun penulisan artikel.
120

8.3.3

Kebolehpercayaan Ujian Kembali

Kebolehpercayaan ujian kembali menunjukkan kestabilan markah ujian


dan tindak balas mengikut masa dan keadaan. Oleh kerana ujian
selalunya digunakan untuk menggambarkan kestabilan tingkah laku maka
kebolehpercayaan jenis ini wajar ditunjukkan. Dengan menggunakan
ujian yang sama, markah yang diperolehi oleh individu dalam ujian
pertama sepatutnya stabil dengan markah yang dicapai dalam ujian
kedua.
Untuk mengira pekali kebolehpercayaan ujian kembali, markah ujian
pertama dikorelasikan dengan markah ujian kedua. Jika datanya jenis
selanjar formula Pearson digunakan. Jadual 8.3 merupakan contoh
markah personaliti ujian pertama dengan markah ujian kedua yang
ditadbirkan kepada 10 orang subjek.
Jadual 8.3
Markah Ujian 1 dan Ujian 2 Gagasan Personaliti
Subjek
1
2
3
4
5
6
7
8
9
10

Ujian 1
58
63
65
66
68
72
76
78
81
82

Ujian 2
55
59
72
66
72
76
71
81
77
84

Jika anda ingin menganalisis data di atas dengan pakej statistik SPSS for
Windows dan boleh gunakan analisis korelasi dengan arahan yang
terdapat dalam tetingkap SPSS seperti berikut:
Analyze

Correlate
Bivariate

Guna Correlation Coefficient


Pearson

Isu yang perlu difikirkan apabila menggunakan pekali ujian kebali ialah
jarak waktu di antara ujian pertama dengan ujian kedua. Jika jarak
waktunya terlalu lama, ia mengurangkan pengaruh ingatan jangka pendek
dan ralat boleh dikurangkan. Namun ia mungkin boleh menyebabkan
kematangan dan perubahan sebenar individu. Oleh kerana itu jenis ujian
121

juga perlu diambil kira. Bagi ujian yang mengukur prestasi kita selalunya
menjangka bahawa prestasi dalam ujian kedua lebih baik berbanding
dengan ujian pertama.
Mengenai jarak waktu, Janda (1998) menyatakan jarak waktu 3 bulan
sesuai bagi ujian yang mengukur kecerdasan, keupayaan dan prestasi
orang dewasa tetapi bagi individu yang lebih muda jaraknya perlu
dikurangkan. Bagi ujian yang mengukur tingkah laku dan tret yang stabil
seperti personaliti dan sikap pula, jaraknya ialah antara 1 4 minggu.
Bagi ujian kebolehan kognitif jarak waktunya antara 6 12 minggu.
Nilai pekali kestabilan ujian kembali yang dianggap baik ialah .80 ke atas
(Gregory), 1992). Oleh kerana itu, ujian kecerdasan untuk orang dewasa
yang popular sepertti Weschles Adult Intelligence Scale (WAIS) mempunyai
pekali ujian kembali .97 (Wechsler, 1981 dalam Jahoda, 1998).

8.3.4

Kebolehpercayaan antara Koder

Ada ujian yang menggunakan pemeriksa atau koder untuk memberi


markah ataupun penilaian. Pemarkahan tidak dijalankan melalui
komputer kerana jawapannya menggunakan pertimbangan yang bersifat
subjektif. Contoh ujian seperti ini ialah ujian yang dikategorikan sebagai
ujian projektif. Dua atau lebih pemeriksaan atau koder akan memberi
penilaian kepada jawapan dan tindak balas yang diberi oleh individu yang
diuji dengan jenis ini. Korelasi di antara koder dijadikan petunjuk kepada
kebolehpercayaan antara koder. Oleh kerana pertimbangan yang diberi
terdedah dengan ralat hasil daripada perbezaan markah maka nilai pekali
yang boleh dianggap baik bagi kebolehpercayaan jenis ini adalah lebih
rendah sedikit iaitu dalam lingkung .80.

8.4

KEBOLEHPERCAYAAN DAN SAMPEL

Nilai pekali kebolehpercayaan bergantung kepada keadaan sampel yang


mengambil ujian tersebut. Kebiasaannya nilai pekali kebolehpercayaan
menjadi lebih tinggi jika sampel tidak seragam kerana nilai variansnya
besar berbanding dengan sampel yang seragam. Jadual 8.4 menunjukkan
perbezaan serakan markah antara pra dan pasca ujian antara Sampel A
dengan Sampel B. Serakan markah Sampel A lebih besar berbanding
dengan Sampel B. Pekali kebolehpercayaan yang dikira dengan
mengkorelasikan markah pra dan pasca Sampel A lebih besar (.96)
berbanding dengan Sampel B (.70).

122

Jadual 8.4
Taburan Markah Pra dan Pasca bagi Sampel A dan Sampel B
Sampel A
Sampel
1
2
3
4
5
6
7
8
9
10

Pra
44
48
52
56
50
63
66
70
74
78

Pekali Kebolehpercayaan

8.5

Pasca
47
45
55
59
57
66
63
73
77
75

Pra
76
77
78
78
79
79
79
80
80
80

Sampel B
Pasca
77
78
79
79
80
78
80
80
79
79

.96

.70

MENINGKATKAN KEBOLEHPERCAYAAN

Prinsip yang telah dibincangkan sebelum ini menggambarkan bahawa


rendahkannya kebolehpercayaan adalah disebabkan serakan yang
seragam dan varians yang rendah. Berdasarkan prinsip mudah ini,
kebolehpercayaan boleh ditingkatkan dengan menambah bilangan item
ujian. Secara logiknya apabila bilangan item bertambah maka akan wujud
perbezaan yang lebih besar.
Hal ini dapat dibuktikan secara algebra jika kita teliti formula pembaikan
Spearman Brown. Dengan menggunakan 2 sebagai angka pengatas
persamaan tersebut, pekali kebolehpercayaan boleh meningkat. Ini
bermakna dengan menambah 2 kali ganda bilangan item, pekali
kebolehpercayaan menjadi lebih besar. Jika anda berminat dengan isu ini,
anda bolehlah merujuk Jahoda (1998).

SOALAN DALAM TEKS 8.1

1. Terangkan dengan ringkas dan tepat beberapa


konsep berikut:
a)
b)
c)
d)

Metod alfa
Pekali kebolehpercayaan ujian kembali
Metod bahagia dua
Formula Kuder Richardson

123

2. Bandingkan di antara kebolehpercayaan ketekalan


dalaman ujian dengan kestabilan ujian. Perbandingan
anda hendaklah merujuk kepada metod analisis
untuk menghasilkan pekali kebolehpercayaan dan
kestabilan ujian.

Semak jawapan anda di akhir bab ini.

8.6

DEFINISI KESAHAN

Anda telah didedahkan dengan konsep kebolehpercayaan di awal bab ini.


Selain daripada kebolehpercayaan, isu yang dianggap penting dalam ujian
dan pengukuran ialah kesahan. Kesahan ujian melibatkan dua persoalan
utama, iaitu:
i)
ii)

Apakah yang hendak diukur oleh sesuatu ujian.


Sejauh manakah keupayaan sesuatu ujian itu mengukur apa yang
hendak diukur.

Anastasi dan Urbina (1997) menjelaskan bahawa kesahan merupakan


persetujuan rapat di antara sesuatu ujian dengan criteria tingkah laku
yang diukur oleh ujian itu. Kaplan dan Saccuzzo (1989) menyimpulkan
bahawa kesahan sesuatu pengukuran terletak kepada perkara yang dapat
dicapai oleh pengukuran tersebut. Cronbach dan Meehl (1955) pula
menjelaskan bahawa kesahan sesuatu ujian merujuk kepada sejauh mana
darjah ujian itu sah mengukur apa yang diukur.
Berdasarkan definisi dan penerangan di atas dapatlah kita rumuskan
bahawa sesuatu ujian dikatakan mempunyai kesahan jika ia dapat
mengukur perkara yang sepatutnya diukur. Sebagai contoh, kesahan ujian
personaliti menggambarkan sejauhmana ujian itu menghasilkan huraian
atau gambaran yang tepat mengenai tret-tret personaliti individu. Bagi
ujian kecerdasana pula, ia dikatakan sah jika mampu mendiskriminasi
individu-individu yang berbeza darjah kecerdasannya.
Kesahan sesuatu ujian tidak boleh dinyatakan dalam satu istilah yang
terlalu umum. Sebagai contoh, kita tidak boleh menyatakan bahawa ujian
itu tinggi atau rendah kesahannya secara abstrak. Kesahan ujian harus
ditentukan dengan merujuk kepada kegunaan ujian dan telah ditetapkan
oleh ujian itu sendiri (Anastasi dan Urbina, 1997).

124

Sekarang saya akan menerangkan pula cara bagi menentukan kesahan


ujian dalam bahagian yang berikut.

8.7

METOD MENILAI KESAHAN

Ujian telah digunakan untuk menentukan beberapa jenis penilaian atau


pentakrifan. Setiap jenis penilaian memerlukan kaedah yang berbeza-beza
untuk menentukan kesahan. Di dalam Standard for Educational and
Psychological Tests and Manuals 1966 (dalam Pyne dan Morris, 1975)
sekurang-kurangnya terdapat tiga jenis kesahan berdasarkan kepada
tujuan, ujian iaitu (1) kesahan kandungan; (2) kesahan berhubungan; dan
(3) kesahan gagasan.
Mengikut Janda (1998), beliau membahagikan kesahan kepada empat
jenis apabila membincangkan konsep ini. Empat kesahan yang
dinyatakan oleh beliau itu, ialah:
i)
ii)
iii)
iv)

Kesahan lahiriah;
Kesahan kandungan;
Kesahan berhubungan; dan
Kesahan gagasan.

Gregory (1992) memasukkan perbincangan kesahan lahiriah ke dalam


kesahan kandungan kerana kesahan itu tidak merujuk kepada isu teknikal
seperti kesahan berhubungan dan kesahan gagasan. Bab ini akan
mengambil pendekatan Greogory (1992) apabila menyentuh kesahan
lahiriah.

8.7.1

Kesahan Lahiriah dan Kesahan Kandungan

Pertimbangan yang merumuskan bahawa sesuatu ujian itu dikatakan baik


dan sah merupakan perrtimbangan kesahan secara lahiriah. Ia merupakan
penilaian awal yang perlu dibuat sebelum menggunakan sesuatu ujian.
Selepas kesahan lahiriah dikenal pasti, pengguna mestilah membuat
penilaian yang lebih mendalam berhubung dengan kandungan ujian.
Apabila penilaian mengarah kepada kandungan item, kenyataan dan
soalan-soalan yang terdapat pada sesuatu ujian, maka penilaian ini
merujuk kepada kesahan kandungan.
Kesahan kandungan merujuk kepada penilaian sama ada sesuatu item
atau soalan di dalam ujian sebenarnya mewakili sepenuhnya domain dan
gagasan yang ingin diukur oleh ujian tersebut. Ujian yang didakwa
mengukur kebolehan matematik misalnya, mestilah mengandungi soalansoalan dan itemyang menyoal perkara-perkara yang berkait dengan
125

matematik. Sekiranya ciri-ciri ini dapat dipenuhi maka secara lahiriah


ujian tersebut dikatakan sebagai sah. Di samping itu, secara isi
kandungannya ujian ini bolehlah juga dianggap sah.
Dalam menentukan kesahan kandungan suatu panel pakar perlu
diwujudkan untuk menilai item-item dan soalan ujian. Pakar akan
menentukan sebanyak mana item tersebut mengukur sebahagian besar
gagasan yang ingin diukur.
Untuk menentukan sama ada sesuatu ujian mempunyai kesahan
kandungan yang baik, kita akan membincangkan lima (5) penentu yang
dicadangkan oleh Crocker & algina (1986), iaitu:
i)
ii)
iii)

Berdasarkan bilangan atau peratus item yang menepati dan


sepadan dengan objektifnya berdasarkan penilaian yang paling
tepat oleh pakar.
Berdasarkan korelasi di antara jumlah item yang mengukur
objektif dengan darjah ketepatan item itu mengukur objektifnya.
Menggunakan indeks kongruen objektif item yang dicadangkan
oleh Rovinelli & Hambleton (1977).

Beberapa tokoh psikometrik seperti Lawshe (1975), Mastuza (1977) dan


Gregory (1992) mencadangkan beberapa metod statistik yang boleh
digunakan sebagai indeks kepada kesahan kandungan. Tata cara yang
digunakan berasaskan kepada persetujuan di kalangan pakar semasa
menilai item dan soalan ujian. Sebagai contoh, katakanlah dua orang
pakar diminta menilai item mengikut pemeringkatan kesesuaian. Bilangan
item yang dinilai boleh diletakkan dalam jadual kontigensi 2 x 2 seperti
berikut:
PAKAR PERTAMA

PAKAR
KEDUA

Tidak
Sesuai

Sangat
Sesuai

Tidak
Sesuai

Sangat
Sesuai

Pekali kesahan kandungan PKK dikria dengan formula berikut:

126

PKK =

D
(A + B + C + D)

Penilaian sama ada sesuatu ujian itu mempunyai kesahan kandungan,


nilai pekali kesahan kandungan mestilah tinggi menghampiri 1.0.
Penakrifannya sama dengan nilai pekli korelasi yang lain.
Kesahan kandungan boleh juga dinilai dengan menggunakan Jadual
Spesifikasi. Janda (1998) misalnya telah menunjukkan contoh jadual
spesifikasi yang mengandungi bilangan item atau soalan bagi setiap aspek
yang sepatutnya terkandang dalam proses pembelajaran misalnya kursus
Ujian Psikologi. Ujian tersebut seharusnya mempunyai tiga perkara dan
(3) aplikasi kepada prinsip. Jadual 8.5 berikut menunjukkan kandungan
ujian pertengahan semester yang disahkan mempunyai kesahan
kandungan.
Jadual 8.5
Jadual Spesifikasi Ujian Pertengahan Semester Kursus Ujian Psikologi
Aspek
Sejarah
Statistik
Kebolehpercayaan
Kesahan
Analisis Item
Pengetahuan
Ujian
Jumlah

8.7.2

Pengetahuan
Fakta
5
5
7
7
7
7

Pemahaman
Prinsip
4
4
4
4
4

Aplikasi

Jumlah

3
3
3
3
3

5
12
14
14
14
14

38

20

15

73

Kesahan Kriteria Berhubung

Dalam banyak keadaan, pengguna ujian berminat untuk membuat


keputusan terhadap tingkah laku dan prestasi yang dimiliki oleh
seseorang berdasarkan kepada markah ujian yang diambil. Kadangkala
mereka juga ingin mempastikan kejayaan permohonan dan kerjayanya
berdasarkan ujian bakat yang diberikan kepada mereka sedangkan
mereka belum lagi berkerja. Begitu juga keadaanya dengan apa yang telah
menjadi amalan pihak Kementerian Pendidikan dalam proses memilih
pelajar ke sekolah berasrama penuh. Keputusan ujian sebelumnya seperti
UPSR ataupun PMR digunakan untuk menjadi criteria kejayaan pelajar
masa depan di sekolah berasrama penuh. Dalam konteks ini pengguna
ujian sudah tentunya mengetahui bukti hubungan di antara markah dan
prestasi ujian dengan kriteria yang dijangkakan.

127

Bukti hubungan inilah yang dirujuk kesahan criteria berhubungan. Dalam


banyak penulisan kesahan kriteria berhubungan dibahagikan kepada dua
iaitu:
0.
1.

Kesahan serentak.
Kesahan ramalan.

1.

Kesahan serentak

Kesahan serentak kadangkala dipanggil juga dengan nama kesahan


kriterium serentak (Allen & Yen, 1979). Kesahan serentak merujuk
kepada sejauh masa hubungan markah ujian penilaian kerja dengan
persepsi prestasi kerja yang dipohon. Kedua-dua ujian tersebut
ditadbirkan secara serentak dan diuji korelasi atau hubungan dua markah
tersebut. Hubungan dua markah tersebut merupakan pertunjuk kepada
sejauhmanakah individu tadi dijangkakan mencapai prestasi yang baik
jika ia dipilih berkerja.
Hubungan yang tinggi di antara ujian dengan ujian yang lain yang
didakwa mengukur tret yang sama merupakan satu daripada petunjuk
dan bukti kepada kesahan serentak. Ujian yang baru dibina yang
dikatakan mengukur tingkah laku yang sama dengan ujian yang telah
established akan boleh didakwa mempunyai kesahan serentak jika markah
kedua-dua ujian tersebut mempunyai korelasi yang tinggi.
Dalam konteks ujian pemilihan kerja misalnya, katakanlah ujian Nilai
Kerja digunakan untuk membuat penilaian awal nilai kerja seseorang
calon dan mereka ingin menilai kesahan serentak ujian tersebut. Mereka
boleh mewujudkan satu criteria yang berhubungan dengan nilai kerja
misalnya prestasi kerja. Kedua-dua data tersebut diperolehi dan
dikorelasikan. Untuk tujuan pembelajaran korelasi antara data nilai kerja
dan prestasi kerja boleh dikira dengan formula Pearson kerana kedua-dua
pembolehubah mempunyai data jenis selanjar.
Arahan yang ditunjukkan sebelum ini untuk analisis korelasi yang
terdapat dalam pakej SPSS for Windows boleh digunakan.
Jadual 8.6
Taburan Data Nilai Kerja dan Prestasi Kerja
Calon
1
2
3
4
5

Nilai Kerja
89
84
76
70
65
128

Prestasi Kerja
75
81
74
54
77

6
7
8
9
10

64
62
59
59
57
X = 66.20
Min = 12.07

72
44
63
54
68
68.50
11.09

Pekali korelasi digunakan sebagai indeks kesahan serentak. Korelasi


antara nilai kerja dengan prestasi adalah signifikan (r = .55) dan ini
membuktikan bahawa Ukuran Nilai Kerja menunjukkan kesahan
serentak yang sederhana.
2.

Kesahan ramalan

Kesahan ramalan pula digunakan untuk meramal ketepatan fungsi dan


peranan sesuatu ujian mengukur tingkah laku masa depan. Markah ujian
digunakan untuk kebarangkalian prestasi yang bakal dicapai oleh individu
yang mengambil ujian tersebut. Markah ujian penilaian di kalangan
pemohon misalnya digunakan untuk meneliti sejauh mana pemohon itu
berjaya dengan cemerlang atau sebaliknya dalam pekerjaannya nanti.
Ujian yang digunakan untuk menapis permohonan masuk ke Institusi
Pengajian Tinggi biasanya digunakan untuk meramal prestasi pelajar
mendapatkan ijazah, diploma dan sijil. Ujian yang mempunyai kesahan
ramalan yang baik selalunya mempunyai korelasi yang tinggi dengan
kriteria yang diramal.
Sax (1989) seorang tokoh psikometrik berpendapat lebih daripada satu
pekali kesahan ramalan yang dapat mewakili kesahan set pengukuran dan
ia bergantung kepada empat keadaan berikut:
i)
ii)
iii)
iv)

Apakah criteria yang digunakan dan dipersetujui.


Jangka masa yang diukur di antara peramal dan kriteria,
Keperbezaan dan serakan markah ujian, dan
Pekali kebolehpercayaan peramal dan kriteria.

Dalam membincangkan isu tersebut, Sax (1989) menunjukkan dua


keadaan berikut sebagai contoh.
i)

Ujian Differential Aptitude Test (DAT) menggunakan gred


pencapaian Bahasa Inggeris di kalangan pelajar untuk jangka
masa satu tahun dan mempunyai pekali kesahan .40 bagi subkala
penaakulan lisan. DAT juga mempunyai korelasi .40 bagi
subskala pengiraan (Bennertt) 1984.
129

ii)

Ujian Scholastic Aptutude Test (SAT) mempunyai korelasi .27


dengan markah Peperiksaan Kebangsaan Perubahan (National
Board Medical Exams) di kalangan pelajar sekolah tinggi dan
pelajar tahun akhir bidang perubahan untuk jangka masa 6 tahun
(Zelenik, 1983).

Berdasarkan dua contoh di atas, Sax (1989) mencadangkan bahawa ujian


dikatakan mempunyai kesahan ramalan yang boleh dianggap baik
mestilah mempunyai pekali korelasi yang sama atau lebih besar daripada
.60.
Gregory (1992) pula berpendapat bahawa sekiranya ujian itu digunakan
untuk tujuan ramalan, pengguna hendaklah membina persamaan regresi
yang boleh menggambarkan ramalan yang baik dalam konteks ramalan
garisan lurus.
Dalam contoh Ukuran Nilai Kerja yang dibincangkan sebelum ini,
sekiranya pengguna ingin menilai kesahan ramalan ujian ini, ia boleh
menggunakan prestasi kerja sebagai kriterium berhubungan yang boleh
diramal oleh nilai kerja. Secra teori, kedua-dua gagasan ini telah
dibuktikan berhubungan. Data prestasi kerja hendaklah dikumpul setelah
calon yang berjaya dipilih itu bekerja. Sebagai contoh taburan data nilai
kerja dan prestasi kerja ditunjukkan dalam Jadual 8.7. Korelasikan data
nilai kerja dengan data prestasi kerja dan pekali korelasi merupakan
petunjuk kepada kesahan ramalan.
Jadual 8.7
Data nilai Kerja dan Prestasi Kerja
Calon
1
2
3
4
5
6
7
8
9
10

Nilai Kerja
89
84
76
70
65
64
62
59
59
57

Prestasi Kerja
92
81
77
75
68
68
63
61
60
60

Korelasi data dalam Jadual 8.9 di atas boleh dianalisis dengan pakej
komputer SPSS for Windows dengan optipn formula Pearson kerana
kedua-dua data adalah jenis selanjar. Pekali kolerasi dijadikan sebagai
indeks pekali kesahan ramalan.

130

Katakanlah korelasi di antara data nilai kerja dengan prestasi kerja yang
ditunjukkan dalam Jadual 8.9 adalah positif tinggi dan signifikan r= .98
maka ini membuktikan bahawa Ukuran Nilai Kerja mempunyai kesahan
ramalan yang baik.
3.

Kesahan kriterium berhubungan

Kesahan kriterium berhubungan mempunyai kesamaan dengan kesahaan


serentak iaitu meneliti hubungan di antara gagasan yang diukur oleh ujian
itu dengan kriterium yang berhubungan dengannya, seperti nilai kerja
dengan prestasi kerja. Untuk menguji kesahan kriterium berhubungan,
Crocker & Algina (1986) mencadangkan empat langkah berikut yang
perlu dibuat. Langkah-langkah tersebut ialah:
i)
ii)
iii)
iv)
8.7.3

Mengenal pasti dan menentukan tret yang dijadikan kriteria yang


akan diukur.
Mengenal pasti dan menentukan sampel yang dapat mewakili
sampel sebenar sesuatu ujian itu digunakan.
Mentadbir ujian dan mempastikan markah setiap sampel
Menentukan darjah dan kekuatan hubungan di antara markah
ujian dengan markah kriteria dengan analisis korelasi.
Kesahan Gagasan

Pemerihalan gagasan diinferens melalui atribusi tingkah laku yang saling


berhubungan yang membina gagasan mestilah mampu menganggar
bukan sahaja tingkah laku yang boleh dijadikan inferens tetapi juga yang
terpendam berasaskan sampel tingkah laku yang terhad. Oleh kerana itu
untuk menyatakan kesahan gagasan sesuatu ujian. Gregory (1992)
menyatakan bahawa ia mestilah merujuk kepada kesesuaian inferens yang
digunakan terhadap atribusi dan tingkah laku tersebut yang sifatnya
kompleks, pelbagai tret dan berasaskan kepada teori.
Janda (1998) pula menambah adalah suatu yang kurang sesuai jika kita
melaporkan kesahan gagasan hanya dengan menggunakan satu bukti
statistik. Beliau seterusnya merumuskan bahawa langkah yang terbaik
adalah dengan menyatakan dan menunjukkan beberapa bukti yang
mempunyai pemberat untuk menyokong kesahan gagasan sesuatu ujian.
1.

Penilaian kesahan gagasan

Mengikut Messick (1989) dan Gregory 1992), ramai ahli teori


psikometrik beranggapan bahawa kesahan gagasan merupakan gabungan
kepada beberapa bukti kesahan. Kajian tentang kesahan kandungan,
kesahan criteria serentak dan kesahan ramalan merupkan bukti sokongan
yang menambahkan keupayaan kesahan gagasan sesuatu ujian.
131

Bagi mereka yang membuat ujian, bagaimanakah caranya mereka boleh


mengetahui kesahan gagasan ujian tersebut? Bagi mereka yang ingin
menilai ujian pula, apakah tata cara yang boleh digunakan untuk
mengetahui kesahan gagasan sesuatu ujian? Gregory (1992) menjelaskan
bahawa kesahan gagasan boleh diperolehi melalui impiris secara praktis
dengan meneliti markah ujian daripada kumpulan tertentu yang khusus.
Beliau menyenaraikan 6 cara yang boleh digunakan untuk meneliti
kesahan gagasan.
i)
ii)
iii)
iv)
v)
vi)

Penelitian yang menentukan sesuatu item ujian atau subskala


ujian itu seragam mengukur satu gagasan tunggal.
Penelitian yang melihat perubahan perkembangan secara tekal
dengan teori gagasan yang diukur.
Penyelidikan yang meneliti perbezaan markah mengikut
kelompok selari dengan teori yang diasaskan.
Penyelidikan yang melihat kesan inferens terhadap markah ujian
dan ia selaras dengan teori.
Kolerasi ujian tersebut dengan ujian-ujian lain yang mengukur
gagasan yang berhubungan dan juga tidak berhubungan.
Menggunakan analisis fakor.

Anda hanya diberi satu contoh kaedah menilai kesahan gagasan yang
banyak digunakan oleh penyelidik dan ia dianggap mudah kerana konsep
kesahan merujuk kepada kegunaan sesuatu ujian tersebut. Anda yang
ingin mendalami tata cara ini bolehlah merujuk kepada buku-buku yang
disenaraikan dalam bahagian rujukan.
a.

Kolerasi dengan ujian lain

Method yang paling banyak digunakan adalah dengan menunjukkan


korelasi sesuatu ujian yang dinilai dengan ujian lain yang dikatakan
mengukur gagasan atau tingkah laku yang sama, berkaitan dan relevan.
Sebagai contoh, Janda (1998) menunjukkan kolerasi di antara empat ujian
yang dikatakan mengukur kecerdasan, iaitu:
i)
ii)
iii)
iv)

Ujian Wechsler Adult Intelligence Scale-Revised (WAIS-R) yang


dikatakan mengukur kecerdasan;
General Abilitiess Test (GAT) yang dikatakan mengukur
kebolehan umum;
Scholastic Aptitute Tst (SAT) yang dikatakan mengukur bakat;
dan
Grade Point Average (GPA) yang merupakan prestasi akademik
yang ditunjukkan oleh purata gred secara kumulatif.

132

Keempat-empat gagasan tersebut secara teorinya memanglah telah


dibuktikan berhubungan di antara satu dengan yang lain. Keputusan
kolerasi yang dibuat oleh Janda (1998) ditunjukkan dalam Jadual 8.8
berikut.
Jadual 8.8
Kolerasi Matrik Alat Ukuran
Alat Ukuran
WAIS-R
GAT
SAT
GPA

WAIS-R
.78
.66
.26

GAT

SAT

GPA

.72
.28

.31

Janda (1998) telah menunjukkan bahawa terbuktilah ukuran kecerdasan


WAIS-R mempunyai kesahan gagasan kerana korelasinya dengan ukuran
GAT adalah tinggi dan signifikan .78. Seterusnya Janda (1998)
menunjukkan korelasi di antara subskala dalam GAT dengan subskala
yang ada pada WAIS-R seperti ditunjukkan dalam Jadual 8.9.
Jadual 8.9
Kolerasi antara Subskala GAT dengan Subskala WAIS-R
Subskala WAIS-R
Subskala GAT
Analogi
Informasi
Matematik
Perkataan

Informasi
.55
.74
.48
.58

Matematik
.42
.38
.79
.46

Kata-Kata
.68
.51
.45
.71

Kolerasi yang tinggi di antara subskala informasi GAT dengan subskala


informasi WIAS-R (.74) adalah bukti bahawa kedua-dua subskala
tersebut mengukur gagasan yang sama. Ini menunjukkan ukuran WAISR mempunyai kesahan gagasan yang baik. Begitu juga subskala informasi
bagi ukuran GAT.
8.8

KEBOLEHPERCAYAAN DAN KESAHAN UJIAN

Setelah anda didedahkan dengan konsep kebolehpercayaan dan kesahan


serta beberapa tata cara untuk tata cara untuk meneliti kedua-dua isu ini,
sudah tentu timbul persoalan tentang kaitan di antara kedua-duanya.
Anda sebagai pengguna ujian dan penyelidik sudah tentunya ingin
menggunakan suatu ujian yang sah dan sekaligus boleh dipercayai. Oleh
kerana itu konsep kebolehpercayaan dan kesahan saling mempunyai
hubungan.

133

Ujian yang sah diguna pakai mestilah terlebih dahulu mempunyai


kebolehpercayaan yang baik. Samalah juga seperti seorang manusia yang
disahkan baik ia mestilah seorang yang boleh dipercayai.
Secara matematik dan analogi, peratus varians sebenar digunakan untuk
meneliti hubungan di antara kebolehpercayaan dan kesahan. Semakin
besar peratus varians sebenar, maka semakin tinggi kesahan ujian
tersebut kerana ia mempunyai ralat yang kecil. Sebaliknya jika peratus
ralat varians besar, peratus sebenar menjadi kecil, maka rendahlah
kesahan ujian itu.
SOALAN DALAM TEKS 8.2

1.

Terangkan dengan ringkas dan tepat beberapa


konsep berikut:
a)
b)
c)

2.

Pekali kesahan kandungan


Kesahan lahiriah
Jadual spesfikasi

Bandingkan dengan ringkas kesahan kriteriium


serentak dan kesahan ramalan. Apakah perbezaan
yang ketara di antara dua jenis kesahan ini.

Semak jawapan anda di akhir bab ini.


8.9

KESIMPULAN

Bab ini telah membincangkan dua isu penting dalam ujian ataupun dalam
aspek psikometrik iaitu kebolehpercayaan dan kesahan. Kedua-dua isu ini
penting dalam penyelidikan. Hanya data dan maklumat yang boleh
dipercayai sahaja boleh dipertanggungjawab oleh penyelidik yang
tentunya datang dari alat ukuran atau ujian yang sah. Kedua-dua isu ini
jika dapat dipertahankan, maka kita sebagai penyelidik berjaya dalam
semua bentuk penyelidik. Lebih-lebih lagi jika keputusan daripada
penyelidik itu ingin dijadikan asas dan dasar untuk pembuatan
keputusan. Dalam bidang sains sosial ia amat wajar dipertahankan.
Tambahan pula bagi ahli psikologi yang ingin membuat keputusan
terhadap tingkah laku secara umum dan terhadap manusia itu sendiri
secara khusus. Keputusan penyelidikan yang dibuat daripada datanya dan
maklumat yang tidak boleh dipercayai dan tidak sah terlalu besar kos
yang perlu ditanggung.
134

SOALAN PENILAIAN KENDIRI

1.

Berikut merupakan data yang diperolehi daripada 10 orang subjek


yang mengambil ujian. Ujian tersebut mengandungi 6 item dan
menggunakan jawapan format Likert 7 pilihan.
Item
Subjek
1
2
3
4
5
6
7
8
9
10
i)

2.

1
6
1
3
6
7
1
5
6
7
3

2
7
5
3
6
5
2
5
7
7
3

3
5
5
2
2
2
3
3
2
7
2

4
3
1
2
1
1
2
4
1
5
3

5
3
1
1
4
5
1
2
1
5
6

6
4
2
1
5
7
4
2
2
7
6

Berdasarkan data di atas


Kira pekali alfa dan terangkan keputusannya.
a)
Kira pekali bahagi dua dan terangkan
b)
keputusannya

Berikut merupakan taburan data personaliti asertif 10 orang


pelajar yang mengikuti program Pembinaan Sahsiah. Markah pra
dan pasca program dikutip. Kira pekali kebolehpercayaan ujian
yang sesuai dan bincangkan keputusannya.
Subjek
1
2
3
4
5
6
7
8
9
10

Praprogram
26
28
30
32
33
33
34
37
38
40

135

Pasca program
27
31
32
32
35
26
39
38
40
45

3.

Berikut merupakan taburan data penghargaan kendiri dan data


kemurungan 10 orang subjek kajian.
Subjek
1
2
3
4
5
6
7
8
9
10

Praprogram
26
28
30
32
33
33
34
37
38
40

Pasca program
27
31
32
32
35
26
39
38
40
45

i)

Berdasarkan data di atas, anda diminta menjawab soalan


berikut:
Apakah jenis kesahan yang anda boleh
a)
bincangkan
Kira pekali korelasi di antara pemboleh ubah
b)
penghargaan kendiri dengan kemurungan dan
terangkan keputusannya.
Daripada nilai pekali korelasi yang anda kira di
c)
atas, terangkan bagaimanakah kesahan ujian
kemurungan yang digunakan dalam penyelidikan
ini.

ii)

Terangkan berbagai-bagai langkah yang boleh anda


gunakan jika anda ingin mempastikan kesahan ujian yang
anda guna dalam penyelidikan latihan ilmiah anda.
Semak jawapan anda di akhir modul kursus ini.
JAWAPAN SOALAN DALAM TEKS

SDT 8.1

1.

a.

Metod pekali alfa diperkenalkan oleh Cronbach pada


tahun 1951. Pekali kebolehpercayaan dinama sebagai alfa.
Ia dikira daripada data yang diperolehi dalam satu
tadbiran ujian. Metod pekali alfa sesuai digunakan kepada
ujian yang menggunakan format jawapan pelbagai pilihan.
Ia mengambarkan keseragaman item-item dan ketekalan
dalaman item-item tersebut mengukur satu gagasan
tingkah laku.
136

2.

b.

Kebolehpercayaan ujian kembali menunjukkan kestabilan


markah ujian dan tindak balas mengikut masa dan
keadaan. Pekali kebolehpercayaan dikira dengan
membuat korelasi di antara markah yang diperolehi dalam
ujian pertama dengan markah ujian kedua di kalangan
individu yang sama mengambil ujian tersebut. Markah
yang diperolehi dalam ujian pertama sepatutnya stabil
dengan markah yang dicapainya dalam ujian kedua.
Kebolehpercayaan ini bertujuan kestabilan data ujian.

c.

Metod
bahagi
digunakan
untuk
meneliti
kebolehpercayaan data dari segi ketakalan dalaman. Item
ujian dibahagikan kepada dua bahagian secara seimbang
atau selari. Perkara penting yang perlu diawasi semasa
membahagikan item kepada dua bahagian ialah dengan
memastikan kedua-dua bahagian itu seragam.
Pembahagian item boleh dibuat dengan cara mengambil
item nombor ganjil dan nombor genap. Markah item
genap dan ganjil dikorelasikan dan ia menjadi petunjuk
kepada kebolehpercayaan bahagi dua. Namun, nilai pekali
kolerasi perlu diperbaiki dengan formula Spearman
Brown.

d.

Formula Kuder Richardson digunakan untuk


menganggar kebolehpercayaan apabila jawapan kepada
item ujian menggunakan format binary seperti YA atau
TIDAK, SALAH atau BENAR, Ia dicadangkan Kuder
dan Richardson (1937) dengan jua jenis formula yang
terkenal dengan nama KR20 dan KR21. Kegunaannya
sama sepertti pekali alfa iaitu bagi menggambarkan
ketekalan dalaman dan keseragaman item-item.

Metod ketekalan dalaman menganggar kebolehpercayaan markah


berdasarkan item-item yang terdapat dalam set ujian yang
ditadbirkan dalam satu satu sesi. Ketekalan dalaman merujuk
kepada keseragaman item-item mengukur satu gagasan yang
sama. Sebaliknya kebolehpercayaan untuk meneliti kestabilan,
meneliti markah ujian dan tindak balas mengikut masa dan
keadaan. Kestabilan markah ditunjukkan oleh nilai pekali kolerasi
di antara markah yang diperolehi dalam ujian pertama dengan
markah yang dicapai dalam ujian kedua.

137

SDT 8.2

1.

2.

a.

Pekali kesahan kandungan merupakan indeks bagi


menunjukkan darjah persetujuan di antara pakar pertama dan
pakar kedua semasa menilai item dan soalan ujian.
Persetujuan yang diperolehi ialah darjah kesuaian item itu
mengukur kandungan yang diukur oleh item tersebut.
Semakin tinggi nilai pekali kesahan, maka ujian itu dikatakan
mempunyai kesahan kandungan yang baik.

b.

Kesahan lahiriah merupakan pertimbangan subjektif pakar


ujian yang merumuskan bahawa sesuatu ujian itu dikatakan
baik dan sah mengukur apa yang sepatutnya diukur. Ia
merupakan penilaian awal yang perlu dibuat sebelum
menggunakan sesuatu ujian. Selepas kesahan lahiriah dikenal
pasti, pengguna mestilah membuat penilaian lanjut yang lebih
mendalam berhubung dengan kandungan ujian dan aspekaspek-aspek yang lain.

c.

Jadual spesifikasi ujian digunakan untuk menilai kesahan


kandungan Jadual spesifikasi mengandungi aspek atau
subskala yang diukur dan aras pengetahuan yang diukur.
Dalam jadual tersebut, terkandung bilangan item atau soalan
bagi setiap aspek yang sepatutnya terkandung dalam proses
pembelajaran yang diukur oleh ujian yang dinilai.

Kesahan kriterium serentak merujuk kepada sejauhmanakah


hubungan markah sesuatu ujian yang dinilai dengan kriteria yang
diukur secara serentak. Sebagai contoh kira menilai Ukuran Nilai
Kerja dan menggunakan markah prestasi sebagai kriterium. Data
ujian tersebut ditadbirkan dan secara serentak mengumpul data
prestasi. Kedua-dua data itu korelasikan. Korelasi dua markah
tersebut menrupakan petunjuk kepada kesahan kriterium serentak.
Kesahan ramalan pula digunakan untuk meramal ketepatan
kegunaan dan peranan ujian yang dinilai dan mampu mengukur
tingkah laku masa depan. Ukuran Nilai Kerja akan dikatakan
mempunyai kesahan ramalan jika data nilai kerja dapat meramal
prestasi kerja yang dikumpul pada waktu yang lain selepas
terkumpulnya data nilai kerja. Hubungan kedua-dua markah ini
boleh dianalisis dengan korelasi. Sebaik-baik analisis jika anda
mampu ialah analisis Regresi.

138

You might also like