GS3073– Pengukuran Dan Penilaian Dalam Pendidikan

TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN
Menurut Mokhtar (1995), reliabiliti ujian boleh disebut sebagai darjah
ketekalan antara dua pengukuran terhadap sesuatu benda, sesuatu ciri, atau sifat
seseorang.
Secara umum, kesilapan angkubah pengukuran adalah banyak terdapat dalam skor
ujian dalam pendidikan (atau, dengan kata lain, ujian pendidikan cenderung kepada tidak
reliabel) melainkan kerja yang lebih berhati-hati dilakukan bagi menentukan aras
reliabiliti yang diterima (Martuza, 1977). Ini menunjukkan bahawa reliabiliti bukan
sahaja skor yang sama didapati walaupun orang lain yang menilainya, tetapi jika kita
harus memberikan skor yang sama juga walaupun kita menilai pada masa yang berbeza.
Fakta mengenai reliabiliti rendah memeriksa kertas peperiksaan secara individu
telah ditunjukkan oleh Dicker (1973), yang menemukan bahawa pekali korelasi hanya
0.46 apabila 24 guru memeriksa sekali dan kemudian diperiksa semula selepas tiga bulan.
Aschersleben (1971) menganalisis pemeriksaan oleh 24 guru ke atas 623 pelajar dalam
empat ujian matematik yang bersiri dan empat ujian ‘dictation’. Beliau mendapati
kebanyakan korelasi adalah di bawah 0.60, dengan kertas matematik menunjukkan,
secara purata, nilai lebih kecil (Ingenkamp, 1977). Ini menunjukkan bahawa pemeriksaan
seseorang pemeriksa bukan sahaja tidak tekal tetapi amat berbeza di antara seorang
pemeriksa dengan pemeriksa lain. Dengan kata lain pemeriksaan mereka mempunyai
reliabiliti yang rendah.
Kebolehpercayaan sesuatu ujian merujuk kepada ketekalan, ketepatan, dan
kebolehbergantungan ujian berkenaan. Ini bermaksud sesuatu ujian yang boleh dipercayai
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
1
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
akan menghasilkan maklumat yang tekal (merujuk kepada beberapa pentadbiran ujian
yang telah dijalankan), tepat seperti yang sepatutnya serta boleh diterima pakai tanpa
keraguan.
Pada kebiasaannya , sesuatu ukuran itu tidak lepas daripada ralat (error). Ini amat
ketara dalam prestasi fizikal. Jauh lompatan seseorang misalnya, tidak sentiasa sama
kerana pengaruh halaju angin keadaan fizikalnya, keadaan atau jenis kasut yang dipakai,
latihan, larian atau sebagainya. Sedangkan berat seseorang pun boleh berubah dalam satu
hari disebabkan oleh pakaiannya, kenyang laparnya dan lain-lain.
Indeks kebolehpercayaan digunakan untuk menunjukkan ketekalan sesuatu ujian.
Indeks ini ditentukan dengan menggunakan kaedah korelasi antara dua set markat ujian.
Dua set markat boleh diperolehi dengan menggunakan 3 kaedah iaitu;
i. Kaedah uji dan uji kembali ( Uji – Ulang -Uji)
ii. Kaedah Ujian Bentuk Setara.
iii. Kaedah Ujian Bahagi Dua.
Sekurang-kurangnya indeks kebolehpercayaan 0.60 diperlukan bagi memastikan
ujian yang dibina boleh dipercayai.
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
2
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
Kaedah Uji dan Uji Kembali (Uji-Ulang- Uji)
Sesuatu pengukuran itu apabila diulangi dan jika dengan keputusan yang sama
merupakan pengukuran yang boleh dipercayai. Oleh yang demikian korelasi di antara
skor ujian dengan skor ulang-uji dianggap sebagai satu anggaran kebolehpercayaan ujian
yang diukur. Ukuran yang boleh diulangi dengan keputusan yang sama adalah sangat
bermakna dan ukuran itu dianggap stabil. Oleh itu korelasi uji-ulang- uji dirujukkan
sebagai satu indeks atau koefisien stabiliti.
Dalam penggunaan kaedah uji-ulang- uji dua faktor yang patut diambil kira, iaitu
tempoh masa antara uji dan ulang-uji dan kestabilan pembolehubah yang berkenaan . Ini
akan dihuraikan dengan menggunakan persamaan-persamaan dalam model matematik.
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
3
2 2 2
S = S + S
p b s
( C )
S
S
r ·
2
2
p
b
( D )
S
S
r − ·1
2
2
s
p
( E )
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
Faktor ingatan memainkan peranan yang besar dalam anggaran
kebolehpercayaan lebih-lebih lagi kalau tempoh masa antara uji dan ulang uji itu adalah
singkat. Ingatan calon-calon akan membesarkan
iaitu kepada bahagian dalam persamaan ( C )

Jika ini berlaku nilai akan menjadi lebih besar daripada apa yang
sebenarnya. Ini menyebabkan nilai r yang diperoleh , satu anggaran yang lebih
tinggi . Nilai anggaran yang tinggi ini boleh dikurangkan kalau tempoh masa antara uji
dan ulang-uji itu dipanjangkan. Kalau masa antara uji-ulang- uji panjang, faktor yang
kedua menjadi penting, iaitu turun naik skor benar.

Turun naik skor benar bagi sesuatu pembolehubah bergantung kepada stabilitinya
. Pembolehubah afektif atau personaliti misalnya, konsep diri, bimbingan dan sebagainya
berubah semakin banyak apabila tempoh masa antara dua pengukurannya semakin lama.
Pembolehubah domain kognitif adalah lebih stabil tetapi akan juga mengalami perubahan
dengan peredaran masa. Maka boleh dikatakan secara am, kalau tempoh masa antara uji
dan ulang-uji itu adalah panjang varians turun naik skor benar diukur sebagai varians
selisihan, ini adalah satu kesilapan. Oleh yang demikian dalam
persamaan ( E ) telah menjadi lebih besar daripada yang sebenarnya. Akibat r yang
didapati telah menjadi kurang besar daripada yang sebenarnya atau satu satu anggapan
yang agak kurang. Kesan stabiliti atas anggaran kebolehpercayaan dapat diminimunkan
dengan memendekkan tempoh masa antara uji dan ulang-uji.
Boleh dikatakan bahawa kesan ingatan dan kesan turun naik skor benar adalah
dua perkara bertentangan dan satu imbangan antara kedua-dua faktor itu patut dicapai
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
4
2
S
2
S
b
2
S
p
2
S
s
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
dalam menentukan masa di antara uji dan ulang-uji. Di samping itu stabiliti
pembolehubah yang berkenaan juga perlu dipertimbangkan. Ujian yang tinggi tahap
kebolehpercayaannya boleh digunakan untuk mengukur pembolehubah yang kurang
stabil. Misalnya, pembaris adalah boleh dipercayai tetapi jarak yang dilompat oleh
seseorang juga berubah dengan beberapa kali lompatan.Kalau kaedah uji -ulang-uji itu
digunakan, tempoh masa di antara uji dan ulang-uji itu harus dinyatakan secara eksplisit.
Untuk ujian praktikal beberapa bantahan umum telah dibangkitkan tentang uji ulang-uji.
Di antaranya ialah:
i. Ujian hanyalah merupakan satu sampel daripada populasi item. Kalau
sampel lain digunakanan bagaimana pula keputusannya?
ii. Ujian pertama sudah pasti mempengaruhi ulang-uji. Oleh itu kesannya
didapati kurang jelas.
iii. Kalau tempoh masa di antara uji dan ulang-uji itu adalah panjang,
selisihan telah dikelirukan dengan pembelajaran atau perkembangan
personaliti individu yang diukur.
iv. Uji ulang-uji tidak menarik kepada semua pihak termasuk calon ujian.
Minat calon akan menurun dalam ujian ulangan. Apakah makna kesan itu?
v. Ulang-uji memerlukan masa , kerja dan perbelanjaan tambahan.
Walaubagaimanapun kaedah uji-ulang-uji masih popular digunakan sebagai
kaedah menganggarkan kebolehpercayaan khususnya untuk ujian terstandard.
Akan tetapi kaedah ini jarang atau tidak langsung digunakan dalam sekolah.
Kalau digunakan di sekolah hanya item-item spesifik sahaja yang digunakan.
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
5
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
Kaedah Ujian Setara.
Kaedah ujiian setara ini menggunakan prosedur yang sama dengan kaedah uji
ulang-uji. Yang berlainan sedikit ialah ujian yang digunakan dalam ulang -uji
ialah ujian setara. Ujian setara bolehlah dianggap sebagai satu persampelan
daripada populasi item yang sama. Item-item daripada ujian setara ini mempunyai
aras kesukaran yang sama , dan seharusnya juga mengukur pembolehubah yang
sama. Di samping itu semua arahan, cara pentadbiran ujian, cara respondan
sebagainya adalah sama untuk semua ujian setara. Walaupun ujian setara
mengukur pembolehubah yang sama , ujian itu dibentuk sebegitu rupa supaya
kesan dari ujian yang pertama tidak akan mempengaruhi keputusan ujian setara,
yakni ujian yang kedua. Salah satu langkah untuk menjamin hasrat ini ialah
dengan mengubah susunan item-item dalam ujian tersebut. Bahasa yang
digunakan dalam ujian setara itu juga perlu diubahsuai.
Tiga indeks statistik yang penting dan biasa digunakan untuk menguji
sama ada ujian itu setara atau tidak ialah min, varians, dan korelasi. Andainya dua
ujian atau lebih itu dikatakan ketara maka seharusnya min, varians, dan korelasi
antara ujian itu sama sahaja. Sifat-sifat ini adalah diandaikan benar, lebih-lebih
lagi jika ujian-ujian setara dianggap sebagai ujian –ujian yang mempunyai
bilangan item yang sama dan item-item itu dipilih secara rawak daripada satu
populasi item. Ini bermakna ujian-ujian itu adalah ujian-ujian setara secara rawak.
Sifat-sifat ujian jenis ini diringkaskan sebagai ;
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
6
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
Untuk ujian setara U1 U2 . . . Un dan U1 = ujian pertama dan seterusnya.
= = . . . = Min sama
= = . . . = Varians sama
r ui uj = tetap Korelasi sama untuk semua ujian Ui dan Uj
Korelasi di antara dua keputusan daripada dua ujian setara digunakan sebagai anggaran
kebolehpercayaan ujian-ujian itu Kadang-kadang korelasi ini dianggap sebagai satu
ukuran tentang kesetaraan di antara dua ujian setara. Oleh itu, korelasi di antara dua ujian
yang setara disebut juga koefisien samaan.
Terdapat juga satu lagi jenis ujian setara yang berlainan sedikit. Ujian setara
berpadan yang mempunyai semua sifat di atas termasuk ciri tiap-tiap item dalam satu
ujian setara berpadan yang dipadankan dengan yang sama isi dari ujian asal.
Sama seperti kaedah uji –ulang-uji, kaedah ujian setara juga menghadapi
beberapa bantahan yang agak serupa. Biasanya ujian setara juga tidak dipraktikkan di
sekolah untuk tujuan mencari kebolehpercayaan. Mungkin keperluan itu tidak dirasai
pada masa kini.
Kaedah Ujian Bahagi Dua.
Untuk menggangarkan kebolehpercayaan , kita menggunakan koefisien korelasi.
Ini memerlukan ujian dua kali. Kaedah uji-ulang-uji dan ujian setara pada dasarnya
memenuhi keperluan ini tetapi kaedah-kaedah itu menghadapi banyak bantahan. Kaedah
ujian bahagi dua diwujudkan untuk mengatasi bantahan-bantahan itu dan telah menjadi
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
7
M
U
1

M
U
2

M
U
n

2
S
U
1

2
S
U
2

2
S
U
n

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
kaedah biasa dan selalu digunakan untuk menggangarkan kebolehpercayaan . Dalam
kaedah ini prinsip-prinsip pengujian dua kali dipenuhi dengan membahagikan satu ujian
kepada dua ujian setara yang sama panjangnya. Bilangan item dalam setiap separuh ujian
itu adalah setengah bilangan item daripada ujian asal. Dengan itu calon-calon tidak perlu
mengambil dua ujian sama atau diuji dua kali dalam perkara yang sama. Perbelanjaan,
tenaga kerja dan masa tambahan tidak diperlukan lagi. Hanya ada satu kelemahan kecil
yang ditemui. Kebolehpercayaan yang didapati ialah untuk ujian yang panjangnya adalah
setengah daripada ujian asal. Tetapi anggaran kebolehpercayaan ujian asal itu dapat
dikirakan dengan menggunakan formula Spearman-Brown.
Ujian boleh dibahagikan kepada dua ujian pendek yang setara dengan mudah.
Kedua-dua ujian setara itu haruslah memenuhi tiga sifat yang disebutkan . Kalau sesuatu
ujian asal itu adalah sejenis, yakni semua butir adalah mengukur trait yang sama , maka
ujian asal boleh dibahagikan kepada ujian separuh bahagian yang atas dan ujian separuh
bahagian yang bawah. Misalnya bagi ujian yang mempunyai 24 item, item nombor 1
hingga 12 menjadi ujian separuh atas dan item nombor 13 hingga 24 menjadi ujian
separuh bawah. Ujian asal boleh dibahagikan kepada dua separuh berdasarkan item
ganjil-genap. Dengan menggunakan contoh tadi, item nombor 1,3,5…23 termasuk dalam
separuh ganjil dan item nombor 2,4,6….24 termasuk dalam separuh genap. Lain-lain
kombinasi boleh juga digunakan kalau sekiranya bilangan item dalam dua separuh ujian
itu adalah sama.
Jikalau item-item ujian itu tidak sejenis, atau tidak sama aras kesukaran serta
kuasa diskriminasi , susunan item-item dalam ujian asal harus disusun semula mengikut
kesukaran item. Kemudian susunan baru ini digunakan sebagai asas dalam pembahagian
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
8
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
ujian kepada dua separuh yang sama dengan cara item ganjil-genap. Ini menjamin yang
kedua-dua ujian separuh itu mempunyai min dan varians yang sama.
Untuk ujian aneka jenis (item-itemnya beraneka jenis dalam isi) kedua-dua ujian
separuh yang dipilih harus setara dan sepadan. Ini bermakna bahawa ujian-ujian separuh
itu berpadan dalam isi dan aras kesukaran.
Satu contoh pengiraan kebolehpercayaan dengan menggunakan kaedah ujian
bahagi dua adalah seperti berikut. Katakan lima orang murid mengambil ujian dan skor-
kor yang diperoleh adalah seperti berikut:
JADUAL 1
Markah untuk lima pelajar dalam ujian (hipotetikal)
PELAJAR
A B C D E
1 Jumlah markah untuk item ganjil (x) 1 2 3 4 5
2 Jumlah markah untuk item genap (y) 2 1 5 3 4
3 Perbezaan (x – y ) -1 1 -2 1 1
4 Jumlah ( x + y ) 3 3 8 7 9
Mengaplikasikan cara hasil darab momen ( atas baris 1 dan 2 ) korelasi untuk ujian
separuh ( r1 ) = 0.6
Selepas menggunakan formula Spearman-Brown korelasi untuk ujian penuh :
r2 =

= 0.75
Keputusan : Kebolehpercayaan ujian itu adalah 0.75
Satu interpretasi dari sudut yang berlainan terhadap kolerasi yang diperoleh daripada
kaedah ini ialah kita menganggapkan yang korelasi ini mencerminkan ‘ketekalan dalam’
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
9
6 . 0 1
6 . 0 2
+
×
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
ujian. Kaedah Rulon (1939) ialah satu lagi cara yang boleh mengganggarkan ‘ketekalan
dalam’ seperti kaedah bahagi dua.Di sini satu andaian khas dibuat oleh Rulon tentang
varians selisihan.Rulon berpendapat bahawa perbezaan antara markah-markah dua ujian
separuh menunjukkan amaun selisihan, pengukuran, jadi varians perbezaan di antara dua
ujian separuh itu adalah sama dengan varians selisihan. Contoh:
= Varians perbezaan antara dua ujian separuh.
=
Kemudian kebolehpercayaan r ditakrif sebagai,
Merujuk kepada Jadual 1
dan
dapat dikira dengan menggunakan data dalam baris 3 dan 4
Keputusan : =
25
160
dan =
25
40
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
10
2
S
s

2
S
(x-y)


2
2
p
s
2
2
(x-y)
(x-y)
(x+y
)
2
S
(x+y)

2
S
(x-y)

2
S
(x + y)

2
S
(x - y)

2
S
(x-y)

2
S
(x+y)

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
Dan r = 1 -
25 / 160
25 / 40
= 0.75
Yang menarik di sini ialah , walaupun Rulon menggunakan kaedah yang
berlainan tetapi r yang diperoleh adalah sama dengan nilai r yang dikira dengan cara
ujian bahagi dua ( r = 0.75) .
Kaedah Guttman pula adalah satu kaedah yang berasaskan kaedah Rulon .
Caranya memudahkan pengiraan . Guttman dalam tahun 1945 dengan menggunakan
prinsip dan andaian cara Rulon telah mendapatkan formula bahawa kebolehpercayan satu
ujian dapat dirumuskan seperti berikut:
R = 2 [1 – ]
Kalau data dalam Jadual 1 digunakan maka
R = 2 [1 – ]

2 = [
8
5
]
= 0.75
Perhatikan di sini bahawa prosedur yang digunakan dalam kaedah cantuman ini
adalah lebih mudah daripada kaedah Rulon. Ini disebabkan perbezaan di antara kedua-
dua ujian separuh tidak diperlukan lagi. Keputusan yang didapati secara ini juga sama
dengan yang diperoleh dengan cara Rulon dan cara ujian bahagi dua. Ini berlaku kalau
varians kedua-dua ujian separuh adalah sama seperti dalam contoh ini. Dalam ujian
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
11
2 + 2

2 2
(S + S)
X y

2
S
X + y
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
apabila varians tidak sama , r dari cara ujian bahagi dua dan cara Guttman adalah sama
dan kedua-duanya lebih daripada r yang diperoleh dari cara Rulon. Tetapi pada lazimnya
perbezaan di antara r yang didapati dari tiga cara itu adalah kecil sahaja.
Kaedah Kuder – Richardson
Dalam kaedah ujian bahagi dua, ujian dibahagi kepada dua separuh ujian setara.
Prinsip ini dapat digunakan untuk membahagikan suatu ujian kepada beberapa ujian yang
setara yang mana bilangannya adalah sama dengan bilangan item yang terdapat dalam
ujian itu. Di sini tiap-tiap item itu dianggap sebagai suatu ujian. Kalau begitu ujian yang
mempunyai 100 item bolehlah dibahagikan kepada 100 ujian kecil yang setara. Kuder
dan Richardson dalam tahun 1937 dengan membuat beberapa andaian telah mencipta satu
cara baru untuk menganggarkan kebolehpercayaan suatu ujian. Cara ini dianggap lebih
teknikal daripada cara lain. Kaedah ini juga popular untuk menganggarkan
kebolehpercayaan dalam penyelidikan dan pembentukan ujian standard.
Andaian-andaian yang perlu dibuat untuk kaedah Kuder-Richardson adalah
seperti berikut:
i. Tiap-tiap item itu dianggap sebagai satu ujian setara.
ii. Semua korelasi di antara item-item itu adalah sama.
Mengikut Kuder dan Richardson kebolehpercayaan suatu ujian boleh dianggarkan
dengan formula berikut:
Kebolehpercayaan r =
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
12

n = bilangan items
i
S
2
= varians item i
p
S
2
= varians jumlah skor
dan varians perhatikan
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
Dan kalau hanya dua kemungkinan boleh terjadi bagi tiap-tiap item
( misalnya : betul = 1 , salah = 0)
Maka r =
Kedua-dua formula ini disebut formula KR-20.
Tetapi , jika diandaikan bahawa tiap-tiap item mempunyai kekerapan jawapan yang betul
/ salah yang sama ( iaitu p
i
= p
j
) atau aras kesukaran tiap-tiap item adalah sama , maka

n
i
q
i
p
1
= n p q , p = min
i
p
, q = min
i
q
Kemudian
r
=
1 − n
n

·
`

.
|

p
S
q p n
p
S
2
2
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
13

p
i
= perkadaran betul ( 1) untuk butir i
q
i
= perkadaran salah (0) untuk butir i
n = bilangan butir
M = Min
p
S
2
= varians perhatikan
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
Atau =

·
`

.
|


p
S
n
M
n
n
2
2
1
1
Formula ini disebutkan formula KR-21
Contoh kiraan: Ujian mempunyai 10 butir objektif p = 0.6 bermakna 0.6 bilangan murid
menjawab betul.
Maka q = 0.4 bermakna 0.4 bilangan murid menjawab salah.
Butir 1 2 3 4 5 6 7 8 9 10
Perkadaran
i
p
0.7 0.8 0.8 0.8 0.6 0.6 0.7 0.7 0.6 0.7
Jawapan betul
Perkadaran
i
q
0.3 0.2 0.2 0.2 0.4 0.4 0.3 0.3 0.4 0.3
Jawapan salah
i
p

i
q
0.21 0.16 0.16 0.16 0.24 0.24 0.21 0.21 0.24 0.21
Maka

10
1
i
q
i
p
= 2.04, p =0.7, q = 0.3
Kalau
p
S
2
= 6 (katakan)
Maka

·
`

.
|


·

p
S
i
q
i
p
n
n
r
2
1
1
10
1
KR-20
=
·
`

.
|

6
04 . 2
1
9
10
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
14
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
= ( ) 34 . 0 1
9
10

=0.733
Kalau data yang sama digunakan untuk KR-21

·
`

.
|


·
p
S
q p n
n
n
r
2
1
1
=
]
]
]

·
`

.
| × ×

6
3 . 0 7 . 0 10
1
9
10
=
·
`

.
|

6
1 . 2
1
9
10
= ( ) 35 . 0 1
9
10

=0.722
Perhatikan bahawa r dikira dengan KR-20 dan KR-21 adalah hampir sama. Ini adalah
disebabkan andaian ∑
n
i
q
i
p
= q p n telah dipenuhi.
Ringkasan
Bagi menganggarkan kebolehpercayaan ujian dua faktor harus diambil kira, faktor
pertama ialah jenis ujian, sama ada ujian itu terdiri daripada item aneka jenis atau sejenis.
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
15
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
Faktor kedua ialah tentang aspek kebolehpercayaan yang ditegaskan atau dipersoalkan,
iaitu sama ada stabiliti atau ketepatan atau ketekalan dalam ? Oleh sebab
kebolehpercayan merupakan sesuatu yang relatif dan juga berbeza-beza dari masa ke
semasa, situasi dan populasi, adalah lebih baik jika kebolehpercayaan ujian itu
didapatkan dengan cara yang berlainan. Maka untuk kegunaan penyelidikan dan ujian
terstandard yang mana skor benar diutamakan, ujian yang digunakan haruslah
mempunyai kebolehpercayaan dari berbagai-bagai aspek. Selain itu kebolehpercayaan
mestilah dikemaskinikan dari semasa ke semasa. Ini dibuat untuk menjamin bahawa
kebolehpercayaan itu masih boleh di pakai dengan penuh keyakinan pada masa ujian itu
digunakan.
Sebagai panduan jadual 2 memberikan cara untuk mendapatkan kebolehpercayaan
yang sesuai dengan jenis ujian dan aspek kebolehpercayaan yang terlibat.
Cara kebolehpercayaan untuk jenis-jenis ujian dan aspek kebolehpercayaan.
Aspek
kebolehpercayaan
Ujian sejenis Ujian aneka jenis
Ketepatan dan stabiliti Uji-ulang-uji Uji-ulang-uji
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
16
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
Markat benar - -
ketepatan Ujian setara KR20
Ketekalan dalam Ujian bahagi dua Rulon,
Guttman, KR20, KR21
Ujian bahagi dua berpadan.
Seperkara yang penting yang perlu dipersoalkan ialah tentang saiz, koefisien
kebolehpercayaan yang diperoleh daripada mana-mana ujian. Berapakah nilai yang boleh
dianggap sebagai r yang boleh diterima ?
Sebenarnya tiada jawapan yang lengkap dan memuaskan dapat diberi bagi persoalan
tersebut akan tetapi , di kalangan ujian yang sah ujian yang mempunyai indeks
kebolehpercayan terbesar merupakan ujian yang lebih diutamakan dan menjadi pilihan.
Ini juga bergantung kepada kegunaan maklumat yang diperoleh daripada ujian itu.
Pengguna maklumat atau ujian menentukan taraf kejituan yang dikehendaki dan memilih
ujian yang sesuai untuk tujuannya. Biasanya untuk pengukuran dan membuat keputusan
tentang seorang individu ujian yang mempunyai kenolehpercayaan ( r ) yang kurang
daripada 0.75 adalah kurang memuaskan . tetapi dalam kes lain untuk tujuan ramalan satu
kumpulan yang saiznya lebih daripada 25 ( n = 25)r = 0.3 mungkin boleh diterima.
Walaubagaimanapun pembolehubah kognitif seperti kecerdasan , pencapaian akademik,
nilai r haruslah lebih daripada 0.8 dan untuk pembolehubah personaliti dan afektif seperti
motivasi bimbingan , konsep-diri, nilai r = 0.5 bolehlah dianggap sebagai memuaskan.
Akhir kata, ujian yang mempunyai kebolehpercayaan tinggi boleh dianggap hanya
mengukur apa yang ujian itu mengukur dengan tepat. Tetapi ujian itu tidak semestinya
mengukur apa yang harus diukur. Dengan kata lain kebolehpercayaan tidak semestinya
bermakna keesahan tetapi keesahan mengimplikasikan kebolehpercayaan.
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
17
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
Rujukan Istilah:
Bibliografi
Krynock, K. & Robb, L. (1996). Is problem-based learning a problem for your
curriculum? Illinois School Research and Development Journal, 33(1), 21 – 24.
Lee Shok Mee dan Mook Soon Sang (1989). Pengujian dan penilaian dalam pendidikan,
Kuala Lumpur : Kumpulan Budiman
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
18
Korelasi= hubungan atau kaitan secara timbal balik
Kamus .Dewan m/s 707
Varians= sesuatu yang menyimpang atau berlainan daripada yang
lazim atau standard, kelainan; bentuk atau ejaan yang
berlainan bagi perkataan yang sama.
Kamus Dewan m/s 1536
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan
Mohamad Najib Abdul Ghafar. (1999). Penyelidikan pendidikan. Skudai : Penerbit
Universiti Teknologi Malaysia.
Mohd. Majid Konting. (1998). Kaedah penyelidikan pendidikan. Kuala Lumpur : Dewan
Bahasa & Pustaka.
Mokhtar Ismail (1995).Penilaian di bilik darjah. Kuala Lumpur: Dewan Bahasa &
Pustaka.
Yap Yee Khiong et al. (1985). Pengukuran dan penilaian dalam pendidikan. Selangor
Darul Ehsan : Longman.
Anuar bin Salleh – 66907
Rosli bin Abdullah - 66900
19