You are on page 1of 19

GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 1

TERANGKAN TEKNIK MENDAPAT INDEKS KEBOLEHPERCAYAAN

Menurut Mokhtar (1995), reliabiliti ujian boleh disebut sebagai darjah

ketekalan antara dua pengukuran terhadap sesuatu benda, sesuatu ciri, atau sifat

seseorang.

Secara umum, kesilapan angkubah pengukuran adalah banyak terdapat dalam skor

ujian dalam pendidikan (atau, dengan kata lain, ujian pendidikan cenderung kepada tidak

reliabel) melainkan kerja yang lebih berhati-hati dilakukan bagi menentukan aras

reliabiliti yang diterima (Martuza, 1977). Ini menunjukkan bahawa reliabiliti bukan

sahaja skor yang sama didapati walaupun orang lain yang menilainya, tetapi jika kita

harus memberikan skor yang sama juga walaupun kita menilai pada masa yang berbeza.

Fakta mengenai reliabiliti rendah memeriksa kertas peperiksaan secara individu

telah ditunjukkan oleh Dicker (1973), yang menemukan bahawa pekali korelasi hanya

0.46 apabila 24 guru memeriksa sekali dan kemudian diperiksa semula selepas tiga bulan.

Aschersleben (1971) menganalisis pemeriksaan oleh 24 guru ke atas 623 pelajar dalam

empat ujian matematik yang bersiri dan empat ujian ‘dictation’. Beliau mendapati

kebanyakan korelasi adalah di bawah 0.60, dengan kertas matematik menunjukkan,

secara purata, nilai lebih kecil (Ingenkamp, 1977). Ini menunjukkan bahawa pemeriksaan

seseorang pemeriksa bukan sahaja tidak tekal tetapi amat berbeza di antara seorang

pemeriksa dengan pemeriksa lain. Dengan kata lain pemeriksaan mereka mempunyai

reliabiliti yang rendah.

Kebolehpercayaan sesuatu ujian merujuk kepada ketekalan, ketepatan, dan

kebolehbergantungan ujian berkenaan. Ini bermaksud sesuatu ujian yang boleh dipercayai

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 2

akan menghasilkan maklumat yang tekal (merujuk kepada beberapa pentadbiran ujian

yang telah dijalankan), tepat seperti yang sepatutnya serta boleh diterima pakai tanpa

keraguan.

Pada kebiasaannya , sesuatu ukuran itu tidak lepas daripada ralat (error). Ini amat

ketara dalam prestasi fizikal. Jauh lompatan seseorang misalnya, tidak sentiasa sama

kerana pengaruh halaju angin keadaan fizikalnya, keadaan atau jenis kasut yang dipakai,

latihan, larian atau sebagainya. Sedangkan berat seseorang pun boleh berubah dalam satu

hari disebabkan oleh pakaiannya, kenyang laparnya dan lain-lain.

Indeks kebolehpercayaan digunakan untuk menunjukkan ketekalan sesuatu ujian.

Indeks ini ditentukan dengan menggunakan kaedah korelasi antara dua set markat ujian.

Dua set markat boleh diperolehi dengan menggunakan 3 kaedah iaitu;

i. Kaedah uji dan uji kembali ( Uji – Ulang -Uji)

ii. Kaedah Ujian Bentuk Setara.

iii. Kaedah Ujian Bahagi Dua.

Sekurang-kurangnya indeks kebolehpercayaan 0.60 diperlukan bagi memastikan

ujian yang dibina boleh dipercayai.

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 3

Kaedah Uji dan Uji Kembali (Uji-Ulang- Uji)

Sesuatu pengukuran itu apabila diulangi dan jika dengan keputusan yang sama

merupakan pengukuran yang boleh dipercayai. Oleh yang demikian korelasi di antara

skor ujian dengan skor ulang-uji dianggap sebagai satu anggaran kebolehpercayaan ujian

yang diukur. Ukuran yang boleh diulangi dengan keputusan yang sama adalah sangat

bermakna dan ukuran itu dianggap stabil. Oleh itu korelasi uji-ulang- uji dirujukkan

sebagai satu indeks atau koefisien stabiliti.

Dalam penggunaan kaedah uji-ulang- uji dua faktor yang patut diambil kira, iaitu

tempoh masa antara uji dan ulang-uji dan kestabilan pembolehubah yang berkenaan . Ini

akan dihuraikan dengan menggunakan persamaan-persamaan dalam model matematik.

2 2 2
(C)
S = S+S
p b s

S
2

r =
b

2 (D)

S p

S 2

r =1−
s
(E)
2

S p

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 4

Faktor ingatan memainkan peranan yang besar dalam anggaran

kebolehpercayaan lebih-lebih lagi kalau tempoh masa antara uji dan ulang uji itu adalah

singkat. Ingatan calon-calon akan membesarkan


2 2
iaitu kepada bahagian dalam persamaan ( C )
S 2 S
S b

Jika ini berlaku nilai p akan menjadi lebih besar daripada apa yang

sebenarnya. Ini menyebabkan nilai r yang diperoleh , satu anggaran yang lebih

tinggi . Nilai anggaran yang tinggi ini boleh dikurangkan kalau tempoh masa antara uji

dan ulang-uji itu dipanjangkan. Kalau masa antara uji-ulang- uji panjang, faktor yang

kedua menjadi penting, iaitu turun naik skor benar.

Turun naik skor benar bagi sesuatu pembolehubah bergantung kepada stabilitinya

. Pembolehubah afektif atau personaliti misalnya, konsep diri, bimbingan dan sebagainya

berubah semakin banyak apabila tempoh masa antara dua pengukurannya semakin lama.

Pembolehubah domain kognitif adalah lebih stabil tetapi akan juga mengalami perubahan

dengan peredaran masa. Maka boleh dikatakan secara am, kalau tempoh masa antara uji

dan ulang-uji itu adalah panjang varians turun naik skor benar diukur sebagai varians
2

selisihan, ini adalah satu kesilapan. Oleh yang demikian S dalam


s

persamaan ( E ) telah menjadi lebih besar daripada yang sebenarnya. Akibat r yang

didapati telah menjadi kurang besar daripada yang sebenarnya atau satu satu anggapan

yang agak kurang. Kesan stabiliti atas anggaran kebolehpercayaan dapat diminimunkan

dengan memendekkan tempoh masa antara uji dan ulang-uji.

Boleh dikatakan bahawa kesan ingatan dan kesan turun naik skor benar adalah

dua perkara bertentangan dan satu imbangan antara kedua-dua faktor itu patut dicapai

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 5

dalam menentukan masa di antara uji dan ulang-uji. Di samping itu stabiliti

pembolehubah yang berkenaan juga perlu dipertimbangkan. Ujian yang tinggi tahap

kebolehpercayaannya boleh digunakan untuk mengukur pembolehubah yang kurang

stabil. Misalnya, pembaris adalah boleh dipercayai tetapi jarak yang dilompat oleh

seseorang juga berubah dengan beberapa kali lompatan.Kalau kaedah uji -ulang-uji itu

digunakan, tempoh masa di antara uji dan ulang-uji itu harus dinyatakan secara eksplisit.

Untuk ujian praktikal beberapa bantahan umum telah dibangkitkan tentang uji ulang-uji.

Di antaranya ialah:

i. Ujian hanyalah merupakan satu sampel daripada populasi item. Kalau

sampel lain digunakanan bagaimana pula keputusannya?

ii. Ujian pertama sudah pasti mempengaruhi ulang-uji. Oleh itu kesannya

didapati kurang jelas.

iii. Kalau tempoh masa di antara uji dan ulang-uji itu adalah panjang,

selisihan telah dikelirukan dengan pembelajaran atau perkembangan

personaliti individu yang diukur.

iv. Uji ulang-uji tidak menarik kepada semua pihak termasuk calon ujian.

Minat calon akan menurun dalam ujian ulangan. Apakah makna kesan itu?

v. Ulang-uji memerlukan masa , kerja dan perbelanjaan tambahan.

Walaubagaimanapun kaedah uji-ulang-uji masih popular digunakan sebagai

kaedah menganggarkan kebolehpercayaan khususnya untuk ujian terstandard.

Akan tetapi kaedah ini jarang atau tidak langsung digunakan dalam sekolah.

Kalau digunakan di sekolah hanya item-item spesifik sahaja yang digunakan.

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 6

Kaedah Ujian Setara.

Kaedah ujiian setara ini menggunakan prosedur yang sama dengan kaedah uji

ulang-uji. Yang berlainan sedikit ialah ujian yang digunakan dalam ulang -uji

ialah ujian setara. Ujian setara bolehlah dianggap sebagai satu persampelan

daripada populasi item yang sama. Item-item daripada ujian setara ini mempunyai

aras kesukaran yang sama , dan seharusnya juga mengukur pembolehubah yang

sama. Di samping itu semua arahan, cara pentadbiran ujian, cara respondan

sebagainya adalah sama untuk semua ujian setara. Walaupun ujian setara

mengukur pembolehubah yang sama , ujian itu dibentuk sebegitu rupa supaya

kesan dari ujian yang pertama tidak akan mempengaruhi keputusan ujian setara,

yakni ujian yang kedua. Salah satu langkah untuk menjamin hasrat ini ialah

dengan mengubah susunan item-item dalam ujian tersebut. Bahasa yang

digunakan dalam ujian setara itu juga perlu diubahsuai.

Tiga indeks statistik yang penting dan biasa digunakan untuk menguji

sama ada ujian itu setara atau tidak ialah min, varians, dan korelasi. Andainya dua

ujian atau lebih itu dikatakan ketara maka seharusnya min, varians, dan korelasi

antara ujian itu sama sahaja. Sifat-sifat ini adalah diandaikan benar, lebih-lebih

lagi jika ujian-ujian setara dianggap sebagai ujian –ujian yang mempunyai

bilangan item yang sama dan item-item itu dipilih secara rawak daripada satu

populasi item. Ini bermakna ujian-ujian itu adalah ujian-ujian setara secara rawak.

Sifat-sifat ujian jenis ini diringkaskan sebagai ;

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 7

Untuk ujian setara U1 U2 . . . Un dan U1 = ujian pertama dan seterusnya.


M M M
U = U =...= U Min sama
1 2 n
2 2
2
S S S
U = U =...= U Varians sama
1 2
n

r ui uj = tetap Korelasi sama untuk semua ujian Ui dan Uj

Korelasi di antara dua keputusan daripada dua ujian setara digunakan sebagai anggaran

kebolehpercayaan ujian-ujian itu Kadang-kadang korelasi ini dianggap sebagai satu

ukuran tentang kesetaraan di antara dua ujian setara. Oleh itu, korelasi di antara dua ujian

yang setara disebut juga koefisien samaan.

Terdapat juga satu lagi jenis ujian setara yang berlainan sedikit. Ujian setara

berpadan yang mempunyai semua sifat di atas termasuk ciri tiap-tiap item dalam satu

ujian setara berpadan yang dipadankan dengan yang sama isi dari ujian asal.

Sama seperti kaedah uji –ulang-uji, kaedah ujian setara juga menghadapi

beberapa bantahan yang agak serupa. Biasanya ujian setara juga tidak dipraktikkan di

sekolah untuk tujuan mencari kebolehpercayaan. Mungkin keperluan itu tidak dirasai

pada masa kini.

Kaedah Ujian Bahagi Dua.

Untuk menggangarkan kebolehpercayaan , kita menggunakan koefisien korelasi.

Ini memerlukan ujian dua kali. Kaedah uji-ulang-uji dan ujian setara pada dasarnya

memenuhi keperluan ini tetapi kaedah-kaedah itu menghadapi banyak bantahan. Kaedah

ujian bahagi dua diwujudkan untuk mengatasi bantahan-bantahan itu dan telah menjadi

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 8

kaedah biasa dan selalu digunakan untuk menggangarkan kebolehpercayaan . Dalam

kaedah ini prinsip-prinsip pengujian dua kali dipenuhi dengan membahagikan satu ujian

kepada dua ujian setara yang sama panjangnya. Bilangan item dalam setiap separuh ujian

itu adalah setengah bilangan item daripada ujian asal. Dengan itu calon-calon tidak perlu

mengambil dua ujian sama atau diuji dua kali dalam perkara yang sama. Perbelanjaan,

tenaga kerja dan masa tambahan tidak diperlukan lagi. Hanya ada satu kelemahan kecil

yang ditemui. Kebolehpercayaan yang didapati ialah untuk ujian yang panjangnya adalah

setengah daripada ujian asal. Tetapi anggaran kebolehpercayaan ujian asal itu dapat

dikirakan dengan menggunakan formula Spearman-Brown.

Ujian boleh dibahagikan kepada dua ujian pendek yang setara dengan mudah.

Kedua-dua ujian setara itu haruslah memenuhi tiga sifat yang disebutkan . Kalau sesuatu

ujian asal itu adalah sejenis, yakni semua butir adalah mengukur trait yang sama , maka

ujian asal boleh dibahagikan kepada ujian separuh bahagian yang atas dan ujian separuh

bahagian yang bawah. Misalnya bagi ujian yang mempunyai 24 item, item nombor 1

hingga 12 menjadi ujian separuh atas dan item nombor 13 hingga 24 menjadi ujian

separuh bawah. Ujian asal boleh dibahagikan kepada dua separuh berdasarkan item

ganjil-genap. Dengan menggunakan contoh tadi, item nombor 1,3,5…23 termasuk dalam

separuh ganjil dan item nombor 2,4,6….24 termasuk dalam separuh genap. Lain-lain

kombinasi boleh juga digunakan kalau sekiranya bilangan item dalam dua separuh ujian

itu adalah sama.

Jikalau item-item ujian itu tidak sejenis, atau tidak sama aras kesukaran serta

kuasa diskriminasi , susunan item-item dalam ujian asal harus disusun semula mengikut

kesukaran item. Kemudian susunan baru ini digunakan sebagai asas dalam pembahagian

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 9

ujian kepada dua separuh yang sama dengan cara item ganjil-genap. Ini menjamin yang

kedua-dua ujian separuh itu mempunyai min dan varians yang sama.

Untuk ujian aneka jenis (item-itemnya beraneka jenis dalam isi) kedua-dua ujian

separuh yang dipilih harus setara dan sepadan. Ini bermakna bahawa ujian-ujian separuh

itu berpadan dalam isi dan aras kesukaran.

Satu contoh pengiraan kebolehpercayaan dengan menggunakan kaedah ujian

bahagi dua adalah seperti berikut. Katakan lima orang murid mengambil ujian dan skor-

kor yang diperoleh adalah seperti berikut:

JADUAL 1

Markah untuk lima pelajar dalam ujian (hipotetikal)

PELAJAR
A B C D E
1 Jumlah markah untuk item ganjil (x) 1 2 3 4 5
2 Jumlah markah untuk item genap (y) 2 1 5 3 4
3 Perbezaan (x – y ) -1 1 -2 1 1
4 Jumlah ( x + y ) 3 3 8 7 9

Mengaplikasikan cara hasil darab momen ( atas baris 1 dan 2 ) korelasi untuk ujian

separuh ( r1 ) = 0.6

Selepas menggunakan formula Spearman-Brown korelasi untuk ujian penuh :

r2 = 2 ×0.6
1 +0.6

= 0.75

Keputusan : Kebolehpercayaan ujian itu adalah 0.75

Satu interpretasi dari sudut yang berlainan terhadap kolerasi yang diperoleh daripada

kaedah ini ialah kita menganggapkan yang korelasi ini mencerminkan ‘ketekalan dalam’

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 10

ujian. Kaedah Rulon (1939) ialah satu lagi cara yang boleh mengganggarkan ‘ketekalan

dalam’ seperti kaedah bahagi dua.Di sini satu andaian khas dibuat oleh Rulon tentang

varians selisihan.Rulon berpendapat bahawa perbezaan antara markah-markah dua ujian

separuh menunjukkan amaun selisihan, pengukuran, jadi varians perbezaan di antara dua

ujian separuh itu adalah sama dengan varians selisihan. Contoh:

2
S = Varians perbezaan antara dua ujian separuh.
s
2
= S
(x-y)

Kemudian kebolehpercayaan r ditakrif sebagai,

2 2

s (x-y)
(x-y)
2 2

(x+y
p )

Merujuk kepada Jadual 1


2 2
S dan S
(x-y) (x+y)

dapat dikira dengan menggunakan data dalam baris 3 dan 4

2 160 2 40
Keputusan : S = dan S =
(x-y) 25 (x+y) 25

Anuar bin Salleh – 66907


2 2Rosli bin Abdullah - 66900
S S
(x + y) (x - y)
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 11

40 / 25
Dan r=1 - = 0.75
160 / 25
Yang menarik di sini ialah , walaupun Rulon menggunakan kaedah yang

berlainan tetapi r yang diperoleh adalah sama dengan nilai r yang dikira dengan cara

ujian bahagi dua ( r = 0.75) .

Kaedah Guttman pula adalah satu kaedah yang berasaskan kaedah Rulon .

Caranya memudahkan pengiraan . Guttman dalam tahun 1945 dengan menggunakan

prinsip dan andaian cara Rulon telah mendapatkan formula bahawa kebolehpercayan satu

ujian dapat dirumuskan seperti berikut:


2 2

(S + S)
X y
R = 2 [1 – 2
]
S
X+y

Kalau data dalam Jadual 1 digunakan maka

R = 2 [1 – 2 + 2 ]

5
2 = [ ]
8

= 0.75

Perhatikan di sini bahawa prosedur yang digunakan dalam kaedah cantuman ini

adalah lebih mudah daripada kaedah Rulon. Ini disebabkan perbezaan di antara kedua-

dua ujian separuh tidak diperlukan lagi. Keputusan yang didapati secara ini juga sama

dengan yang diperoleh dengan cara Rulon dan cara ujian bahagi dua. Ini berlaku kalau

varians kedua-dua ujian separuh adalah sama seperti dalam contoh ini. Dalam ujian

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 12

apabila varians tidak sama , r dari cara ujian bahagi dua dan cara Guttman adalah sama

dan kedua-duanya lebih daripada r yang diperoleh dari cara Rulon. Tetapi pada lazimnya

perbezaan di antara r yang didapati dari tiga cara itu adalah kecil sahaja.

Kaedah Kuder – Richardson

Dalam kaedah ujian bahagi dua, ujian dibahagi kepada dua separuh ujian setara.

Prinsip ini dapat digunakan untuk membahagikan suatu ujian kepada beberapa ujian yang

setara yang mana bilangannya adalah sama dengan bilangan item yang terdapat dalam

ujian itu. Di sini tiap-tiap item itu dianggap sebagai suatu ujian. Kalau begitu ujian yang

mempunyai 100 item bolehlah dibahagikan kepada 100 ujian kecil yang setara. Kuder

dan Richardson dalam tahun 1937 dengan membuat beberapa andaian telah mencipta satu

cara baru untuk menganggarkan kebolehpercayaan suatu ujian. Cara ini dianggap lebih

teknikal daripada cara lain. Kaedah ini juga popular untuk menganggarkan

kebolehpercayaan dalam penyelidikan dan pembentukan ujian standard.

Andaian-andaian yang perlu dibuat untuk kaedah Kuder-Richardson adalah

seperti berikut:

i. Tiap-tiap item itu dianggap sebagai satu ujian setara.

ii. Semua korelasi di antara item-item itu adalah sama.

Mengikut Kuder dan Richardson kebolehpercayaan suatu ujian boleh dianggarkan

dengan formula berikut:

n = bilangan items
2
Kebolehpercayaan r = S = varians item i
i
2
S = varians jumlah skor
Anuarp bin Salleh – 66907
dan varians
Rosli bin Abdullah perhatikan
- 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 13

Dan kalau hanya dua kemungkinan boleh terjadi bagi tiap-tiap item

( misalnya : betul = 1 , salah = 0)

p = perkadaran betul ( 1) untuk butir i


i
Maka r = q = perkadaran salah (0) untuk butir i
i

Kedua-dua formula ini disebut formula KR-20.

Tetapi , jika diandaikan bahawa tiap-tiap item mempunyai kekerapan jawapan yang betul

/ salah yang sama ( iaitu p = p ) atau aras kesukaran tiap-tiap item adalah sama , maka
i j

∑ piqi
1
= n p q , p = min p , q = min q
i i

 2  n = bilangan butir
 S − n pq  M = Min
n  p 
Kemudian r =   2
n −1 2 S = varians perhatikan
 S  p
 p 
 

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 14

 
 M2 
n  n
Atau = 1−
n −1 2 
 S 
 p 

Formula ini disebutkan formula KR-21

Contoh kiraan: Ujian mempunyai 10 butir objektif p = 0.6 bermakna 0.6 bilangan murid

menjawab betul.

Maka q = 0.4 bermakna 0.4 bilangan murid menjawab salah.

Butir 1 2 3 4 5 6 7 8 9 10
0.7 0.8 0.8 0.8 0.6 0.6 0.7 0.7 0.6 0.7
Perkadaran p
i
Jawapan betul
0.3 0.2 0.2 0.2 0.4 0.4 0.3 0.3 0.4 0.3
Perkadaran q
i
Jawapan salah
0.21 0.16 0.16 0.16 0.24 0.24 0.21 0.21 0.24 0.21
p q
i i

10
Maka ∑ piqi
1
= 2.04, p =0.7, q = 0.3

2
Kalau S = 6 (katakan)
p

 10

 ∑p q 
n  i i
Maka r =  1− 1 KR-20
n −1 2 
 S 
 p 

10  2.04 
= 1 − 
9 6 

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 15

10
= (1 − 0.34)
9

=0.733

Kalau data yang sama digunakan untuk KR-21

 
 
n  n pq
r= 1−
n −1 2 
 S 
 p 

10   10 × 0.7 × 0.3 
= 1−  
9   6 

10  2.1 
= 1 − 
9 6 

10
= (1 − 0.35)
9

=0.722

Perhatikan bahawa r dikira dengan KR-20 dan KR-21 adalah hampir sama. Ini adalah

disebabkan andaian ∑ piqi = n p q telah dipenuhi.

Ringkasan

Bagi menganggarkan kebolehpercayaan ujian dua faktor harus diambil kira, faktor

pertama ialah jenis ujian, sama ada ujian itu terdiri daripada item aneka jenis atau sejenis.

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 16

Faktor kedua ialah tentang aspek kebolehpercayaan yang ditegaskan atau dipersoalkan,

iaitu sama ada stabiliti atau ketepatan atau ketekalan dalam ? Oleh sebab

kebolehpercayan merupakan sesuatu yang relatif dan juga berbeza-beza dari masa ke

semasa, situasi dan populasi, adalah lebih baik jika kebolehpercayaan ujian itu

didapatkan dengan cara yang berlainan. Maka untuk kegunaan penyelidikan dan ujian

terstandard yang mana skor benar diutamakan, ujian yang digunakan haruslah

mempunyai kebolehpercayaan dari berbagai-bagai aspek. Selain itu kebolehpercayaan

mestilah dikemaskinikan dari semasa ke semasa. Ini dibuat untuk menjamin bahawa

kebolehpercayaan itu masih boleh di pakai dengan penuh keyakinan pada masa ujian itu

digunakan.

Sebagai panduan jadual 2 memberikan cara untuk mendapatkan kebolehpercayaan

yang sesuai dengan jenis ujian dan aspek kebolehpercayaan yang terlibat.

Cara kebolehpercayaan untuk jenis-jenis ujian dan aspek kebolehpercayaan.

Aspek Ujian sejenis Ujian aneka jenis

kebolehpercayaan
Ketepatan dan stabiliti Uji-ulang-uji Uji-ulang-uji

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 17

Markat benar - -
ketepatan Ujian setara KR20
Ketekalan dalam Ujian bahagi dua Rulon, Ujian bahagi dua berpadan.

Guttman, KR20, KR21

Seperkara yang penting yang perlu dipersoalkan ialah tentang saiz, koefisien

kebolehpercayaan yang diperoleh daripada mana-mana ujian. Berapakah nilai yang boleh

dianggap sebagai r yang boleh diterima ?

Sebenarnya tiada jawapan yang lengkap dan memuaskan dapat diberi bagi persoalan

tersebut akan tetapi , di kalangan ujian yang sah ujian yang mempunyai indeks

kebolehpercayan terbesar merupakan ujian yang lebih diutamakan dan menjadi pilihan.

Ini juga bergantung kepada kegunaan maklumat yang diperoleh daripada ujian itu.

Pengguna maklumat atau ujian menentukan taraf kejituan yang dikehendaki dan memilih

ujian yang sesuai untuk tujuannya. Biasanya untuk pengukuran dan membuat keputusan

tentang seorang individu ujian yang mempunyai kenolehpercayaan ( r ) yang kurang

daripada 0.75 adalah kurang memuaskan . tetapi dalam kes lain untuk tujuan ramalan satu

kumpulan yang saiznya lebih daripada 25 ( n = 25)r = 0.3 mungkin boleh diterima.

Walaubagaimanapun pembolehubah kognitif seperti kecerdasan , pencapaian akademik,

nilai r haruslah lebih daripada 0.8 dan untuk pembolehubah personaliti dan afektif seperti

motivasi bimbingan , konsep-diri, nilai r = 0.5 bolehlah dianggap sebagai memuaskan.

Akhir kata, ujian yang mempunyai kebolehpercayaan tinggi boleh dianggap hanya

mengukur apa yang ujian itu mengukur dengan tepat. Tetapi ujian itu tidak semestinya

mengukur apa yang harus diukur. Dengan kata lain kebolehpercayaan tidak semestinya

bermakna keesahan tetapi keesahan mengimplikasikan kebolehpercayaan.

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 18

Rujukan Istilah:

Korelasi= hubungan atau kaitan secara timbal balik


Kamus .Dewan m/s 707

Varians= sesuatu yang menyimpang atau berlainan daripada yang


lazim atau standard, kelainan; bentuk atau ejaan yang
berlainan bagi perkataan yang sama.
Kamus Dewan m/s 1536

Bibliografi

Krynock, K. & Robb, L. (1996). Is problem-based learning a problem for your

curriculum? Illinois School Research and Development Journal, 33(1), 21 – 24.

Lee Shok Mee dan Mook Soon Sang (1989). Pengujian dan penilaian dalam pendidikan,

Kuala Lumpur : Kumpulan Budiman

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900
GS3073– Pengukuran Dan Penilaian Dalam Pendidikan 19

Mohamad Najib Abdul Ghafar. (1999). Penyelidikan pendidikan. Skudai : Penerbit

Universiti Teknologi Malaysia.

Mohd. Majid Konting. (1998). Kaedah penyelidikan pendidikan. Kuala Lumpur : Dewan

Bahasa & Pustaka.

Mokhtar Ismail (1995).Penilaian di bilik darjah. Kuala Lumpur: Dewan Bahasa &

Pustaka.

Yap Yee Khiong et al. (1985). Pengukuran dan penilaian dalam pendidikan. Selangor

Darul Ehsan : Longman.

Anuar bin Salleh – 66907


Rosli bin Abdullah - 66900

You might also like