You are on page 1of 33

Azman Fadzil

HBEF3203 Pengukuran dan Penilaian dalam


Pendidikan
KEBOLEHPERCAYAAN UJIAN
KEBOLEHPERCAYAAN UJIAN
Kebolehpercayaan(reliability) sesuatu alat ukuran bermaksud
ketekalan ukuran-ukuran yang dihasilkan oleh alat-alat tersebut
(Hanna & Dettmer,2004).
Kebolehpercayaan Ujian ialah ketekalan markah-markah yang
dihasilkan oleh ujian tersebut.
Ujian yang baik adalah ujian yang mempunyai darjah ketekalan
yang tinggi, markah/skor yang dihasilkan adalah hampir sama
dalam apa jua keadaan.
ms 113 oum
Azman Fadzil
KEBOLEHPERCAYAAN UJIAN
Indeks Kepercayaan Negatif menunjukkan ketekalan songsang
iaitu pelajar dapat skor tinggi dalam Ujian Pertama dan mendapat
skor rendah dalam Ujian Kedua dan sebaliknya
Indeks Kepercayaan Positif menunjukkan selalunya ianya
terjadi seperti yang diharapkan. Indeks diantara 0.65 0.85 adalah
memadai.
Azman Fadzil
INDEKS KEBOLEHPERCAYAAN DAN
PENGKELASAN UJIAN
Nilai (r) Pengkelasan Ujian

< 0.20 Tidak baik

0.21 0.40 Kurang baik

0.41 0.60 Sederhana baik

0.61 0.80 Baik

0.81 1.00 Sangat baik
R = reliability
Azman Fadzil
Ukuran
Kestabilan
Ukuran
Kesetaraan
Ukuran
Kesetaraan dan
Kestabilan
Ukuran
Ketekalan
Dalaman
Kebolehpercayaan
Pemeriksa
5 JENIS
KEBOLEHPERCAYAAN
Mehrens & Lehmann
(1991)
Azman Fadzil
anggaran kebolehpercayaan uji-uji semula(test-restest
estimate of reliability)
Memberikan ujian yang sama sekali lagi kepada
kumpulan pelajar yang sama(kelas yang sama) selepas
ujian yang pertama ditadbirkan(2 7 hari).
Mengira pekali korelasi Pearson antara dua skor yang
diperolehi oleh setiap pelajar.
Ukuran kestabilan adalah tinggi sekiranya jarak masa
antara dua pentadbiran ujian adalah pendek.
1. UKURAN KESTABILAN
Azman Fadzil
UKURAN KESTABILAN
Pekali Korelasi Pearson

(x
1
x) (y
1

- y)
------------------------
ns
x
s
y



jumlah
x
1
Skor ujian kali pertama
x
Min skor ujian kali pertama
y1 Skor ujian kali kedua
y Min skor ujian kali kedua
sx Sisihan piawai skor ujian
kali pertama
sy Sisihan piawai skor ujian
kali kedua
n Bilangan pelajar
r
xy
=
Azman Fadzil
2. UKURAN KESETARAAN
Ukuran Keselarian (parallel), memberikan
memberikan dua ujian yang berbeza tapi setara
(kesamaan dari segi kandungan, JSU, format
soalan dan arahan menjawab serta min, varians
& interkorelasi skor) kpd kumpulan pelajar pada
hari yang sama.
Mengira pekali korelasi Pearson antara dua skor
yang diperolehi setiap pelajar.
Azman Fadzil
3. UKURAN KESETARAAN DAN
KESTABILAN
Melihat ketekalan pencapaian seseorang pelajar untuk
jangka masa panjang dengan menggunakan ujian yang
berbeza.
Mentadbirkan ujian kedua yang setara dengan ujian
pertama (Ukuran Kesetaraan) pada suatu masa yang
lain (Ukuran Kestabilan).
Mengira pekali korelasi Pearson antara dua skor yang
diperolehi setiap pelajar, skor ujian pertama dan skor
ujian kedua.
Cth: peperiksaan percubaan
Azman Fadzil
4.UKURAN KETEKALAN DALAMAN
Ukuran jenis ini boleh dibuat sekali ujian sahaja.
Kemudian kita membelah/memecahkan ujian kpd
separuh-separuh (split-half), iaitu separuh pertama dan
separuh kedua.
Kaedah Kuder-Richardson dan Kaedah Cronbach,
kedua-dua kaedah menggunakan sekali ujian sahaja.
Menggambarkan darjah keseragaman (homogeneity)
antara item dalam sesuatu ujian, hubungan/korelasi
antara setiap item dengan jumlah skor ujian.(Mehrens &
Lehmenn,1991)
Azman Fadzil
4(a). Ukuran Ketekalan Dalaman
Belah-Dua
(x
1
x) (y
1
- y)
------------------------
nsx sy


jumlah
x
1
Skor separuh pertama ujian
x
Min skor separuh pertama
y
1
Skor separuh kedua ujian
y Min skor separuh kedua
sx Sisihan piawai skor separuh
pertama ujian
sy Sisihan piawai skor separuh
kedua ujian
n Bilangan pelajar
Ujian dipecah 2
Nota :
Hanya untuk darjah ketekalan
SEPARUH ujian sahaja
r =
Azman Fadzil
4(a). Ukuran Ketekalan Dalaman bagi
Keseluruhan Ujian (r
SB
)
Pekali Spearman- Brown

[ 2 r ]
-----------------
(1 + r )

r ialah pekali Ketekalan Dalaman Belah- Dua
r
SB
=
Azman Fadzil
4(b). Kaedah Kuder Richardson
Digunakan untuk mengira Ukuran Ketekalan
Dalaman bagi item yang berjawapan dikotomi
(betul/salah)
K-R
20
untuk Indeks Kesukaran Item(P) berbeza
bagi semua item
K-R
21
untuk Indeks ini sama bagi semua item.
Azman Fadzil
4(b). Kaedah Kuder Richardson
k [ 1 - pq ]
----- -----------
k -1 S
x
2

jumlah
k

Bilangan item dalam ujian
p
Kadar pelajar menjawab item dengan
betul (indek Kesukaran item)
q

Kadar pelajar yang salah menjawab
item (q = 1 p )
pq Varians skor item
x Min skor keseluruhan item
S
x

2 Varians skor keseluruhan ujian
k [1 x(k x)]
----- --------------
k -1 kS
x
2
K R
20 =

K R
21 =

Azman Fadzil
4(c). Kaedah Cronbach
Kaedah Alfa () sebagai Ukuran Ketekalan Dalaman
Lanjutan kepada K R
20
k [ 1 - S
1
2
]
----- -----------
k -1 S
x
2
k Bilangan dalam ujian
jumlah
S
1
2
Varians bagi skor item
S
x
2
Varians skor keseluruhan
item


=
Azman Fadzil
5. Kebolehpercayaan Pemeriksa
Ketekalan ukuran/skor yang diberikan oleh dua
atau lebih pemeriksa apabila memeriksa kertas
jawapan yang sama
Tidak perlu bagi ujian objektif
Azman Fadzil
FAKTOR YANG
MEMPENGARUHI
KEBOLEHPERCAYAAN
Azman Fadzil
FAKTOR YANG MEMPENGARUHI
KEBOLEHPERCAYAAN
Rumus Spearman-Brown untuk mengira pekali Ketekalan Dalaman
Belah-Dua digunakan juga untuk mengira indeks kebolehpercayaan
ujian apabila itemnya ditambah @ dikurangkan

Indeks kebolehpercayaan akan meningkat sekiranya ujian bertambah
panjang

Jika item asal dibuang, indeks kebolehpercayaan akan menurun.

Item yang ditambah perlulah setara/seragam dengan item asal ujian.


Azman Fadzil
Rumus am Spearman-Brown Ketekalan Dalaman Belah-Dua
nilai K=2 iaitu ujian baru (sebenar)
[ Kr ] ialah dua kali ganda panjang / item
[ 1 + ( k 1 ) r ] ujian asal ( separuh ujian benar )
dan r = r
1/2


K nisbah bilangan item dalam ujian Sekiranya bilangan item ditambah
baru kepada bilangan item dalam menjadi tiga kali ganda iaitu k = 3
ujian asal. Dan andaikan r = 0.60


r pekali kebolehpercayaan ujian asal

1. Panjang Ujian
r
SB
=
Pengiraan m/s 120
Azman Fadzil
2. Kehomogenan Kumpulan
r = 1 s
e
2

s
x
2


s
e

2
adalah varians ralat

s
x

2
adalah varians skor

Varians ralat boleh diandaikan
sbg tetap, tidak berubah
Kumpulan yg lbh heterogenus,
varians skor s
x

2
lbh besar,
indeks kebolehpercayaan lbh
tinggi

Kumpulan yg lbh homogenus,
varians skor s
x

2
lbh kecil
indeks kebolehpercayaan lbh
rendah

Azman Fadzil
3. Kesukaran Item
Item2 mudah, kebanyakan calon
menjawab dgn baik, skor hampir
sama kpd calon.

Varians skor yg rendah
disebabkan skor yg homogenus,
indeks kebolehpercayaan yg
rendah
Item2 sukar , skor pelajar agak
berbeza / heterogenus.

Varians skor besar, indeks
kebolehpercayaan yg tinggi

Ujian yg susah kumpulan
heterogenus, meningkatkan
indeks kebolehpercayaan
Azman Fadzil
4. Objektiviti Jawapan
Jawapan yg lebih objektif mempunyai
indeks kebolehpercayaan yg lebih tinggi

Jawapan yg lebih subjektif mempunyai
indeks kebolehpercayaan yg lebih
rendah
Azman Fadzil
Kesahan Ujian
Kesahan sesuatu alat ukuran ialah sejauh
mana alat tersebut dapat mengukur apa yg
sepatutnya diukur oleh alat tersebut ( Hanna &
Dettmer, 2004 )

Alat ukuran penting supaya dapat mengukur
apa yg hendak diukur- Alat tertentu untuk ukur
perkara tertentu sahaja

Contoh, ujian mendengar untuk mengukur
kemahiran mendengar
Azman Fadzil
Empat jenis Kesahan Mehrens dan Lehmann
( 1991)
1. Kesahan Kandungan ( Content Validity )

2. Kesahan Konstruk ( Construct Validity )

3. Kesahan Muka ( Face Validity )

4. Kesahan Hubungan Kriteria ( Criterion-
related Validity )
Azman Fadzil
1. Kesahan Kandungan
Untuk menilai apa yg telah dipelajari pelajar bagi sesuatu mata
pelajaran pada akhir penggal / tahun persekolahan.

Sebagai sampel / wakil kepada sukatan pelajaran yg luas.

Mencakupi kandungan pelajaran yg ditetapkan.

Markah pelajar menunjukkan tahap pencapaian pelajar tersebut bg
kandungan pelajaran tertentu.
Azman Fadzil
2. Kesahan Konstruk
Merujuk sejauh mana sesuatu alat ukuran dapat
mengukur sesuatu konstruk / gagasan
berdasarkan teori psikologi tertentu.

Penting kepada ahli2 pendidikan dan psikologi
yg ingin membuat kajian tentang konstruk.
Azman Fadzil
3. Kesahan Muka
Sesuatu alat ukuran nampak pada permukaannya mempunyai
kesahan yg tinggi

Sekali pandang, nampak alat ukuran itu sah,orang yg tidak terlatih
nampak alat ini sebagai sah.

Sekiranya dirasakan inventori tidak sesuai, kemungkinan orang
tidak menjawab dengan serius, skornya tidak sah.

Sekiranya seseorang itu mengetahui apa yg ingin diukur,
jawapannya sentiasa positif
4. Kesahan Hubungan - Kriteria
Merujuk kepada sejauh mana sesuatu alat
ukuran itu dapat menghasilkan skor yg
mempunyai hubungan dengan beberapa
ukuran luaran ( kriteria )

Terbahagi dua iaitu :
i. Kesahan Serentak ( Concurrent Measure )
ii. Kesahan Ramalan
Azman Fadzil
4.1 Kesahan Serentak (Concurrent Measure )
Merujuk kepada sejauh mana sesuatu alat ukuran itu
dapat menghasilkan skor yg mempunyai hubungan
dengan ukuran daripada alat lain yg diambil serentak.

Contoh : alat ukuran kecerdasan A menghasilkan skor
yg mempunyai hubungan dengan skor drp alat ukuran
kecerdasan B, maka alat A dikatakan mempunyai
kesahan serentak yg tinggi
Azman Fadzil
4.2 Kesahan Ramalan
Merujuk kepada sejauh mana sesuatu alat ukuran itu
dapat menghasilkan skor yg mempunyai hubungan
dgn ukuran drp alat lain yg diambil kemudian.

Contoh : markah ujian percubaan matematik
mempunyai hubungan yg kuat dgn gred matematik
SPM, maka ujian matematik dikatakan mempunyai
kesahan ramalan yg tinggi.
Azman Fadzil
Kaedah Mengira Indeks Kesahan
Kesahan kandungan, kesahan muka, dijelaskan
secara kualitatif sahaja

Kesahan ramalan, persamaan regresi boleh digunakan
utk meramal skor kriteria

Kesahan konstruk, kesahan serentak, kesahan
ramalan boleh diukur dgn pekali korelasi Pearson

TAMAT.
Azman Fadzil
Latihan ms 127 ujian no 3

cuba jaya
Azman Fadzil
Tamat
33 - 13
Azman Fadzil

You might also like