You are on page 1of 10

PENGUKURAN, KEBOLEHPERCAYAAN DAN KESAHAN

PENGENALAN
Bab ini akan membincangkan konsep pengukuran, aras-aras pengukuran serta dua penentu
utama kualiti pengukuran, iaitu kebolehpercayaan dan kesahan. Aras pengukuran penting
bagi menentukan analisis statistik yang akan digunakan itu bersesuaian. Pemahaman tentang
konsep kebolehpercayaan dan kesahan penting supaya alat ukur (misalnya, soal selidik)
yang digunakan untuk mengukur sesuatu pembolehubah itu bebas kesilapan.

ARAS PENGUKURAN
Aras pengukuran yang digunakan amat penting untuk menentukan bagaimana anda mahu
menganalisis data dengan menggunakan analisis statistik tertentu. Semakin tinggi aras
pengukuran, semakin tinggi juga hirarki ketepatan ke atas pembolehubah yang dinilai. Data
ialah cerapan atau ukuran yang dihasilkan dalam sesuatu kajian. Data boleh dikelaskan
mengikut hierarki iaitu aras nominal,aras ordinal,aras selang dan aras nisbah.

Aras Nominal
Skala aras nominal merupakan aras ukuran paling asas dalam pengukuran. Skala aras
nominal adalah bersifat kualitatif iaitu data hanya boleh dikelaskan mengikut kategori-
kategori tertentu tetapi kategori tersebut tidak boleh disusun sama ada menaik atau
menurun. Setiap kategori adalah berbeza dan bersifat saling ekslusif (berasingan) iaitu
setiap individu atau objek tidak boleh lebih daripada satu kategori pada masa yang sama.
Misalnya, pembolehubah jantina disimbolkan 1= lelaki, 2 = perempuan adalah saling
ekslusif kerana jika individu dimasukkan dalam kategori 1=lelaki, maka individu berkenaan
tidak boleh sekali lagi dimasukkan dalam kategori 2 =perempuan. Bagaimanapun nombor-
nombor ini hanyalah simbol semata-mata dan anda tidak boleh memanipulasikan nombor
tersebut untuk tujuan operasi aritmetik.
Dalam usaha untuk memproses data bagi pembolehubah-pembolehubah aras nominal
seperti bangsa, tempat tinggal, nombor pada jersi pelari marathon, pekerjaan mengikut
industri, maka anda akan mengkelaskan pembolehubah tadi kepada beberapa kategori
dengan memberi kod-kod bernombor 1, 2, 3 dan seterusnya. Contohnya, kategori pekerjaan,
1: pekerja sektor awam, 2: pekerja sektor swasta, 3: kerja sendiri, di mana 1 +2 bukan
bersamaan 3, iaitu pekerja sektor awam +pekerja sektor swasta bukan bersamaan 3 (kerja
sendiri). Ini bermakna nombor-nombor bagi data aras nominal tidak boleh digunakan untuk
operasi matematik, kecuali untuk mendapatkan frekuensi dan mod (kekerapan) sahaja.
1

Aras Ordinal
Data-data bagi aras pengukuran ordinal mempunyai sifat-sifat aras nominal iaitu data boleh
dikelaskan kepada beberapa kategori, malah ditambah satu lagi sifat iaitu kategori-kategori
ini boleh disusun sama ada menaik atau menurun mengikut pangkat atau darjah tertentu.
Di antara contoh-contoh data aras ordinal yang disusun mengikut pangkat atau darjah
adalah seperti di bawah;

a. Pengkelasan gred peperiksaan: A, A-, B+, B dan seterusnya.

b. Umur responden: 1: 20 tahun, 2 : 21 30 tahun, 3: 31 40 tahun, 4: 41 tahun ke
atas.

c. Kedudukan tempat pertama hingga ke - 8 dalam perlumbaan akhir lari acara 100
meter.

d. Ujian rasa mengikut pilihan pengguna bagi 4 botol minuman jenama berlainan.
Misalnya, minuman jenama D disusun sebagai pilihan nombor 1, minuman jenama
A pilihan nombor 2, minuman jenama B pilihan nombor 3 dan minuman jenama C
pilihan nombor 4.


Aras Selang
Data aras selang mempunyai semua ciri-ciri data nominal dan data ordinal, tetapi ditambah
satu lagi sifat iaitu perbezaan antara nilai-nilai bagi setiap selang dalam skala adalah sama
dan nilai sifar bukan menunjukkan sifar mutlak.
Misalnya, apabila anda mengukur suhu (dalam Fahrenheit), perbezaan suhu di antara
30
0
F dan 40
0
F adalah sama dengan perbezaan suhu di antara 70
0
F dan 80
0
F iaitu bersamaan
10
0
F. Dalam pengukuran suhu menggunakan unit Celsius, nilai suhu 0
0
C tidak bermakna
tiada suhu, malah suhu 0
0
C adalah bersamaan kira-kira 18
0
F. Bagaimanapun perlu
diingatkan bahawa nisbah dalam ukuran aras selang tidak mempunyai makna. Misalnya,
suhu 80
0
F tidak bermakna dua kali ganda lebih panas berbanding suhu 40
0
F (walaupun nilai
atribut menunjukkan dua kali lebih besar).
Contoh lain seperti markah peperiksaan, markah ujian IQ dan saiz kasut. J ika markah
peperiksaan akhir bagi pelajar A ialah 80 dan pelajar B ialah 40, anda boleh katakan wujud
perbezaan markah di antara pelajar A dan B, iaitu pelajar A lebih tinggi markah berbanding
pelajar B. Bagaimanapun anda tidak boleh katakan bahawa pelajar A dua kali ganda lebih
cerdik berbanding pelajar B. Kasut boleh dibezakan mengikut saiz tertentu. Anda tahu
bahawa kasut bersaiz 8 lebih besar daripada kasut bersaiz 4 tetapi anda tidak boleh katakan
bahawa kasut bersaiz 8 dua kali ganda besarnya berbanding kasut bersaiz 4.

Aras Nisbah
Pengukuran aras nisbah mempunyai semua ciri-ciri data aras selang dengan tambahan satu
lagi sifat iaitu mempunyai sifar mutlak yang bermaksud nilai sifar yang mempunyai makna.
Contoh-contoh data aras nisbah seperti jumlah pendapatan, jumlah barang dijual,
masa perjalanan, umur, ketinggian dan berat badan. Titik sifar dan nisbah di antara dua
nombor bagi aras ukuran nisbah mempunyai makna. Misalnya, jika anda ada sifar wang
bermaksud anda tidak ada wang. Pendapatan Ali sebagai jurujual kereta ialah RM4,000
2

sebulan manakala pendapatan Abu sebagai jurujual insurans ialah RM8,000 sebulan, maka
anda boleh katakan pendapatan Abu dua kali ganda berbanding pendapatan Ali.


Kenapa memahami aras pengukuran penting?.
Pengetahuan tentang pengkelasan data amat penting kerana kaedah statistik ujian yang
sesuai bergantung kepada jenis data. Memahami aras pengukuran akan dapat membantu
anda bagaimana untuk mentafsirkan data daripada pembolehubah itu dan membantu anda
memutuskan apakah analisis statistik bersesuaian bagi nilai-nilai yang telah diperolehi
daripada data. Misalnya, jika anda tahu data yang dikumpul dari pembolehubah jantina
adalah data aras nominal, maka anda tidak boleh mendapatkan nilai min atau melakukan
ujian-t, sebaliknya anda boleh menentukan mod dan ujian khi-kuasadua sahaja. J adual
berikut menunjukkan analisis statistik yang dibenarkan mengikut jenis skala ukuran yang
berlainan.


J adual 1: J enis-jenis Skala dan Statistik Dibenarkan

Jenis Skala Statistik dibenarkan
Nominal Frekuensi, mod, khi-kuasadua
Ordinal Frekuansi, mod, median, julat, persentil
Selang Frekuensi, mod, median, julat, min, varians, sisihan
piawai, korelasi, regresi, analisis varians
Nisbah Semua statistik dibenarkan untuk skala selang ditambah
min geometrik, pekali variasi, logaritma.

RALAT DALAM PENGUKURAN
Semua pengukuran mungkin mengandungi beberapa elemen kesilapan atau ralat. Ralat
bermaksud selisih atau lencongan dari nilai sebenar kuantiti yang diukur. Ralat
pengukuran berlaku apabila maklumbalas yang diberikan oleh responden berbeza dari nilai
sebenar. Ralat ini mungkin boleh dikaitkan dengan responden sendiri, penemubual, soal
selidik atau kaedah pengumpulan data.
Ralat pengukuran bermaksud ralat atau kesilapan dari respons kaji selidik sama ada
disebabkan oleh faktor responden, penemubual, kandungan soalan atau arahan dalam soal
selidik ataupun kaedah yang digunakan untuk memilih responden. Ralat boleh berlaku
apabila responden tidak jujur atau keliru semasa memberi respons. Penemubual melakukan
kesilapan semasa menemubual responden mungkin kerana tidak diberi latihan mencukupi.
Arahan dan kandungan soalan dalam soal selidik pula mungkin mengandungi kesilapan
tertentu. Ralat pengukuran juga boleh berlaku disebabkan kaedah pemilihan responden tidak
tepat atau responden yang tidak mewakili populasi sasaran.
Kesahan dan kebolehpercayaan memberi perhatian tentang jumlah dan jenis ralat yang biasa
berlaku serta bagaimana menganggarkan ralat dalam pengukuran.


3

Jenis-Jenis Ralat
Ralat pengukuran boleh dikategorikan kepada dua jenis iaitu ralat sistematik dan ralat
rawak.

a) Ralat Sistematik
Ralat sistematik berlaku disebabkan oleh ketidaksempurnaan dalam alat pengukur. Ralat
sistematik adalah ralat disebabkan oleh faktor-faktor sistematik yang menjejaskan
pengukuran pembolehubah keseluruhan sampel. Sebagai contoh, jika siren kuat berbunyi di
luar dewan peperiksaan selama beberapa minit akan menjejaskan semua skor pelajar yang
menduduki peperiksaan tersebut. Tidak seperti ralat rawak, ralat sistematik ini cenderung
menjadi konsisten sama ada ke arah positif atau negatif. Oleh kerana itu ralat sistematik
kadang kala dianggap sebagai bias atau berat sebelah dalam pengukuran. Ini kerana ralat
sistematik menyebabkan berlaku perubahan min skor sama ada ke kiri atau ke kanan.

b) Ralat Rawak
Ralat rawak berlaku tidak mempunyai penyebab yang jelas, tetapi berpunca daripada proses
pengukuran atau prosedur statistik digunakan. Ralat rawak adalah kesilapan dalam
pengukuran yang membawa kepada nilai diukur menjadi tidak konsisten apabila diulangi
bagi sesuatu atribut atau kuantiti yang malar. Kesan ralat rawak menyebabkan serakan yang
lebih luas dan sisihan piawai pengukuran semakin meningkat. Bagaimanapun ralat rawak
tidak boleh menjejaskan min skor tetapi hanya berlaku perubahan serakan di sekitar min.
Ralat pengukuran adalah variasi sebenar dari skor cerapan sebenar, dan termasuk kedua-
dua ralat rawak dan ralat sistematik.
Skor cerapan = Skor sebenar + ralat rawak + ralat sistematik

Punca-Punca Ralat
Secara umumnya terdapat lima punca utama yang menyebabkan ralat pengukuran:
a) Reka bentuk Soal Selidik
Reka bentuk soal selidik termasuk susun atur visual, topik-topik yang dilitupi dalam soal
selidik, perkataan atau ayat yang digunakan dalam soalan soal selidik. Ralat boleh berlaku
jika kandungan dan kata-kata soal selidik boleh mengelirukan dan susun atur soal selidik
boleh membuatkan ia sukar untuk mencatatkan maklumbalas secara tepat. Soalan tidak
harus mengelirukan atau samar-samar, serta perlu relevan dengan objektif kajian. Dalam
usaha untuk mengurangkan ralat pengukuran yang berkaitan dengan reka bentuk soal selidik
ini adalah penting untuk memastikan bahawa soal selidik:
- Boleh dijawab dalam jumlah masa yang munasabah
- Boleh ditadbir dengan baik oleh penemubual
- Menggunakan bahasa yang mudah difahami oleh kedua-dua penemubual dan
responden.
- Maklumat atau data yang dikumpul mesti mudah diproses kelak.
4


b) Kegagalan Mengenalpasti Populasi Sasaran
Ralat sistematik boleh menyebabkan keputusan kajian gagal membuat generalisasi kepada
populasi sasaran dengan memesongkan penganggar kajian ke satu arah tertentu. Sebagai
contoh, jika populasi sasaran adalah penduduk di seluruh negara tetapi responden yang
dipilih berdasarkan rangka persampelan penduduk di bandar sahaja, maka keputusan kajian
itu tidak mewakili populasi sebenar kerana berlaku bias sistematik dalam rangka
pensampelan.

Selain itu, kaedah pengumpulan data juga boleh menyebabkan berlakunya ralat pengukuran.
Bagaimana soal selidik itu diedarkan kepada responden, sama ada secara mel, edar sendiri,
soal selidik melalui internet dan sebagainya boleh mempengaruh jawapan yang diberikan
oleh responden.

c) Penemubual
Penemubual atau pembanci mungkin melakukan kesilapan terhadap soal selidik yang beliau
edarkan kerana beliau tidak membaca perkara-perkara yang sepatutnya dimaklumkan
kepada responden, menambah maklumat lain yang boleh mengelirukan responden dan
sebagainya. Responden yang menjawab soalan boleh dipengaruhi oleh tingkah laku, jantina
dan loghat penemubual serta penemubual mungkin mendorong jawapan apabila responden
tidak memahami soalan. Bias juga mungkin berlaku jika penemubual tidak mendapat latihan
yang mencukupi. Cara terbaik untuk mengurangkan bias penemubual adalah melalui latihan
yang berkesan dan memastikan beban kerja mereka terkawal.
d) Responden
Pengetahuan, pengalaman dan sikap seseorang responden yang berbeza mungkin akan
mentafsir makna item-item dalam soal selidik secara berlainan. Martin (1964) menambah
bahawa wujud apa yang dimaksudkan sebagai gaya tindakbalas persetujuan iaitu responden
cenderung untuk bersetuju dengan kenyataan tanpa mengira apakah kandungan item-item
dalam soal selidik tersebut. Responden yang tidak memberi maklumbalas atau tidak
menjawab soalan soal selidik dengan lengkap boleh menyebabkan berlaku ralat sistematik.
Kekeliruan dan ketidakupayaan responden untuk menjawab soalan, bias memori dan
maklumat yang tidak tepat akan membawa kepada bias dalam penganggaran. Beban
responden yang bertambah (misalnya, soalan yang ditanya berulang-ulang, soalan berbentuk
peribadi) juga boleh membuatkan sukar untuk mendapatkan responden yang berpotensi
untuk mengambil bahagian dalam kaji selidik. J adi, apabila membentuk soalan soal selidik
harus diingat bahawa responden perlu diingatkan bahwa setiap maklumbalas diberi akan
melindungi privasi peribadi, integriti dan kepentingan responden.
e) Ralat Pemprosesan
Terdapat beberapa peringkat dalam pemprosesan data di mana kesilapan mungkin berlaku,
iaitu pada peringkat semakan awal atau dandanan data, mengedit data dan penganggaran.
Dandanan data bermaksud menyemak data mentah sebelum memasukkan data ke dalam
sistem (misalnya, format excel) untuk diproses. Dandanan data secara teliti dan pengurusan
kualiti pada peringkat ini dapat mengenalpasti data-data yang tidak sempurna (misalnya,
5

data sama dimasukkan berulang kali atau data terlupa dimasukkan. Semakan awal data yang
kurang teliti boleh menyebabkan kesilapan data pada peringkat pengeditan dan
penganggaran. Untuk meminimumkan kesilapan-kesilapan, kakitangan pemprosesan data
yang dilantik perlu diberi latihan yang mencukupi dan beban kerja yang realistik. Untuk
meminimumkan kesilapan-kesilapan ini, mereka yang dilantik perlu diberi latihan yang
mencukupi tentang teknik mengedit data dan beban kerja yang realistik.
J adi, bagaimana kita boleh mengurangkan kesilapan pengukuran, sama ada ralat rawak atau
ralat sistematik?. Satu perkara yang boleh anda lakukan adalah dengan mengadakan pra-
ujian bagi menguji instrumen yang anda gunakan dalam soal-selidik. Pra-ujian memberi
maklumbalas daripada responden tentang aras kesukaran soal selidik anda dan maklumat
tentang bagaimana persekitaran memberi kesan kepada mereka. Kedua, jika pengumpulan
data menggunakan khidmat pembanci atau penemuduga, pastikan mereka mendapat latihan
secukupnya supaya kesilapan pembanci dapat diatasi. Ketiga, apabila anda telah berjaya
mengumpul data kajian, anda perlu menyemak data dengan teliti. Semua kemasukan data
dalam komputer untuk dianalisis perlu disemak berulangkali.
KEBOLEHPERCAYAAN
Secara konsepsual anda boleh sebutkan beberapa perkataan yang sinonim dengan
kebolehpercayaan seperti konsisten, ketekalan, keteguhan, stabil, boleh dipercayai, dan
boleh diharap. Kebolehpercayaan adalah keadaan apabila ujian atau alat ukur yang
digunakan untuk mengukur sesuatu, sekiranya diulangi akan memberikan keputusan yang
serupa. Alat ukur yang mengukur sesuatu pembolehubah dengan tekal (tanpa bias/bebas
kesilapan) dan memberi keputusan yang sama dikatakan mempunyai kebolehpercayaan
yang tinggi. Misalnya, timbang atau dacing yang digunakan untuk menimbang benda yang
sama (katakan sekilo gula) menghasilkan berat yang berbeza-beza dikatakan tiada
kebolehpercayaan. Dalam penyelidikan sains sosial, soal selidik merupakan salah satu alat
ukur yang sering digunakan. J ika alat ukur seperti soal selidik ini mengandungi arahan,
soalan atau pernyataan yang tidak jelas maka ia akan mempengaruhi kebolehpercayaan alat
ukur tersebut.
Alpha Cronbach adalah ukuran ketekalan dalaman, iaitu, bagaimana satu set item-
item itu berkait rapat sebagai satu kumpulan. Nilai alfa yang "tinggi" sering digunakan
sebagai bukti bahawa item-item tersebut sesuai untuk mengukur sesuatu konstruk. Secara
teknikal, alpha Cronbach bukanlah ujian statistik tetapi ia adalah satu pekali
kebolehpercayaan atau konsistensi. Kaedah korelasi boleh digunakan bagi mengukur
kebolehpercayaan alat ukur seperti soal selidik. Alpha Cronbach adalah pekali
kebolehpercayaan dengan jarak nilai antara 0 dan 1. Secara umum, pekali alpha 0.8 atau
lebih tinggi menunjukkan kebolehpercayaan alat ukur yang baik. Bagaimanapun,s esetengah
penyelidik mencadangkan 0.6 dan ke atas boleh diterima, terutamanya bagi kajian
permulaan.
Dalam penyelidikan, anda mungkin mempunyai soalan penyelidikan serta hipotesis
yang jelas dan bersesuaian, tetapi jika alat yang anda guna untuk mengukur tingkahlaku
yang anda ingin kaji adalah salah, lupakan saja rancangan anda untuk berjaya mencapai
matlamat yang ditetapkan. Kebolehpercayaan (atau konsistensi) dan kesahan (atau kualiti)
alat pengukuran adalah penting kerana ketiadaan dua perkara tersebut boleh menyebabkan
anda membuat keputusan yang salah dalam menerima atau menolak hipotesis penyelidikan
anda.

6

Terdapat tiga jenis kebolehpercayaan:

kebolehpercayaan test-retest
kebolehpercayaan interrater
kebolehpercayaan ketekalan dalaman (pekali alfa)

Kedua-dua jenis kebolehpercayaan iaitu test-retest dan interrater adalah suatu indeks
bagi korelasi product-moment. Fail data perlu mempunyai dua markah pada baris yang sama
bagi setiap subjek. Fail ini perlu dibuat selama dua minggu bagi menganggarkan
kebolehpercayaan test-retest yang merupakan ukuran kestabilan. Sebaliknya, kedua-dua
skor mewakili penilaian berasingan yang dibuat oleh dua pembantu penyelidik, kita akan
menggunakan data ini untuk mengira kebolehpercayaan interrater. Prosedur statistik adalah
sama.
Kebolehpercayaan jenis ketekalan dalaman sering digunakan dalam kajian. Sebagai
contoh, seorang penyelidik telah mencipta soal selidik yang mengandungi lapan soalan atau
item untuk mengukur tahap kepuasan kerja kakitangan bawahan di sebuah syarikat
multinasional yang beroperasi di negara ini. Setiap soalan mempunyai Skala Likert 5-mata
iaitu dari "sangat tidak setuju" hingga "sangat setuju". Dalam usaha untuk memahami sama
ada soalan-soalan dalam soal selidik ini boleh dipercayai untuk mengukur pembolehubah
kepuasan kerja, ujian alpha Cronbach telah dijalankan ke atas 30 kakitangan sebagai
sampel. J ika nilai pekali alpha setiap item 8.0 dan ke atas, maka item-item tersebut boleh
dikekalkan dalam soal selidik untuk mengukur tahap kepuasan kerja. Sebaliknya, jika salah
satu daripada lapan item tersebut mempunyai nilai pekali alpha 0.6 ke bawah, maka item
berkenaan patut digugurkan dari soal selidik atau item tersebut perlu diubah semula supaya
soalannya lebih mudah difahami oleh responden.
Oleh itu, alat pengukuran harus boleh dipercayai dan sah, jika tidak hipotesis
penyelidikan yang anda tolak mungkin betul tetapi anda tidak mengetahuinya.
Kebolehpercayaan dan kesahan adalah penting untuk memastikan kesimpulan yang anda
buat adalah tepat. J ika alat yang anda gunakan gagal mengukur apa yang sepatutnya diukur,
maka semua yang lain (data yang dikumpul dan dianalisis untuk menguji hipotesis) akan
turut gagal. Perbincangan seterusnya akan menumpukan kepada kebolehpercayaan dan
kesahan iaitu dari segi maksudnya dan bagaimana ianya berlaku.

KESAHAN
Kesahan bermaksud sejauh mana keupayaan suatu ujian itu mengukur apa yang sepatutnya
ia dikehendaki mengukur. Kesahan merujuk kepada sejauh mana kajian itu secara tepat
mencerminkan atau menilai konsep khusus yang penyelidik cuba untuk mengukur. J ika
kebolehpercayaan berkaitan dengan ketepatan alat pengukur sebenar atau prosedur, kesahan
pula berkenaan dengan kejayaan kajian yang dikaitkan dengan pengukuran apa yang
penyelidik hendak mengukur. J ika ujian sememangnya mengukur apa yang ia sepatutnya ia
mengukur, maka anda boleh mengatakan bahawa ujian itu adalah sah atau mempunyai
kesahihan. Dalam bidang psikologi, ujian biasanya dinilai berdasarkan kesahan dan
kebolehpercayaan. J ika ujian itu menghasilkan keputusan yang sama setiap kali ujian itu
diulangi, maka ujian tersebut dikatakan mempunyai kebolehpercayaan. Walau
bagaimanapun, sesuatu ujian itu mungkin boleh dipercayai tetapi tidak mempunyai kesahan.
Kesahan sesuatu ukuran adalah penting bagi membolehkan sesuatu ujian itu adalah sah bagi
7

membolehkan keputusan yang tepat dan boleh ditafsirkan. Contohnya, skor ujian adalah alat
pengukuran yang sah bagi mengukur pembolehubah prestasi pelajar.
Kesahan Dalaman
Kesahan dalaman berlaku apabila seorang penyelidik mengawal semua pembolehubah
luaran dan pembolehubah yang mempengaruhi keputusan kajian sahaja telah
dimanipulasikan oleh penyelidik. Ini bermakna pembolehubah yang telah ditentukan oleh
penyelidik sahaja boleh mempengaruhi keputusan kajian, bukan pembolehubah lain yang
tidak diingini. Kesahan dalaman merujuk kepada ketelitian kajian itu dijalankan. Misalnya,
reka bentuk kajian, ketepatan dalam membuat pengukuran serta keputusan tentang apa yang
boleh dan apa yang tidak boleh diukur. Kedua, kesahan dalaman juga merujuk kepada
sejauh mana rekabentuk kajian mengambil kira penjelasan alternatif bagi apa-apa hubungan
sebab-musabab bagi kajian penerokaan yang dijalankan (Huitt,1998). Kesahihan bermakna
adakah ujian mengukur apa ia yang bertujuan untuk mengukur. Sejauh mana kesimpulan
tertentu boleh dibuat berdaasarkan skor ujian atau pengukuran yang lain (Mehrens dan
Lehman, 1987).
Kesahan tidak ditentukan oleh satu statistik sahaja, tetapi oleh keseluruhan
penyelidikan yang menunjukkan hubungan antara ujian dan tingkah laku yang cuba diukur.

Terdapat tiga jenis kesahan:

1. Kesahan Kandungan
2. Kesahan Kriteria
3. Kesahan Gagasan

1. Kesahan kandungan
Kesahan kandungan ialah bagaimana baik sampel bagi item-item ujian dapat mewakili
kandungan ujian yang dibentuk bagi tujuan pengukuran. Kesahan kandungan juga merujuk
kepada sejauh mana kandungan item-item ujian mewakili keseluruhan kandungan yang
hendak diukur ataupun kecukupan kandungan bagi ujian yang mewakili keseluruhan
kandungan yang diuji untuk dibuat generalisasi. Contohnya, jika sesuatu ujian itu hanya
mengambil maklum balas daripada sampel untuk mengkaji tingkahlaku, maka kesahan
tentang apa-apa kesimpulan yang dibuat bergantung kepada perwakilan sampel yang
diambil. Terdapat dua soalan berkaitan yang sepatutnya dijawab oleh penyelidik. 1) Adakah
sampel bagi ujian itu dapat mewakili semua bahagian-bahagian penting domain tingkahlaku
yang dikaji?. 2) Adakah ujian itu bebas daripada pembolehubah yang tidak releven sehingga
menjejaskan kesahihan kesimpulan yang dibuat?
Kandungan adalah jenis kesahan bukan statistik yang melibatkan pemeriksaan
sistematik bagi kandungan ujian untuk menentukan sama ada ia meliputi sampel yang
diwakili bagi domain tingkah laku yang hendak diukur" (Anastasi & Urbina, 1997).
Misalnya, adakah soal selidik IQ mempunyai butiran yang meliputi bidang kecerdasan yang
dibincangkan dalam literatur saintifik?
Apabila ujian mempunyai kesahan kandungan, item-item ujian dapat mewakili
keseluruhan item-item yang sepatutnya diliputi oleh ujian itu. Soalan-soalan ujian secara
individu boleh diambil daripada keseluruhan perkara yang meliputi topik kajian.
8


2. Kesahan Kriteria
Suatu ujian dikatakan mempunyai kesahan kriteria berkaitan apabila ujian tersebut telah
menunjukkan keberkesanannya dalam meramalkan kriteria atau indikator bagi konstruk
tersebut. Terdapat dua jenis kesahan kriteria yang berbeza, iaitu:

a) Kesahan Serentak
Kesahan Serentak berlaku apabila kriteria mengukur diperolehi pada masa yang sama
sebagai skor ujian. Contoh, ujian dijalankan bertujuan mengukur tahap kemurungan, maka
ujian itu dikatakan mempunyai kesahan serentak jika ia diukur semasa tahap kemurungan
yang sedang dialami oleh responden atau pengambil ujian.

b) Kesahan Ramalan
Kesahan ramalan berlaku apabila kriteria mengukur dapat ditentukan pada satu masa selepas
ujian dijalankan. Contohnya, ujian dengan kesahan ramalan ialah ujian kerjaya yang dapat
membantu untuk menentukan seseorang itu berjaya atau gagal dalam pekerjaan yang
dipohon. Begitu juga ujian kecenderungan atau ujian bakat yang membantu dalam
menentukan seseorang itu berjaya atau gagal dalam subjek tertentu.


3. Kesahan Gagasan
Sesuatu ujian dikatakan mempunyai kesahan gagasan atau konstruk jika ia menunjukkan
kaitan antara skor ujian dan ramalan bersifat teori. Ujian kecerdasan adalah satu contoh
instrumen pengukuran yang mempunyai kesahan konstruk. Kesahan konstruk merujuk
kepada setakat yang operasionalisasi sesuatu konstruk itu sebenarnya mengukur apa yang
dikatakan oleh teori. Contohnya, sejauh manakah soal selidik tentang IQ sebenarnya dapat
mengukur "kecerdasan".
Bukti kesahan konstruk melibatkan sokongan empirikal dan teoritikal untuk tafsiran
sesuatu konstruk. Contoh bukti ini termasuk analisis statistic struktur dalaman ujian
termasuklah hubungan di antara respon atau jawapan dengan item-item ujian yang
berlainan. Ini termasuk hubungan antara ujian dan ukuran bagi konstruk yang lain.
Analogi Hubungan Kebolehpercayaan dan Kesahan

Rajah 5.1 menunjukkan analogi hubungan konsep kebolehpercayaan dan kesahan ke atas
sasaran pengukuran yang dikehendaki oleh penyelidik. Katakan, seorang penembak tepat
menunjukkan kemahiran menembak terhadap tiga sasaran iaitu sasaran A, B dan C. Beliau
menggunakan dua jenis rifel iaitu rifel lama dan rifel moden tanpa sebarang gangguan
terhadap sasaran A dan B masing-masing.
9

Rifle lama
Kebolehpercayaandan
kesahanrendah
(Sasaran A)
Rajah 5.1: KebolehpercayaandanKesahankeatasSasaran
Rifle baru
Kebolehpercayaan
dankesahantinggi
(Sasaran B)
Rifle barudan
Kilauancahaya
Kebolehpercayaantinggi
tapi tiadakesahan
(Sasaran C)
Sumber: Keith K. Cox dan Ben M. Enis(1972)

Untuk sasaran ketiga iaitu C, beliau juga menggunakan rifel moden tetapi ada sedikit
gangguan kilauan matahari. Dapatan menunjukkan setiap tembakan pada sasaran A yang
menggunakan rifel lama tidak menepati sasaran (kesahan rendah) dan lebih berselerak
(kebolehpercayaan rendah). Berbeza dengan sasaran B, setiap tembakan yang menggunakan
rifel baru lebih menepati sasaran (kesahan tinggi) dan tidak begitu berselerak
(kebolehpercayaan tinggi). Sasaran C pula dengan menggunakan rifel moden dan sedikit
gangguan kilauan matahari menyebabkan setiap tembakannya tersasar dari sasaran (tiada
kesahan) tetapi tidak begitu berselerak (kebolehpercayaan tinggi). Secara umumnya dalam
sesuatu pengukuran, seseorang penyelidik memerlukan alat ukur yang boleh dipercayai dan
mengukur apa yang sebenarnya diukur (kesahan tinggi) sepertimana yang ditunjukkan pada
sasaran B.

10

You might also like