iit
Teori Reliabilitas
Secara teknis, berbagai teori tes memberikan kerangka
kerja umum yang menghubungkan antara variabel yang tampak
(observed variables), seperti skor aitem dan skor tes, dengan
Variable yang tidak tampak (unobservable variables), seperti skor
abilitas atau skor laten. Dalam kerangka kerja teori tersebut
kemudian disusunlah model! tes tertentu sesuai dengan spesifikasi
hubungan di antara konsep-konsep teoretik yang dipergunakan
beserta berbagai asumsi yang melandasinya.
Teori tes klasik (Classical Test Theory - CTT) beserta
modelnya telah diteliti dan dipergunakan dengan sangat berhasil
sejak lebih dari 80 tahun yang lalu, dan sampai sekarang banyak
sekali program testing yang tetap dilakukan dengan berlandaskan
pada metode dan model pengukuran klasik, sekalipun sejak tahun
1990an para ahli pengukuran memiliki pilihan untuk menggunakan
kerangka kerja teori klasik atau kerangka kerja teori respons
aitem (Item-Response Theory disingkat JRT), atau menggunakan
kombinasi keduanya (Hambleton & Jones, 1993).
Teori tes klasik bekerja pada tataran skor tes dengan
Menggunakan model linier dalam menjelaskan model skor. Tanpa
membicarakan hubungan antara aitem dan abilitas secara spesifik,68
teori ini dilandasi oleh berbagai asumsi yang lemah (yaitu
asumsi yang mudah dipenuhi oleh data tes), dan dapat digu
dengan layak meskipun hanya dengan sampel yang beruburan
tidak terlalu besar (sekitar 200 sampai 500 subjek).
ASUMSI TEORETIK MENGENAI SKOR
Performansi individu, yaitu respons subjek terhadap aitem-
aitem dalam skala pengukuran atau tes psikologi, dinyatakan
dalam bentuk angka yang disebut skor (scores). Skor tidak lain
daripada harga suatu jawaban terhadap pertanyaan dalam tes
yang -meskipun tidak sempurna- merupakan representasi dari
suatu atribut laten. Skor kuantitatif yang langsung diperoleh
sebagai hasil Proses pengukuran dan belum diolah atau belum
diderivasikan ini merupakan skor Perolehan (obtained scores atau
observed Scores) yang selanjutnya disebut sebagai skor-tampak
dan diberi simbol huruf xX.
Bersamaan dengan itu, bagi setiap individu atau subjek
yang mendapat skor-tampak xX, terdapat pula angka lain yang
merupakan skor sesungguhnya. Skor sesungguhnya adalah angka
performansi yang benar dan merupakan representasi murni dari
atribut laten, yang tidak pernah dapat diketahui besarnya oleh
karena tidak dapat diungkap secara langsung oleh tes iH 5a
Skor yang sesungguhnya tersebut selanjutnya disebut sk ne
(true-scores) yang dilambangkan oleh huruf T, . an
Kemudian, menyertai setiap hasil pen ae
pula adanya suatu komponen kesalahan dalam per lteorikan
komponen eror (error) yang besaran kuantitasnya baa atau
individu dalam setiap tes juga tidak dapat diketahui, i
eror dalam pengukuran ini disimbolkan dengan huruf E.69
Ketiga komponen skor tes di atas, dalam Teori Skor Klasik,
diasumsikan memiliki hubungan sebagaimana diuraikan oleh Allen
& Yen (1979) berikut ini:
Asumsil: X= T+E
Asumsi ini menyatakan bahwa hubungan yang berlaku di
antara skor-tampak, skor-murni, dan eror adalah bersifat aditif.
Besarnya skor-tampak X bagi setiap individu ditentukan bersama
oleh besarnya skor-murni T individu tersebut dan besarnya eror
pengukuran E. Dengan kata lain, bilamana dalam pengukuran
tidak terjadi eror (yaitu bilamana E = 0) maka skor-tampak X
akan identik dengan skor-murni T. Sebaliknya, bila dalam
pengukuran terjadi eror, maka eror negatif akan menyebabkan
underestimasi terhadap skor-murni sedangkan eror positif akan
menghasilkan skor-tampak yang merupakan suatu overestimasi
terhadap skor-murni.
Seseorang yang memiliki skor IQ yang murni atau yang
sesungguhnya sebesar T\, = 104, dan dari pengukuran dengan
suatu tes IQ ia memperoleh skor sebesar Xi, = 110, maka hasil
pengukuran tersebut mengandung eror sebesar E = +6. Bila pada
kesempatan lain orang yang sama dites kembali dengan tes yang
sama dan kemudian diperoleh hasil sebesar Xi, = 103, maka pada
pengukuran yang ke dua ini terjadi eror sebesar E = -1. Dapat
pula terjadi -pada kesempatan lain- diperoleh Xig = 104 yang
berarti eror pengukurannya adalah E = 0. Salah-satu di antara
tiga macam hasil yang dicontohkan tersebut akan terjadi pada
setiap kali pengukuran dilakukan.
Karena besarnya skor-murni seseorang diasumsikan tetap
pada setiap pengukuran yang diulang (dengan asumsi setiap
pengulangan pengukuran bersifat independen satu sama lain),
maka besarnya varians skor-tampak X yang diperoleh individu
akan tergantung pada variasi eror pengukuran E yang terjadi.70
Asumsi2: €(X) = T
Asumsi ini menyatakan bahwa skor-murni T merupakan
nilai harapan X (expected value of X), yaitu €(X). Jadi, skor T
merupakan harga rata-rata dari distribusi teoretik skor X apabila
individu yang sama dikenai tes yang sama berulangkali dengan
asumsi pengulangan tes itu dilakukan tidak terbatas banyaknya
sedangkan setiap pengulangan tes adalah independen satu sama
lain.
Dari ilustrasi terdahulu, dapat dikatakan bahwa skor-murni
IQ sebesar T,, = 104 merupakan rata-rata teoretik atau €(X.) dari
suatu distribusi teoretik skor-tampak IQ bagi individu yang
bersangkutan, andai ia dites berulangkali sampai tak terbatas
banyaknya (sekali lagi hal ini berlaku hanya dengan asumsi tidak
adanya pengaruh kelelahan dan hasil tes yang satu tidak saling
mempengaruhi dengan hasil yang lain).
Asumsi3: Per = O
Korelasi antara eror pengukuran dan skor-murni adalah 0.
Menurut asumsi ini -bagi suatu kelompok populasi subjek yang
dikenai tes- distribusi eror pengukuran E dan distribusi skor-murni
T adalah independen satu sama lain. Variasi eror tidak tergantung
pada variasi skor-murni.
Implikasinya adalah bahwa skor-murni yang tinggi (abilitas
subjek tinggi) tidak akan mempunyai eror yang selalu positif
ataupun selalu negatif. Hal yang serupa juga berlaku bagi
skor-murni yang rendah (abilitas subjek rendah), mereka juga
tidak akan cenderung mengandung eror yang selalu positif atau
pun selalu negatif. Dengan kata lain, overestimasi tidak hanya
dapat terjadi terhadap skor-murni yang rendah tapi juga dapat
terjadi terhadap skor-murni yang tinggi. Sebaliknya, underestimas:71
tidak hanya dapat terjadi pada skor-murni yang tinggi tapi juga
dapat terjadi pada skor-murni yang rendah.
Asumsi@€ = Peteo= O
Bila E, melambangkan eror pada pengukuran atau pada tes
pertama dan E, melambangkan eror pada tes yang ke dua maka
asumsi ini mengatakan bahwa distribusi eror pengukuran pada
kedua tes tersebut, yaitu E; dan E,, tidak berkorelasi satu sama
lain. Artinya, besarnya eror pada suatu tes tidak tergantung pada
eror dari tes lain.
Seseorang yang skor-tampaknya pada tes yang pertama
mengandung eror besar tidak berarti akan mempunyai eror yang
besar pula pada skor-tampak tes yang ke dua, begitu juga
sebaliknya. Asumsi ini berlaku dengan pengertian bahwa pada tes
yang pertama dan pada tes yang ke dua tidak ada pengaruh
kelelahan, pengaruh latihan, dan pengaruh semacamnya. Adanya
faktor-faktor luar yang secara sistematik mempengaruhi skor pada
kedua tes secara bersamaan akan menyebabkan adanya korelasi
di antara eror dari kedua tes yang bersangkutan.
Asumsi 5? Per2 = 0
Asumsi ke lima mengatakan bahwa eror pada suatu tes
(E;) tidak berkorelasi dengan skor-murni pada tes lain (T;).
Artinya, eror pada satu tes tidak tergantung pada skor-murni pada
tes lain. Asumsi ini tidak berlaku apabila salah-satu tes yang
bersangkutan ternyata mengukur atribut yang dapat berpengaruh
terhadap terjadinya eror pada pengukuran yang lainnya.
Itulah lima asumsi pokok mengenai skor tes dalam teori
skor-murni klasik. Dalam teori ini, apa yang dimaksudkan dengan
eror dalam pengukuran adalah penyimpangan skor-tampak dari72
skor harapan teoretik yang terjadi secara random atau terjadi
tidak secara sistematik, sedangkan penyimpangan yang terjadi
secara sistematik tidaklah dianggap sebagai sumber eror.
Berkaitan dengan asumsi-asumsi di atas, dirumuskan pula
konsep mengenai tes yang para/e/, Menurut teori ini, dua bentuk
tes disebut paralel satu sama lain apabila skor-murni dari setiap
subjek adalah sama pada kedua tes tersebut (yaitu T =T), dan
bagi setiap populasi subjek yang dikenai tes-tes tersebut varians
eromya adalah sama besar yaitu of = oe*. Batasan tersebut
mengandung arti bahwa dua tes yang paralel akan memiliki mean
dan varians skor-tampak yang setara serta keduanya memiliki
korelasi dengan skor-tampak tes lain yang setara pula. Walaupun
demikian, distribusi skor-tampak subjek pada dua tes yang paralel
tidak harus berkorelasi sempurna.
Batasan lain yang dirumuskan oleh teori skor-murni klasik
adalah pengertian mengenai dua bentuk tes yang memiliki sifat
essentially T-equivalent (pada dasarnya memiliki skor-murni yang
setara). Dua bentuk tes mempunyai sifat essentially T- equivalent
apabila besarnya perbedaan skor-murni setiap individu pada
kedua tes tersebut, selalu tetap. Jadi, bila skor-murni seseorang
pada tes yang pertama besarnya adalah T; dan skor-murninya
pada tes yang ke dua besarnya adalah T, maka berlaku 11 = Tr +
C, di mana C merupakan suatu bilangan konstan. Dua tes yang
bersifat essentially T-equivalent dapat saja memiliki varians eror
yang berbeda karena keduanya belum tentu merupakan tes yang
paralel, namun sebaliknya setiap dua bentuk tes yang paralel
tentu memenuhi syarat untuk disebut sebagai tes yang bersifat
essentially T-equivalent.
RELIABILITAS DAN EROR PENGUKURAN
Salah-satu asumsi dalam teori skor klasik yang telah
dikemukakan terdahulu menyatakan bahwa skor-tampak X terdir!atas komponen skor-murni T dan komponen eror E dalam kadar
tertentu, yaitu X = T + E. Dalam kasus dengan 7 yang tidak
terbatas, diasumsikan bahwa eror pengukuran akan memiliki
suatu distribusi dengan angka rata-rata eror ({/-) sebesar 0 dan
varians r sebesar oe. Semakin besar porsi varians eror maka
pe ran semakin kurang reliabel, sebaliknya semakin kecil
porsi varians eror maka hasil pengukuran tes dikatakan semakin
reliabel. Bila dari suatu populasi individu varians skor-murninya
adalah oF dan bila varians eror oe adalah sama bagi setiap skor
individu dalam populasi tersebut, maka besarnya reliabilitas hasil
ukur dapat dirumuskan sebagai Py = of (Of + 02°).
Jadi, variabilitas keseluruhan dari skor individual, yaitu
(of +02), disebabkan oleh dua hal, yaitu pertama disebabkan
perbedaan yang sesungguhnya di antara individu (diperlihatkan
oleh@7s"dan yang ke dua disebabkan oleh variabilitas eror (yang
diperlihatkan oleh Oe). Dari sini dapat dikatakan bahwa reliabilitas
hasil ukur adalah proporsi variabilitas skor tes yang disebabkan
oleh perbedaan yang sebenarnya di antara individu, sedangkan
ketidakreliabelan hasil ukur adalah proporsi variabilitas skor tes
yang disebabkan oleh eror pengukuran. Selanjutnya, berdasarkan
asumsi-asumsi teoretik mengenai skor yang diuraikan di atas,
koefisien reliabilitas hasil pengukuran ?,, dapat diinterpretasikan
sebadaieberikut (Allen & Yen, 1979).
Interpretasi 1: Px’ = korelasi skor-tampak antara dua tes yang
paralel
Interpretasi ini mengatakan bahwa besarnya_ koefisien
reliabilitas hasil ukur ditentukan oleh sejauhmana_ distribusi
skor-tampak pada dua tes yang paralel, berkorelasi. Bila setiap
individu, pada dua tes yang parallel, memperoleh skor-tampak X
dan X’ yang masing-masing identik atau masing-masing memiliki
perbedaan yang sama dan pada masing-masing distribusi skor testerdapat variasi, yaitu varians skor-tampaknya tidak sama c
0, maka kedua tes tersebut mempunyai reliabilitas yang s
dengan koefisien sebesar pj. = 1,00. Sebaliknya, bila
Skor-tampak pada suatu tes tidak berkorelasi sama sekali dengan
distribusi skor-tampak pada tes paralelnya maka skor pada kedua
tes tersebut tidak reliabel dan koefisien reliabilitasnya P.. = 0
Koefisien Korelasi antara skor X dengan skor X’ sebesar 0,90
berarti koefisien reliabilitas hasil ukur tes tersebut (baik X maupun
X) adalah 0,90. Interpretasi ini menjadi asumsi dasar dalam
prosedur estimasi reliabilitas dengan pendekatan bentuk-paralel
(parellel-forms) dan prosedur estimasi reliabilitas pengukuran
dengan pendekatan bentuk sejajar (a/ternate-forms)
Interpretasi 2: Dox? = besarnya proporsi varians X yang
dijelaskan oleh hubungan liniernya dengan Xx
Kuadrat koefisien reliabilitas adalah sama dengan besarnya
proporsi varians skor X yang dapat dijelaskan oleh hubungan
liniemya dengan skor xX’. Interpretasi ini sama dengan pengertian
koefisien determinasi sebagaimana dilakukan terhadap _hasil
komputasi koefisien korelasi linier Pearson.
Jadi, besarnya kuadrat koefisien reliabilitas dapat diartikan
sebagai besarnya proporsi varians suatu tes yang dapat dijelaskan
oleh varians skor pada tes lain yang paralel dengannya. Dengan
koefisien reliabilitas Px = 0,90 berarti proporsi varians skor X
yang dapat dijelaskan oleh skor X’ adalah 0,81 atau 81%.
Besamya proporsi vanians skor tes X
yang dijelaskan oleh varians skor tes
X' yana paralel75
: eee:
Interpretasi 3: Pyy' = O; / Oy
Koefisien reliabilitas adalah perbandingan antara varians
skor-murni dan varians skor-tampak pada hasil ukur suatu tes.
Dapat juga dikatakan bahwa koefisien reliabilitas adalah besarnya
proporsi varians skor-murni yang terkandung dalam varians
skor-tampak. Suatu koefisien reliabilitas sebesar 2,. = 0,80 berarti
bahwa 80 persen dari varians skor-tampak merupakan varians
skor-murni.
go Varians skor-tampak = 0,2
80%
—
~_
Varians skor-mumi = 0
Ketika semua perbedaan yang terjadi pada skor-tampak
merefleksikan perbedaan skor-murni diantara subjek, yaitu 0,° =
*, Maka reliabilitas hasil ukur tersebut adalah sempurna dengan
Px’ = 1,00. Dalam hal ini perbedaan setiap skor-tampak
roleh subjek yang satu dengan yang lainnya memang
inkan_ perbedaan skor-murni yang ada diantara mereka,
merupakan perbedaan yang disebabkan oleh faktor-faktor
in sebagai sumber eror dalam pengukuran itu.
Bila reliabilitas hasil pengukuran tidak sempurna, yaitu bila
besarnya koefisien reliabilitas dinyatakan sebagai Px < 1,0 berarti
dalam pengukuran yang dilakukan oleh tes yang bersangkutan
terkandung sejumlah eror. Besar-kecilnya eror dicerminkan oleh
seberapa jauh jarak Px dari angka 1,0. Semakin kecil koefisien
reliabilitas, yaitu semakin jauh dari angka 1,0 berarti semakin
besar variasi eror pengukuran yang terjadi.76
Koefisien reliabilitas yang besarnya mendekati atau same
dengan 0 menunjukkan bahwa keseluruhan skor-tampak dalam
tes itu hanya merefleksikan eror pengukuran semata-mata dan
perbedaan di antara skor-tampak yang terjadi tidak menunjukkan
perbedaan yang sebenarnya ada di antara skor-murni subjek
melainkan menunjukkan adanya eror yang timbul secara random
Interpretasi ini sangat penting artinya dalam menilai dan
memutuskan apakah suatu koefisien reliabilitas dapat dianggap
sebagai cukup bermakna atau tidak dan apakah hasi! ukur tes
yang bersangkutan cukup memuaskan atau tidak.
Interpretasi 4: Py = Pat”
< Koefisien reliabilitas merupakan kuadrat koefisien korelasi
antara skor-tampak dan skor-murni. Jadi, bila koefisien reliabilitas
Pax = 0,64 maka Px = V0,64 = 0,80. Bila besarnya koeli:
= 0,49 maka Px = V0,49 = 0,70.
1 Pee
~~. Dari kedua contoh di atas tampak bahwa koefisien korelasi
antara skor-tampak dengan skor-murni selalu akan lebih besar
daripada koefisien reliabilitasnya, selama koefisien reliabilitas itu
tidak sama dengan 0 atau 1,0. Adalah fakta dan kebenaran logis
pula bahwa koefisien korelasi antara skor suatu tes dengan skor
pada tes atau pada variabel lain tidak akan lebih tinggi daripada
koefisien korelasi skor-tampak tes itu dengan skor-murninya
sendiri. Kalau skor-tampak pada tes atau variabel lain itu diberi
simbol Y maka kenyataan tersebut mendukung pernyataan bahwa
Prt 2 Px yaitu korelasi maksimal antara X dan Y adalah p,..
Menurut interpretasi ini, yaitu Py = 2,7 atau Vox = Paty
maka Vx 2 Px. Dalam simbolisasi validitas, skor X sendiri
merupakan skor tes dan skor Y merupakan skor kriteria validasi
sedangkan kofisien validitas disimbolkan oleh Pry, Oleh karena itu77
nyatalah bahwa besarnya koefisien validitas hasil ukur (Dx) tidak
akan melebihi besarnya akar kuadrat koefisien reliabilitasnya
(VPec), sehingga dapat disimpulkan bahwa rendahnya reliabilitas
akan_mémbatasi validitas.
Interpretasi 5: Dy = 1 - Pye?
Interpretasi kelima menyatakan bahwa koefisien reliabilitas
adalah sama dengan satu dikurangi oleh kuadrat koefisien korelasi
antara skor-tampak dengan eror pengukuran. Semakin tinggi
korelasi antara skor-tampak dan eror pengukuran, akan semakin
kecil koefisien reliabilitasnya. Interpretasi seperti ini erat berkaitan
dengan suatu pengertian bahwa sejauhmana varians skor-tampak
mencerminkan eror pengukuran dapat dilihat pada penurunan
besaran koefisien reliabilitas.
Besarnya proporsi varians skor-tampak yang berkaitan
dengan varians eror dilambangkan oleh ye’. Semakin besar
Proporsi varians eror tersebut maka semakin eratlah kaitan antara
skor-tampak yang diperoleh subjek dengan eror pengukuran dan
koefisien reliabilitas hasil tes semakin rendah. Idealnya, antara
skor-tampak dan eror pengukuran sama sekali tidak berkorelasi
(Pee = 0), yang artinya reliabilitas pengukuran adalah sempurna.
: 2
Interpretasi 6: Pyx' = 1 - oe Ox
Sebagaimana interpretasi 5, interpretasi ini mengaitkan
koefisien reliabilitas dengan besarnya proporsi varians eror yang
terkandung dalam varians skor-tampak. Telah diketahui bahwa
besarnya varians eror akan mempengaruhi tingginya koefisien
reliabilitas. Bila varians eror sangat kecil maka skor hasil tes akan
mempunyai koefisien reliabilitas yang tinggi.Di sisi lain dapat dilihat bahwa derajat heterogenitas skor
subjek yang ditunjukkan oleh besarnya oO, mempunyai pengaruh
penting terhadap koefisien reliabilitas. Di bawah asumsi varians
eror tetap, tinggi-rendahnya koefisien reliabilitas akan tergantung
pada besar-kecilnya varians skor-tampak dari kelompok subjek
yang bersangkutan. Pada kelompok subjek yang skor-tampaknya
homogen -yaitu yang memiliki G7 kecil- harga rasio oe, akan
relatif lebih besar dibandingkan dengan harganya pada kelompok
subjek yang heterogen (yang terdistribusi dengan Ox. besar). Oleh
sebab itu, koefisien reliabilitas hasil ukur suatu tes yang dihitung
dari data suatu kelompok yang homogen akan relatif lebih rendah
dibandingkan dengan koefisien reliabilitasnya apabila dihitung
berdasarkan data kelompok yang heterogen. Sebagai ilustrasi, bila
estimasi dilakukan terhadap reliabilitas pengukuran suatu tes 1Q
berdasarkan data kelompok mahasiswa (kemampuan mental
umum mereka dapat dianggap relatif homogen) maka koefisien
reliabilitas yang diperoleh cenderung akan lebih rendah dibanding
kalau tes IQ tersebut dikenakan pada kelompok remaja campuran
dari berbagai tingkat pendidikan dan usia dan menyertakan pula
mereka yang tidak bersekolah, dikarenakan varians skor IQ pada
kelompok campuran ini akan lebih besar.
Demikianlah enam di antara cara interpretasi koefisien
reliabilitas menurut teori skor-murni klasik. Koefisien reliabilitas
yang diperoleh sebagai hasil komputasi terhadap data skor-
tampak merupakan suatu estimasi terhadap reliabilitas hasil
pengukuran sedangkan reliabilitas skor yang sesungguhnya tidak
dapat diketahui.
Besaran koefisien reliabilitas diteorikan berkisar antara 0
sampai dengan 1,0 akan tetapi dalam kenyataannya koefisien
reliabilitas hasil ukur psikologi yang mencapai angka 1,0 tidak
pernah dapat diperoleh. Koefisien reliabilitas yang berada di
antara 0 dan 1,0 dapat diartikan sebagai berikut:79
a, Hasil pengukuran yang dilakukan oleh tes yang
bersangkutan mengandung sejumlah eror.
b. X=T+E.
G oe = of + Oe, yaitu varians skor-tampak terdiri
atas varians skor-murni dan varians eror.
d. Perbedaan skor-tampak yang diperoleh subjek
sebagian memang mencerminkan adanya
perbedaan skor-murni dan sebagian lain
mencerminkan adanya eror.
e. Px = Vow, yaitu korelasi antara skor-tampak dan
skor-murni sama dengan akar kuadrat reliabilitas.
f. Pre = V(1- Px’), yaitu korelasi antara skor-tampak
dengan eror adalah sama dengan akar kuadrat dari
(1 dikurangi koefisien reliabilitas).
9. Pw = OF/02.
h. Semakin tinggi koefisien reliabilitas 7," berarti
estimasi X terhadap T semakin dapat dipercaya
dikarenakan varians erornya semakin kecil.
VARIANS EROR DAN SKOR-MURNI
Salah-satu interpretasi reliabilitas yang telah diuraikan di
atas dirumuskan dengan mengaitkan varians eror dan varians
skor-tampak, yang dinyatakan sebagai p,, = 1- 02/02. Dengan
berlakunya asumsi konstansi varians eror bagi setiap individu,
dapat dilihat bahwa perbedaan koefisien reliabilitas semata-mata
tergantung pada perbedaan varians skor-tampak. Semakin besar80
varians skor-tampak maka koefisien reliabilitas cenderung akan
semakin besar pula. Hubungan tersebut membawa kepada makna
reliabilitas dalam arti kecermatan fungsi tes dalam mengungkap
skor-murni, Perhatikan derivasi berikut ini.
= 8
Pxxr = 1 oe
2
oe
So PS
oe Prxt
G3 = 02(1 — Pyxr)
Ge = Oxf 1 = Prxr
Persamaan yang diperoleh terakhir -yang berupa akar
kuadrat dari varians eror- dinamai eror standar dalam pengukuran
(standard error of measurement). Semakin kecil harga 02 maka
hasil pengukuran semakin cermat dan semakin dapat dipercaya.
Dengan mengetahui besarnya eror standar dalam pengukuran,
kecermatan hasil ukur dapat diperlihatkan oleh lebar-sempitnya
interval kepercayaan skor-murni.
Interval kepercayaan skor-murni diestimasi berdasarkan
asumsi: (a)bahwa teori skor-murni klasik berlaku, (b)bahwa bagi
kelompok subjek yang bersangkutan eror pengukuran terdistribusi
secara normal, dan (c)bahwa eror standar pengukuran dalam
populasi adalah sama bagi semua subjek (homoscedasticity)
(Allen & Yen, 1979). Bila semua asumsi tersebut terpenuhi, maka
interval kepercayaan bagi skor-murni dirumuskan sebagai:
X - (Za2)0e TSX + (Zap2)0e81
Dalam formula di atas, 2/2 adalah nilai kritis dua-ujung
pada taraf kepercayaan yang dikehendaki yang besarannya dapat
dilihat pada tabel deviasi standar normal (lihat Lampiran A).
Sebagai ilustrasi, suatu tes memiliki koefisien reliabilitas
Px = 0,800 yang diperoleh dari sekelompok subjek yang memiliki
varians skor oe = 20. Seberapakah kecermatan hasil pengukuran
tes tersebut?
Pertama, tentukan terlebih dahulu taraf kepercayaan yang
dikehendaki, umpamanya sebesar 90%. Taraf kepercayaan 90%
berarti sama dengan taraf signifikansi sebesar 10% atau a = 0,10
sehingga a/2 = 0,05. Pada tabel deviasi normal dicari nilai 2/2
yang dalam contoh ini adalah 2,95 untuk kedua ujung distribusi
(two-tailed), yaitu dengan melihat pada p = 0,05 atau melihat
pada p = 0,95 akan tampak bahwa nilai z yang dimaksud adalah
+ 1,65. Kemudian, penghitungan eror standar dalam pengukuran
bagi kelompok subjek ini menghasilkan a2 = v[20(1-0,800)] = 2.
Dengan demikian, interval kepercayaan 90% skor-murni bagi skor
X adalah:
X- Ze S$ TEX + (Zo2)02
X - (1,65)(2) < T $ X + (1,65)(2)
X-3,3ST