You are on page 1of 8

POUZDANOST STAVKI I TESTA

Pouzdanost stavki proveravate tako što u SPSS-u, pokrenete opciju STATISTICS--


>RELIABILITY ANALISIS-SCALE - IF ITEM DELETED. Isključićete sve stavke čiji je
predznak negativan ili nizak (što se može videti u koloni 4 (CORRECTED ITEM-TOTAL
CORRELATION), zato što one nemaju isti predmet merenja kao preostale. Pored povećanja
pouzdanosti (kolona 5), odbacivanjem nepouzdanih stavki, ujedno povećavate indeks
homogenosti, odnosno interne valjanosti, testa.

Tabela 11.2: RELIABILITY ANALYSIS - SCALE (ALPHA)


Corrected Alpha if
Scale Mean Scale Variance
Item-Total Item
if Item Deleted if Item Deleted
Correlation Deleted
1 2 3 4 5
O1_003 141.3920 494.1655 .6260 .8707
O1_033 141.0348 524.0359 .1025 .8788
O1_063 141.2646 499.1268 .5350 .8722
O1_093 141.0321 510.7868 .3433 .8753
O1_123 141.1498 501.1998 .4821 .8730
O1_153 141.0575 515.6408 .2724 .8763
O1_183 141.3022 502.0148 .4718 .8732
O1_213 141.0916 515.8028 .2547 .8766
O2_008 141.4181 494.1228 .5769 .8712
O2_038 141.4761 487.9965 .6225 .8700
O2_068 141.1629 513.5470 .2560 .8768
O2_098 141.4800 495.1942 .5941 .8711
O2_128 141.1611 512.1173 .3012 .8760
O2_158 141.6570 487.8418 .6268 .8700
O2_188 141.4513 498.5662 .5364 .8721
O2_218 141.2735 507.3972 .3934 .8745
O3_013 141.4376 500.6568 .5060 .8727
O3_043 141.1936 507.3486 .4135 .8743
O3_073 141.7061 488.1636 .6361 .8699
O3_103 141.1867 507.6042 .4102 .8743
O3_133 141.6222 492.8382 .6415 .8704
O3_163 141.3223 502.3816 .4965 .8729
O3_193 141.5157 507.1476 .4430 .8739
O3_223 141.3984 499.5294 .5287 .8723
O4_018 141.0497 544.2865 -.2800 .8841
O4_048 141.6532 487.2940 .6466 .8697
O4_078 140.8009 551.0875 -.3776 .8862
O4_108 141.2021 510.7158 .3208 .8757
O4_138 140.8651 541.0769 -.2057 .8837
O4_168 141.1565 518.3062 .1826 .8779
O4_198 140.9196 545.3824 -.2825 .8847
O4_228 141.1347 525.6221 .0714 .8792
O5_023 141.0202 512.4295 .3012 .8760
O5_053 140.9480 511.8715 .2836 .8763
O5_083 141.4060 499.3938 .5153 .8724
O5_113 140.8898 517.6315 .2123 .8773
O5_143 141.1714 512.2218 .3157 .8757
O5_173 141.2875 504.3094 .4150 .8741
O5_203 141.5803 493.9480 .6300 .8706
O5_233 141.6170 493.1443 .6394 .8704
O6_028 140.9178 518.4971 .2129 .8772
O6_058 140.1826 529.8702 .0004 .8794
O6_088 141.4761 524.9933 .0726 .8795
O6_118 141.5743 500.8981 .4615 .8733
O6_148 140.8557 532.2413 -.0540 .8807
O6_178 141.7212 494.9853 .5798 .8713
O6_208 140.7223 527.9023 .0278 .8799
O6_238 141.1624 524.2589 .1089 .8785

Reliability Coefficients Alpha = 0.8777

Iz predhodne tabele je očito da su sasvim loše stavke O4_018, O4_078, O4_138 i O4_198.

Pri odbacivanju stavki mora se, prevashodno, voditi računa o psihološkom sadržaju samih stavki.
Može se desiti da su ispitanici drugačije protumačili psihološki smisao stavke nego što ste je
konstruktor testa očekivao. Na primer, preko 70% ispitanika će potvrdno odgovoriti na stavku
"Više volim da životu pristupam otvoreno nego da sve unapred isplaniram" kojom se želelo
meriti aspekt stremljenja redu i organizaciji iz domena savesnosti zato što su ispitanici atribut
"ovorenost" razumeli kao suprotno od "pritvrnosti". Ponekad nepouzdanost stavke određuje
psihološki smisao neke njene "prejake" reči. Na primer, stavkom "Kada jednom otkrijem najbolji
način da se nešto uradi onda ga ne menjam" konstruktor je želeo da meri "preduzimljivost i
aktivnost" spram "rutine i šablonizma". Međutim, ispitanici su termin "najbolji" (prejaka reč)
razumeli sasvim racionalno. Sami se zapitajte zašto bi neko, razuman, nešto što je "najbolje"
menjao za nešto što je, možda, dovoljno dobro. Drugi primer, stavkom "Više bih voleo da me
znaju kao >milosrdnog< nego kao >pravednog<" meri se aspekt "blage naravi" iz domena
"dobroćudnosti". Međutim, za ispitanike naše kulture obe reči (>milosrdan< i >pravedan<") su
"jake", pa će zato više od 40% njih biti neodlučno.
POUZDANOST TESTA

Odgovor na pitanje "Koliko, ovaj test, pouzdano i tačno meri ono što meri?" tiče se pouzdanosti
testa. Test je pouzdan ako svi njegovi delovi (uključujući i stvke) imaju isti predmet merenja i
ako se skor pojedinih ispitanika ne menja značajno od testiranja do testiranja. Alternativni nazivi:
RELIJABILNOST i FIDELITET (od engleskog reliability = osloniti se, imati poverenja;
francuski fidelite = vernost, tačnost)

Pouzdanost testa, u najširem smislu, se odnosi na tačnost merenja testom, a praktično se izražava
kao saglasnost skora istih ispitanika na istom testu u ponovljenim merenjima. Najopštije rečeno,
indeks pouzdanosti pokazuje u kojoj su meri razlike skorova ispitanika istom testu rezultat
stvarnih razlika u osobini koju test meri a u kojoj su meri rezultat delovanja slučajnih
(nekontrolisanih) činioca. Drugačije rečeno, indeks pouzdanosti je mera uticaja parazitskih
činilaca koji utiču na rezultat na testu, a koji nisu predmet merenja. Postoje različiti indeksi
pouzdanosti već prema tome koja nas vrsta parazitskih uticaja interesuje. Za sve je zajedničko da
se izražavaju koeficijentom korelacije dva rezultata istih ispitanika.

Ne postoje, barem ne u psihologiji, potpuno tačna (precizna) merenja. Dakle, nepreciznost prati
sva merenja. Zato se samo može govoriti o stepenu preciznosti merenja. Stepen nepreciznosti
izražava grešku merenja, a stepen preciznosti pouzdanost merenja. Pouzdanost je condicio sine
qua non za valjanost, ali ne važi obrnuto. Pouzdan instrument ne mora da bude i valjan
instrument. Na primer, merenjem inteligencije jednog ispitanika istim testom na uzrastu od 10
godina i uzrastu od 50 godina isti rezultat je, nesumnjivo, znak da je test pouzdan. Međutim,
(psihološki) da li je to moguće, odnosno (psihometrijski) da li je takav test valjan? (Vidi tabelu
30.1).

Tabela 30.1: Korelacija dva testa opšte spoosbnosti primenjena na istim ispitanicima, ali na dva različita
uzrasta (iz Eysenck, 1976, s.91)
1. TEST 2.TEST r
Starost 9 godina Starost 12 godina 0.85
Starost 4 godina Starost 7 godina 0.55
Starost 2 godina Starost 5 godina 0.32

Pouzdanost testa izražava proporciju odnosa prave i varijanse greške u ukupnoj varijansi
testovnih skorova istih ispitanika na istom testu u ponovljenim merenjima.

Slika 30.1: Totalna, prava i varijansa greške

Drugim rečima, iz slike 30.1 sledi da je dobijeni skor (X) zbir pravog skora (Xt) i skora greške
(Xg). Ako tačnost merenja izrazimo preko pouzdanosti onda to znači da bi potpuno pouzdan test
bi potpuno tačan instrument kada bi prava varijansa prava varijansa bila jednaka totalnoj i tome
sledstveno, varijansa greške bila jedaka nuli (Xg = 0).

STATISTIČKE MERE POUZDANOSTI

Premda su polazišta mera pouzdanosti, što će se videti iz njihovih naziva, veoma različita
praktični postupci su istovetni i/ili se mogu jednostavno transformisati jedan u drugi. Kao što
rekosmo zavisno od toga koji nas izvor netačnosti merenja interesuje koristimo i različite
postupke izračunavanja mera pouzdanosti. Praktično se najčeššće koristi pet postupaka, ali svaki
od njih imaju jednu ili više različitih matematičkih alternativa koje su psihometričari pronalazili
ne bi li smanjili zametnost izračunavanja u vreme kada nisu postojali računari. Danas, su te
varijacije osnovnih formula i postupaka potpuno nebitne. Tih pet osnovnih načina (metoda)
izračinavanja mera pouzdanosti su: test-retest, metod paralelnih testova, "split-half" metod,
Kuder-Ričardsonov metod i metod izračunavanja standardnih grešaka rezultata. Bez obzira koja
je mera pouzdanosti upotrebljena, barem kada je reč o klasičnoj teoriji merenja (KTM), uvek
valja imati na umu Gilfordove reči, da se uvek govori "o relijabilnosti izvesnog instrumenta,
primenjenog na izvesnu populaciju, pod izvesnim uslovima" (Guilford, 1968).

1. Test-retest metod

Isti test zadamo istim ispitanicima u dva (ili više) navrata sa određenim vremenskom razlikom.
Koeficijent korelacije (odnosno prosečan koeficijent korelacija) je koeficijent pouzdanosti. Ovaj
koeficijent govori o vremenskoj stabilnosti i vremenskom protezanju testa. Zašto nastaju razlike
u skorovima u dva zadavanja testa?:
 testovi stanja (raspoloženja) i testovi osobina
 uticaj vežbe i pamćenja stavki sa prethodnih testiranja
 stavke su toliko višesmislene da ih ispitanik uvek drugačije shvata i odgovara na njih

U Priručniku za svaki test, kada se navodi test-retest koeficijent, obavezno se i navodi i


vremenski interval koji je protekao između dva testiranja. Koliki treba da bude interval?
Dovoljno dug da se ispitanici ne sećaju prethodnih odgovora, a dovoljno kratak da se predmet
merenja ne promeni sam od sebe.
2. Metod paralelnih (alternativnih) formi;

Ovaj metod zahteva konstrukciju dva testa istog predmeta merenja koji se zadaju ispitanicima
uzastopno (sukcesivno). Na primer: za merenje asocijativne fluentnosti (iz oblasti verbalih
sposobnosti) konstruiše se prva forma testa u kojoj se od ispitanika traži da za 3 minuta smisli što
više reči koje su sinonimi za pojam "cvet", a zatim se sastavi druga forma u kojoj se od ispitanika
zahteva, za isto vreme, smišljanje sinonima za pojam "životinja". Zatim se koreliraju skorovi za
obe forme. Visina korelacije je mera pouzdanosti obe forme

Mane ove metode su u tome što je, ponekad, vrlo teško, (ponekad i nemoguće) naći alternativne
forme. Dalje, postoji izvestan prenos naučenosti usled uvežbavanja, koji je različit od ispitanika
do ispitanika (kontaminacija mera različitih sposobnosti). Zato nije profesionalno (ni kodeksom
dozvoljeno, između ostalog) da psiholozi pokazuje testove svojim prijateljima. Praktična
preporuka: Zadati što više ajtema u validacionom istraživanju i, o istom "trošku", konstruisati
više formi jednog testa.

Ponekad je nužno (kod nekih testova sposobnosti) i svih testova znanja koristiti paralelne forme
zato što razgovori među ispitanicima, pamćenje i razmišljanje o zadacima jedanog te istog testa
utiče na sva potonja ispitivanja.

Kada je reč o testovima ličnosti korišćenim u selekciji zgodan je postupak da se zadaju testovi za
koje postoji empirijski dokazana međusobna simulacija skala. Na primer, u selekcionoj situaciji
se zadaju dva testa ličnosti (PIE/JRS i EPQ). U ponovljenim selekcijama se daje samo jedan od
njih i matematički se simuliraju mere skala drugog testa (videti šire u Kostić i Anđelković, 2000,
str. 5).

3. "Split-half" metod deljenje testa na dva dela

Najviše izražava homegenost (internu konzistentnost ili "uzorak sadržaja") različitih delova testa.
Test se zada jednokratno, a zatim se podeli na dva dela (najčešće, osim kod brzinskih testova
sposobnosti) i to na par-nepar ajteme. Izračunaju rezultati posebno za parne posebno za neparne
zadatke i najzad se izračunava korelacija po standardnoj formuli.
Ako su zadaci poređani po težini (a tako bi trebalo da se radi u svim testovima sposobnosti tipa
snage) "paralelnost" formi najbolje se obezbeđuje par-nepar podelom testa. U tom slučaju broj
rešenih zadataka i njihov redosled rešavanja neće uticati na koeficijent pouzdanosti.

Međutim, pošto je poznato da pouzdanost testa zavisi od broja njegovih stavki (zadataka) logično
se zaključuje da se ovom metodom pouzdanost veštački smanjuje. Zato izračunavanje
pouzdanosti "split-half" metodom obavezno uključuje korekciju koja se, najčešće, vrši Spirman-
Braunovim obrazcem (S-B formulom). S-B formula glasi:

rxx = koeficijent pouzdanosti stavki, n = broj stavki u testu

rx x =

p = proporcija pozitivnih (tačnih) odgovora

q = 1-p, a S2x varijansa testa (dakle, kvadrirana SD)

Alternativni obrasci S-B postupka korekcije u "split-half" metodi su Rulonov obrazac (koji ne
zahteva prethodno izračunavanje korelacije između delova testa) i Gutmanov obrazac koji
precizno određuje donju granicu pouzdanosti testa.

4. Kuder-Ričardsonov metod

Ovom metodom se, najviše, izražava konzistentnost svih stavki testa. U predkompjutersko vreme
psihometričari i statističari su smišljali formule koje će, sa što je moguće manje zametnih
izračunavanja, tačno ili približno tačno dati sliku pouzdanosti testa, tim pre kada se radi o
ukupnoj homogenosti. Ako test ima najmanje mogući broj stavki, 20, potrebno je izračunati 390
interkorelacija (po formuli n2-n/2, gde je n broj stavki). Drugim rečima, broj potrebnih
izračunavanja raste geometrijskom progresijom spram broja stavki testa. Dakle, svaki obrazac
koji smanjuje broj izračunavanja ne menjajući pri tom značajno koeficijet pouzdanosti je bio
preko potreban. U tom cilju, G. Kuder i M. Ričardson su (prema Bukviću, 1982) dali dve
poznate formule K-R-20 i K-R-21. Brojevi 20 i 21 govore nam da su njih dvojica upravo toliko
formula razvijali pre nego što su iznašli dva optimalna postupka. Sa aspekta današnje
psihometrijske prakse, u doba računara, njihov trud (hvale vredan) čini se besmislenim. Na
primer, K-R-20 glasi:
rxx = koeficijent pouzdanosti stavki,
n = broj stavki u testu

rx x = p = proporcija pozitivnih (tačnih) odgovora

q = 1-p, a S2x varijansa testa (dakle, kvadrirana SD)

K-R-21 je skraćeni postupak u odnosu na K-R-20 jer, umesto proporcija "p" i "q" svih skorova
testa zahteva se njihova aritmetička sredina.

Matematički bi se moglo dokazati (prema Petz-u, 1981) da je K-R-20, zapravo, aritmetička


sredina svih split-half koeficijenata. Ipak, postoji bitna razlika između ove dve metode: ako, na
primer, split-half metodom ispitamo pouzdanost baterije testova ili inventara ličnosti dobili bi
smo da je koeficijent poudanosti visok, premda mi znamo, da to nije tačno. Primenimo li K-R-20
ili K-R-21 dobićemo nizak koeficijent, kao što i treba.

Alternativni obrasci za izračunavanje pouzdanosti svih stavki testa su: Kronbahov alfa () i
Hojtov obrazac.

Kronbahov alfa je upotrebljiv za testove čije su stavke formulisane kao skale Likertovog tipa,
dakle kod onih koji nemaju dihotomne stavke (DA-NE ili T-N). Kada se prave alternativne
forme prvo se uzorku ispitanika zadaje cela kolekcija stavki testa, a zatim se od ajtema koji
zadovoljavaju standard pouzdanosti prave alternativne forme. Međutim, nizak alfa koeficijent
(više nego K-R-20 ili Hojtov) govori kada nije moguđe napraviti pouzdane alternativne forme od
kolekcije stavki "testiranog" testa.

rx x = = (N*r) / (1+ (N-1)*r) gde je: N - broj ajtema u skali, r- prosečna interkorelacija svih ajtema
skale (prema Havelka, Kuzmanović i Popadić, 1997 str. 128).

Hojtov obrazac se temelji se na dvofaktorskom nacrtu analize varijanse. Dakle, figuriraju tri
varijabiliteta: varijabilitet stavki, varijabilitet ispitanika (otuda je to matrica sa dva ulaza) i
varijabilitet slučajne greške (rezidualni varijabilitet).

Izuzetak od prethodno navedenih metoda su brzinski testovi kod kojih deljenje stavki na bilo koji
način ne dolazi u obzir. Potsetimo da su stavke (zadaci) testova brzine tako laki da ih svi
ispitanici mogu rešiti, kad bi imali dovoljno vremena. Ovde se ne može koristiti obrazac tipa K-
R-20 ili split-half metod, već test-retest, paralelne forme ili tako što se zadaci grupišu u dve
polovine koje se zadaju sa jednakim vremenskim ograničenjima (kao paralelne forme) ili tako
što naprimer za test koji se radi 20 minuta, posle svakih 5 minuta ispitivač zahteva od ispitanika
da podvuku crtu ispod poslednjeg zadatka koji su uradili do uzvika CRTA. Tada se sabere broj
rešenih zadataka iz prve i poslednje četvrtine i koreliraju po S-B obrascu za zbirom za 2 i 3
četvrtinu.

Vanja imati na umu da se koeficijet pouzdanosti (r) interpretira preko procenta i to neposredno
kao koeficijent determinacije koeficijenta korelacije (r2). Na primer, ako je koeficijent
pouzdanosti 0.93 mi kažemo da je pouzdanost dotičnog testa 93%, a 7% je greška merenja.

5. Modeli i koeficijenti pouzdanosti koji se dobijaju u SPSS-paketima


U SPSS paketima (6 i 8.0) pod Statistcs-->Scake-->Reliability Analysis dojia se 5 modela za
izračunavanje pouzdanosti stavki i to: Alpha (Cronbach) na osnovu interne korelacije stavki
(homogenost); Split-half model, na osnovu podele testa na par-nepar polovine; Guttman-ov
model i pralelnih formi.

Posebna je pogodnost SPSS-a što nudi opisne, sumarne i matrične statistike koji pokazuju
kvalitet svake pojedine stavke. To omogućuje konstruktorima testa da izvrše brzu analizu i
selekciju stavki s obzirom na ovu metrijsku karakteristiku.

You might also like