You are on page 1of 31

Neparametarska disperziona analiza

Post hoc testovi

Atif Avdović Mentor: prof. dr Vesna Jevremović

1
Sadržaj:

Str. 4. Život i delo Karla Bonferonija


Str. 7. Život i delo Vilijama Kruskala
Str. 8. Život i delo Vilsona Valisa
Str. 9. Život i delo Dejvida Dankana
Str. 10. Neparametarska diperziona analiza
Str. 11. Test (sume) rangova
Str. 14. Test medijane
Str. 15. Kruskal-Valis test
Str. 19. Fridmanov test
Str. 21. Kendalov W test
Str. 22. Kohranov Q test
Str. 24. Post hoc testovi
Str. 26. LSD test
Str. 26. Takijev test
Str. 27. Dankanov test
Str. 27. Njuman-Kels test
Str. 28. Šefeov metod
Str. 28. Bonferonijeva metoda t-testova
Str.31. Literatura

2
Predgovor:

Cilj ovog seminarskog rada je prevashodno obavljanje jedne od ključnih predispitnih


obaveza na kursu statistike kod profesorice Vesne Jevremović, međutim, iz mog ličnog iskustva
u izradi istog, sa sigurnošću mogu reći da je u najmanju ruku teško naći ovako sistematizovano i
izloženo štivo na temu neparametarska disperziona analiza što je vrlo primenjivana i bitna oblast
statistike. U skladu sa tim ovaj rad u velikoj meri može poslužiti u učenju studentima, pa i
istraživanju i radu kompetentnih matematičara, ekonomista, lekara itd. Sa post hoc testovima je
situacija malo bolja ali povezanost ova dva pojma u velikoj meri povećava doprinos izlaganja tih
testova kvalitetu ovog rada.
Kako se u čitanju može videti neki delovi rada imaju elemente drugih delova statistike, za
šta je razlog nemoćnost razumevanja gradiva neupućenima, pa i poteškoće u istom na primer
studentima, tj. redukovanje potencijalnih nejasnoća. Čitanje ovog rada je pre svega za one koji
dobro poznaju teoriju verovatnoće i statistike
Kao i bilo šta drugo pisano ljudskom rukom, bilo bi čudno da ovaj rad nema grešaka, za
koje se unapred izvinjavam, a ukazivanje na iste i upućivanje konstruktivnih kritika će naići na
moju veliku zahvalnost.
Takođe želim da se zahvalim profesorici na pomoći u nalaženju delova gradiva, biblioteci
Državnog univerziteta u Novom Pazaru i svima drugima koji su na neki način doprineli izradi.

Autor

3
Život i delo Karla Bonferonija

Karlo Emilio Bonferoni (Carlo Emilio Bonferroni) je rođen u Bergamu 28. Januara 1892.
godine a umro 18. Avgusta 1960. godine u Firenci. Studirao je u Torinu gde je i bio asistent
Politehničkog fakulteta a 1923. godine je došao na mesto profesora i šefa katedre na finansijskoj
matematici na Ekonomskom Institutu u Bariju. Kasnije 1933. se premestio u Firencu gde je radio
do svoje smrti. U suštini koliko god njegov rad bio koristan i njegov doprinos statistici bio
značajan, nije poznato puno informacija vezanih za njegov privatni život.
Poznat je po Bonferonijevim nejednakostima i Bonferonijevoj korekciji (koju nije otkrio
ali za razrađivanje iste koriste se njegove nejednakosti).
Za izlaganje Bonferonijevih nejednakosti potrebno je znati Bulovu nejednakost, a kasnije
će biti objašnjenja zašto. Bulova nejednakost glasi: za prebrojivo ili konačno mnogo događaja
𝐴1 , 𝐴2 , 𝐴3 , … važi sledeće:

𝑃 (⋃ 𝐴𝑖 ) ≤ ∑ 𝑃(𝐴𝑖 ) (1)
𝑖 𝑖

Navedena nejednakost se naziva Bulovom po engleskom matematičaru Džordžu Bulu i poznata


je još kao “veza unije”.
Dokaz: Nejednakost se dokazuje primenom matematičke indukcije, za 𝑖 = 1, dobijamo
𝑃(𝐴1 ) ≤ 𝑃(𝐴1 )
što je očigledno tačno. Dalje pretpostavimo da za 𝑖 = 𝑘, 𝑘 ∈ 𝑁 važi
𝑘 𝑘

𝑃 (⋃ 𝐴𝑖 ) ≤ ∑ 𝐴𝑖
𝑖=1 𝑖=1

I dokažimo da polazna jednakost važi za 𝑖 = 𝑘 + 1.Naime, imamo da za proizvoljne događaje


𝐴 𝑖 𝐵 važi 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵), pored toga znamo da je unija događaja
asocijativna pa dobijamo
𝑘+1 𝑘 𝑘

𝑃 (⋃ 𝐴𝑖 ) = 𝑃 (⋃ 𝐴𝑖 ) + 𝑃(𝐴𝑘+1 ) − 𝑃 (⋃ 𝐴𝑖 ∩ 𝐴𝑘+1 ) (2)


𝑖=1 𝑖=1 𝑖=1

Kao što je poznato verovatnoća bilo kojeg slučajnog događaja je nenegativna, stoga imamo da
važi:

4
𝑘

𝑃(⋃ 𝐴𝑖 ∩ 𝐴𝑘+1 ) ≥ 0
𝑖=1

odakle zanemarivanjem navedene verovatnoće iz jednakosti (1) automatski sledi da važi


nejednakost:
𝑘+1 𝑘

𝑃 (⋃ 𝐴𝑖 ) ≤ 𝑃 (⋃ 𝐴𝑖 ) + 𝑃(𝐴𝑘+1 )
𝑖=1 𝑖=1

što je zapravo nejednakost (1) za 𝑖 = 𝑘 + 1 čime smo principom matematičke indukcije dokazali
Bulovu nejednakost jer je:
𝑘+1 𝑘 𝑘

𝑃 (⋃ 𝐴𝑖 ) ≤ 𝑃 (⋃ 𝐴𝑖 ) + 𝑃(𝐴𝑘+1 ) = ∑ 𝐴𝑖 ∆.
𝑖=1 𝑖=1 𝑖=1

Bulova nejednakost može biti generalisana za nalaženje tzv. gornjih i donjih veza unije
konačnog broja događaja iz prostora verovatnoća. Te veze su poznate kao Boferonijeve
nejednakosti.
Definišimo:
𝑛

𝑆1 ≔ ∑ 𝑃(𝐴𝑖 ) , 𝑆2 ≔ ∑ 𝑃(𝐴𝑖 ∩ 𝐴𝑗 )
𝑖=1 1≤𝑖<𝑗≤𝑛

kao i sledeće:

𝑆𝑘 ≔ ∑ 𝑃(𝐴𝑖1 ∩ … ∩ 𝐴𝑖𝑘 )
1≤𝑖1 <⋯<𝑖𝑘 ≤𝑛

tada za neparne celobrojne vrednosti 𝑘 ∈ {3, … , 𝑛} važi:


𝑛 𝑘

𝑃 (⋃ 𝐴𝑖 ) ≤ ∑(−1)𝑗−1 𝑆𝑗
𝑖=1 𝑗=1

I za parne celobrojne vrednosti 𝑘 ∈ {2, … , 𝑛} važi:


𝑛 𝑘

𝑃 (⋃ 𝐴𝑖 ) ≥ ∑(−1)𝑗−1 𝑆𝑗
𝑖=1 𝑗=1

Odavde za 𝑘 = 1 dobijamo Bulovu nejednakost dok je za 𝑘 = 𝑛 rezultirajući identitet


princip uključenja i isključenja.

5
Jedna zanimljiva činjenica o Karlu Bonferoniju je da je knjige koje je koristio kao
literaturu na univerzitetu gde je predavao pisao ručno jer je smatrao da su knjige preskupe za
studente.
Pored navedenog Bonferoni je doprineo matematici i statistici putem „Bonferonijeve
ispravke“, „Bonferonijeva metoda t-testova“ itd.
Odabrana dela:

 C Benedetti. Carlo Emilio Bonferroni (1892-1960). Metron, 40(3-4):2-36, 1982.


 C E Bonferroni. Intorno al concetto di probabilità. Giornale di Matematica Finanziara,
6:105-133, 1924. The article itself is dated December 1925.
 C E Bonferroni. Teoria e probabilità. In Annuario del R Istituto Superiore di Scienze
Economiche e Commerciali di Bari per L'anno Accademico 1925-1926, pages 15-46.
Bari, 1927. Given as the inaugural lecture for the academic year 1925-1926 on November
22, 1925.
 C E Bonferroni. Il calcolo delle assicurazioni su gruppi di teste. In Studi in Onore del
Professore Salvatore Ortu Carboni, pages 13-60. Rome, 1935.
 C E Bonferroni. Teoria statistica delle classi e calcolo delle probabilità. Pubblicazioni del
R Istituto Superiore di Scienze Economiche e Commerciali di Firenze, 8:3-62, 1936.
 B de Finetti. Commemorazione del Prof. C. E. Bonferroni. Giornale di Matematica
Finanziaria, 46:5-24, 1964.
 M E Dewey. Bonferroni, Carlo Emilio. In P Armitage and T Colton,
editors, Encyclopaedia of Biostatistics, pages 420-421. Wiley, Chichester, 1998.
 R G Miller. Simultaneous statistical inference. McGraw Hill, New York, 1966. Second
edition published by Springer Verlag, 1981.
 P Pagni. Carlo Emilio Bonferroni. Bollettino dell'Unione Matematica Italiana, 15:570-
574, 1960.
 T V Perneger. What's wrong with Bonferroni adjustments. British Medical Journal,
316:1236-1238, 1998.
 E Seneta. Probability inequalities and Dunnett's test. In F M Hoppe, editor, Multiple
Comparisons, Selections and Applications in Biometry, chapter 3, pages 29-45. Marcel
Dekker, New York, 1993.
 S M Stigler. Stigler's law of eponymy. Transactions of the New York Academy of
Sciences, 39:147-157, 1980.

6
Život i delo Vilijama Kruskala

Vilijam Henri („Bil“) Kruskal (William Henry ("Bill") Kruskal) rođen 19. oktobra 1919.
godine, a umro 12. aprila 2005. godine,bio je američki matematičar i statističar. Najviše je
poznat po učešću u formulaciji procedure tzv. Kruskal-Valis testa (jednosmernii dispezioni test,
vrlo primenjivana neparametarska statistička metoda).
Kruskal je rođen u jevrejskoj porodici veletrgovaca krzna u Njujorku. Njegova majka,
Lilijan Rouz Vorhaus Kruskal Openhajmer, postala je poznati promoter Origamija za vreme rane
ere televizije. On je bio najstariji od petoro dece, od kojih su još dvoje postali istraživači u
matematici i fizici (Džozef i Martin Kruskal). Kruskal je napustio Antioh Koledž da bi studirao
na Harvardu, primivši diplome osnovnih i master studija 1940. i 1941. Zatim je bio na
doktorskim studijama matematičkih nauka na Kolumbija Univerzitetu, gde je doktorirao 1955.
Za vreme Drugog Svetskog Rata, Kruskal je služio u centru za provere mornarice Sjedinjenih
Američkih Država u Dalgrenu u Virdžiniji. Nakon kratkog rada za svog oca i predavanja na
Kolumbija Univerzitetu, pridružio se osoblju Univerziteta u Čikagu kao asistent na statistici
1950.
Godine 1958. je izabran za saradnika u Američkoj Statističkoj Asocijaciji. Bio je urednik
„Anala matematičke statistike“ (časopis) od 1958. do 1961., radio kao predsednik Instituta za
matematičku statistiku 1971. i Američke Statističke Asocijacije 1982. Vilijam Kruskal se
penzionisao kao Profesor Emeritus 1990. Umro je u Čikagu.
Odabrana dela:

 Kruskal, William H; Allen Wallis, W (1952). "Use of ranks in one-criterion analysis of


variance". Journal of the American Statistical Association. 47 (260): 583–
621. JSTOR 2280779. doi:10.2307/2280779.
 Goodman, Leo A; Kruskal, William H (1954). "Measures of association for cross
classifications". Journal of the American Statistical Association. 49 (268): 732–
764. JSTOR 2281536. doi:10.2307/2281536.
 Goodman, Leo A; Kruskal, William H (1959). "Measures of Association for Cross
Classifications. II: Further Discussion and References". Journal of the American Statistical
Association. 54 (285): 123–163. JSTOR 2282143. doi:10.2307/2282143.
 Goodman, Leo A; Kruskal, William H (1963). "Measures of association for cross
classification III: Approximate Sampling Theory" (PDF). Journal of the American Statistical
Association. 58 (302): 310–364. JSTOR 2283271. doi:10.2307/2283271.
 "The coordinate-free approach to Gauss-Markov estimation, and its application to missing
and extra observations". Proceedings of the Fourth Berkeley Symposium on Mathematical
Statistics and Probability. 1: 435–451. 1961.
 Kruskal, William (1968). "When are Gauss-Markov and least squares estimators identical?
A coordinate-free approach". Annals of Mathematical Statistics. 39: 70–
75. doi:10.1214/aoms/1177698505.

7
 Kruskal, William (December 1988). "Miracles and Statistics: The Casual Assumption of
Independence (ASA Presidential address)". Journal of the American Statistical
Association. 83 (404): 929–940. JSTOR 2290117. doi:10.1080/01621459.1988.10478682.
 Goodman, Leo A; Kruskal, William H (1979). "Measures of Association for Cross
Classifications". New York: Springer-Verlag. ISBN 0-387-90443-3.

Život i deloVilsona Valisa

Vilson Alen Valis (Wilson Allen Wallis), rođen 5.novembra 1912., a umro 12. oktobra 1998.,
je bio američki ekonomista i statističar najviše poznat po tome što je radio kao predsednik
Univerziteta u Ročesteru. Kruskal-Valis test je neparametarski test koji je nazvan po njemu i
Vilijamu Kruskalu.
Rođen je u Filadelfiji, a studirao na Univerzitetu u Minesoti, generacija 1932., gde je bio
član Hi Fi bratstva. Nakon godine studiranja na Univerzitetu u Minesoti, on je počeo studije na
Univerzitetu u Čikagu 1933., gde je sklopio doživotna prijateljstva sa Miltonom Fridmenom,
Aronom Direktorom i Džordžom Stiglerom.
Godine 1936-37. radio je kao statističar i ekonomista u Ministarstvu za nacionalne
resurse. Tokom Drugog Svetskog Rata, Valis je bio direktor Statističke istraživačke grupe u
Kancelariji za naučno istraživanje i razvoj Sjedinjenih Američkih Država od 1942. do 1946., i tu
je regrutovao tim stručnih, mladih ekonomista među kojima je bio i Milton Fridmen.
Od 1948. do 1954., Valis je radio kao blagajnik Mon Pelje Udruženja.
U skladu sa svojom ulogom kao jednim akademikom i akademskim administratorom,
Valis je radio i kao savetnik predsednika SAD-a Dvajta Ajzenhauera, Ričarda Niksona i Ronalda
Regana. Pod Ajzenhauerom, sarađivao je sa potpredsednikom Niksonom na izveštajima
Kabinetu Ministarstva za stabilnost cena i ekonomski rast od 1959. do 1961. Pod Niksonom i
Fordom radio je u Predsednikovoj komisiji za federalnu statistiku i Veću savetnika za socijalnu
sigurnost. Nikson je takođe postavio Valisa za presedavajućeg u Korporaciji zajavno emitovanje,
funkciju koju je obavljao od 1975. do 1978. Pod Reganom, radio je kao podsekretar za stanje
ekonomskog poslovanja od 1982. do 1985., a zatim se nakon održanog kongresa naziv radnog
mesta promenio u podsekretar za stanje ekonomije, biznisa i agrokulturalnog poslovanja od
1985. do 1989.
Odabrana dela:

 Wallis, W. Allen; Moore, Geoffrey H. (1941), A Significance Test for Time Series and Other Ordered
Observations., New York: National Bureau of Economic Research, OCLC 1876032

8
 Wallis, W. Allen; Churchill Eisenhart; Millard W Hastay (1947), Selected Techniques of Statistical
Analysis for Scientific and Industrial Research and Production and Management Engineering, New
York: McGraw-Hill, OCLC 490341075
 Wallis, W. Allen; Harry V. Roberts (1956), Statistics, a New Approach, Glencoe, Illinois: Free
Press, OCLC 839651, retrieved 2009-12-30
 Wallis, W. Allen; James Tobin (1968), Welfare Programs: An Economic Appraisal, Washington,
D.C.: American Enterprise Institute for Public Policy Research, OCLC 21672
 Wallis, W. Allen (1969), Abolish the Draft, Washington, D.C.: National Council to Repeal the
Draft, OCLC 45712869

Život i delo Dejvida Dankana

David B. Duncan je dobio diplomu Univerziteta u Sidneju, Australija, a potom je


postao doktorant iz statistike na Državnom univerzitetu u Ajovi 1947. godine. Nakon nekoliko
godina na Politehničkom institutu u Virdžiniji i na Univerzitetu Severne Karoline, pridružio se
Džon Hopkinsovom odeljenju za biostatistiku 1960. godine. Njegov rani rad bio je fokusiran na
regresionu analizu, temu na koju je napravio dva važna doprinosa:
- Prvo, on je bio rani zagovornik onoga što je postalo poznato kao Kalmanov filter i metod
za dinamičku procenu regresione jednačine, koja ima posebne primene pri rešavanju
problema sa vremenskim intervalima (aniuiteti, kamata i sl.).
- Drugo, on i koautor Stroter Voker otkrili su logističku regresionu analizu još 1967.
godine. Nije jasno ko je bio prvi pristalica korišćenja logističke, a ne linearne regresije za
binarne odgovore, ali je dr Duncan svakako bio jedan od prvih, ako ne prvi.

Međutim, dugogodišnja ljubav doktora Dankana bila je metodologija za bavljenje


problemom "višestruka poređenja" - to jest, kako prilagoditi statističku grešku ocene da bi se
doneo što veći broj zaključaka iz jednog skupa podataka. Ranije u svom radu na ovom problemu,
on je opisao Dankanov višestuki intervalni test, koji je bio standardizovan u primeni već dve
decenije. Njegov izvorni članak o ovoj temi još uvek je jedan od najzanimljivijih članaka u
medicinskoj literaturi. Kasnije u svojoj karijeri, dr. Duncan je usvojio perspektivu Bajesovog
pristupa, kreirajući metodologiju k-odnosa, koja se takođe danas široko koristi.

Dr Dankan se povukao u Karmel, Kalifornija 1984. godine, gde je nastavio svoj posao
na brojnim problemima poređenja. Preminuo je, nekoliko dana nakon svog 90. rođendana, 12.
juna 2006. godine.

9
Neparametarska disperziona analiza

Kao što znamo, znatan deo testova koje se spominju, zahteva normalnu raspodelu
obeležja. U praksi, međutim, često nailazimo na situacije kad nam ništa nije poznato o raspodeli
populacije, ili čak znamo da populacija nije normalna. To je npr. slučaj kad je verovatnoća
pojavljivanja nekog događaja vrlo mala (P < 0,1), pa dobijamo tzv. Puasonovu raspodelu, ili kad
postoji donja ili gornja granica preko koje rezultati ne mogu ići. Na primer, u jednom vrlo lakom
testu znanja većina ispitanika će postići maksimalan rezultat, pa će i kriva biti asimetrična, a isto
tako će biti i kod jednog preteškog testa, gde će većina postići minimalan broj bodova. U prvom
slučaju gornju granicu predstavlja maksimalan broj bodova, a u drugom slučaju donju granicu
predstavlja nula bodova.

Nadalje, čest je slučaj u nekim društvenim naukama (npr. sociologiji) da se neke pojave
distribuiraju upravo "suprotno" od normalne raspodele. To je npr. slučaj sa stavovima koji često
daju tzv. "U-raspodelu", tj. najveće frekvencije nalaze se na ekstremnim vrednostima obeležja.

U svim tim slučajevima ne možemo primeniti neke metode koje smo do sada spominjali.

Isto tako ne možemo veći broj do sada poznatih statističkih računa primeniti ako rezultati
nisu izraženi mernim jedinicama, nego kvalitetima ("zdrav", "bolestan", "mlad", "star", itd.). One
metode koje se služe merljivim podacima, koji se distribuiraju normalno ili čija se raspodela
može aproksimirati normalnom, nazivaju se parametarskim metodama. Suprotno tome, one
metode kod kojih nije važno je li populacija normalno distribuirana, a katkad čak rezultati uopšte
nisu izraženi u mernim jedinicama, nego u frekvencijama nekih kvaliteta, nazivaju se
neparametarskim metodama (katkad ih nazivaju i "statistika slobodna od raspodele"). Među
takvim metodama puno se spominju izračunavanje centila, koeficijenta rang-korelacije, hi-
kvadrat testa i dr. Neparametarske metode se upotrebljavaju prema tome prvenstveno kod
podataka izraženih nominalnim (opisnim, kvalitativnim) i ordinalnim (rednim) skalama, a
parametarske metode kod rezultata izraženih intervalnim i mernim skalama.

Razumljivo je da je neparametarske metode dopušteno i moguće primeniti i pri obradi


podataka koji su izraženi intervalnim i mernim skalama (npr. mi možemo izračunati rang-
korelaciju izmedu težine i visine), ali bi takav postupak bio neracionalan, jer na taj način
namerno gubimo niz informacija (npr. kod rang- korelacije, gdje registrujemo samo rang, a ne i
razlike izmedu obeležja), i precizniji postupak zamenjujemo aproksimativnim postupkom: ako
rangovi u obe varijable korespondiraju, onda će rang-korelacija iznositi + 1, ali da smo računali
koeficijent korelacije r, on bi bio manji od 1.

Zbog toga statističari kažu da je "snaga" (moć) ("power") neparametarskih testova manja
od "snage" parametarskih testova. "Snagu" testa možemo definisati kao verovatnoća odbacivanja
nulte-hipoteze, ako je ta hipoteza zaista pogrešna. Drugim rečima, snaga testa sastoji se u
njegovoj sposobnosti da otkrije neku razliku, ako tu razlika zaista postoji. Dakle, ako između dve
populacije postoji razlika, to ćemo obično preciznije i uspešnije ustanoviti pomoću
parametarskih nego neparametarskih testova.

10
To, doduše, ne mora uvek biti tako, jer se može dogoditi da iz nekih "formalnih" razloga
parametarski test "zakaže", tj. njime ne uspemo dokazati nešto što je inače potpuno evidentno i
logično.

Da bi se izbegli određeni nesporazumi u vezi s pojavom da se kod mnogih


neparametarskih testova često susrećemo s poznatim z-vrednostima (položaj rezultata u nekoj
normalnoj raspodeli populacije), a treba reći da je neparametarska statistika "slobodna" od bilo
kakve pretpostavke o raspodeli populacije, ali nije, naravno, slobodna od pretpostavke o obliku
očekivane varijacije i raspodele uzoraka. Kao što znamo, ako uzorci nisu odveć mali, od bilo
kako distribuirane populacije uzorci aritmetičkih sredina će se distribuirati uglavnom po
normalnoj raspodeli i otuda z-vrednosti i u neparamctarskoj statistici.

Osim nekih koji se često spominju u statističkoj literaturi ovde ćemo izložiti još neke
neparametarske testove tj. testove neparametarske (disperzione) analize. Da bismo navedeno bilo
izloženo što sistematičnije, razlikovaćemo 4 slučaja, upoređivanje dva nezavisna uzorka iz iste
populacije, upoređivanje dva seta opažanja na istom uzorku, upoređivanje više od dva nezavisna
uzorka iz iste populacije i upoređivanje više od dva seta opažanja na istom uzorku.

Test (sume) rangova


U statistici, test rangova je neparametarski test nulte hipoteze prema kojoj je jednako
verovatno da će nasumično izabrana vrednost iz jednog uzorka biti manja ili veća od nasumično
izabrane vrednosti iz nekog drugog uzorka. Sličan ovome je test koji se primenjuje na zavisne
uzorke, takozvani Vilkoksonov test označenih rangova.

Vrlo generalna formulacija je pod pretpostavkama:

1. Sve vrednosti iz oba uzorka su nezavisne jedne od drugih


2. Vrednosti su rangirane po veličini
3. Nulta hipoteza H0 je da oba obeležja imaju istu raspodelu
4. Alternativna hipoteza H1 je da obeležja nemaju istu raspodelu
Pod navedenom formulacijom test je konzistentan ako za data obeležja označena sa X i Y važi
sledeće:

𝑋: 𝑃(𝑋 > 𝑌) ≠ 𝑃(𝑌 > 𝑋) ili 𝑃(𝑋 > 𝑌) + 0.5 · 𝑃(𝑋 = 𝑌) ≠ 0.5.

Nakon toga rangiramo vrednosti i dodelimo im odgovarajuće rangove, onu vrednost sa najvećim
“kvalitetom” rangiramo sa 1, anlaogno tome i druge ostalim brojevima.

Za oba uzorka posebno saberimo rangove. Zbog kontrole dobro je proveriti sumu rangova
formulom:

11
𝑇1 + 𝑇2 = 𝑁(𝑁 + 1)/2

Nakon toga izračunamo izraz:

|2𝑇𝑖 − 𝑁𝑖 (𝑁 + 1)| − 2
𝑧=
𝑁1 𝑁2 (𝑁+1)

3

gde Ti znači bilo koju od suma rangova, a Ni znači broj vrednosti u uzorku iz kog smo uzeli Ti.

Budući da jedino rezultate z koji su veći od 1,96 možemo smatrati statistički značajnim(na pragu
značajnosti od 5%) svaka manja vrednost znači da se nulta hipoteza može prihvatiti.

Ovaj je test donekle sličan testu homogenih nizova, ali on koristi više informacija (tj.
koristi rangove, a ne samo podelu u dve kategorije) i zato se može smatrati boljim i "snažnijim".
Kao i testom medijane, testom sume rangova testiramo pripadaju li dva uzorka populaciji s istom
medijanom. Da bi test bio što bolje ilustrovan navešćemo sledeće testiranje.

Uzmimo da imamo dve grupe ispitanika od kojih smo prvoj grupi (N1 = 9) davali neki
vitaminski preparat, a drugoj grupi (N2= 8) nismo. U ostalim faktorima obe su grupe naravno
slične. Zanima nas pokazuje li "vitaminska" grupa bolje "opšte zdravstveno stanje".

Ispitanici obe grupe označeni su slovima:

Postupak se sastoji u tome da uzmemo sve ispitanike zajedno i da ih rangiramo prema


opštem zdravstvenom stanju, s tim da rang 1 damo najzdravijem ispitaniku. Uzmimo da smo
dobili ovaj rezultat:

12
Za obe grupe posebno saberimo rangove. Zbog kontrole dobro je proveriti sumu rangova
formulom:

𝑇1 + 𝑇2 = 𝑁(𝑁 + 1)/2

153 = 153

Nakon toga izračunamo izraz:

|2𝑇𝑖 − 𝑁𝑖 (𝑁 + 1)| − 2
𝑧=
𝑁1 𝑁2 (𝑁+1)

3

gdje Ti znači bilo koju od suma rangova, a Ni znači broj ispitanika u grupi iz koje smo
uzeli Ti. Izračunavanjem dobijemo da je i za eksperimentalnu i kontrolnu grupu 𝑧 = 0,53
(realizovana vrednost test statistike), tj. ne pripada kritičnoj oblasti.

Ako je broj ispitanika u svakoj skupini barem 8, tada izračunati 𝑧 daje normalnu
raspodelu s aritmetičkom sredinom tj. očekivanjem 0 i disperzijom 1 (normalnu normiranu
raspodelu N(0, 1)), tj. izračunata vrednost nije ništa drugo nego nama već dobro poznata z-
vrijednost, zaključujemo da je naše z premalo, stoga prihvatamo nultu hipotezu.

13
Test medijane

To je vrlo jednostavan test koji se zapravo svodi na hi-kvadrat test, a kojim ispitujemo
pripadaju li dva uzorka populaciji s istom medijanom. U parametarskojstatistici njemu delimično
odgovara t-test, kojim ispitujemo značajnost razlika izmedu dve aritmetičke sredine. Zbog
jednostavnosti navedenog navedeni test ćemo ilustrovati primerom.

Uzmimo da smo na dva uzorka (koji po veličini mogu biti jednaki ili različiti) dobili u
nekom merenju ove rezultate, koje smo zbog preglednosti poređali prema veličini:

Uzorak I 8, 9, 9, 10, 10, 10, 12, 13, 15, 17, 17, 18, 19, 19, 21, 23, 24, 25, 26, 28, 28,
29, 31, 31;

Uzorak II 3, 6, 7, 7, 8, 8, 8, 10, 12, 16, 19, 22, 24, 27, 30, 32;

Princip testa medijane sastoji se u tome da nađemo centralnu vrednost (tj. medijanu) iz
svih rezultata zajedno i da ih unesemo u 2*2 tablicu. Budući da u našem primeru imamo ukupno
41 rezultat, medijana je dvadeset prvi rezultat po veličini, a to je 17. Ako sve rezultate koji su
iznad medijane, označimo znakom "plus", a rezultate na medijani ili ispod nje znakom "minus",
dobijamo:

Uzorak I -----------+++++++++++++

Uzorak II ----------+++++++

Unesemo li frekvencije tih rezultata u tablicu, dobijamo:

+ -

Uzorak I 13 11 ∑ 𝑟𝑒𝑑 = 24

Uzorak II 7 10 ∑ 𝑟𝑒𝑑 = 17

∑ 𝑘𝑜𝑙 = 20 ∑ 𝑘𝑜𝑙 = 21 ∑ = 41

Iz ove tablice sada izračunamo test statistiku hi-kvadrat testa, vodeći računa o svim
pravilima koja vrede za hi-kvadrat, stoga u ovom slučaju moramo (jer se radi o 2*2 tablici)
upotrebiti Jatesovu korekciju. Izračunata hi-kvadrat vrednost iznosi 0,258, pa zato prihvatamo
hipotezu da se medijane oba uzorka statistički značajno ne razlikuju (kritična vrednost je 3,841).

Ako je ukupan broj rezultata paran, medijana je aritmetička sredina između dva rezultata
koji se nalaze u sredini niza svih rezultata poređanih po veličini. U tom slučaju će nam svi
rezultati biti ili iznad ili ispod medijane, a niti jedan na samoj medijani.

14
Kruskal-Valis test

Kruskal-Valis test rangova tj. intervala, ili jednosmerna disperziona analiza intervala je
neparametarska metoda za ispitivanje da li su uzorci dobijeni iz iste raspodele. Koristi se za
upoređivanje dva ili više nezavisnih uzoraka istog ili različitog obima. Može se reći daovaj test
“produžuje” test sume rangova u slučaju više od dva nezavisnih uzoraka. Ovaj test je značajan
zbog toga što ukazuje na to da je jedan od ispitivanih uzoraka stohastički dominantniji od ostalih.

Pošto je u pitanju neparmetarska metoda, raspodela iz koje je uzorak dobijen ne mora biti
normalna. Naziva se još i H test. Predstavlja alternativu za parametarski F test u analizi
varijanse(disperzije) jednog faktora varijabiliteta. Njegova efikasnost je 0,95 tj. prag značajnosti
je 𝛼 = 0,05.

Test se sprovodi pomoću k uzoraka 𝑛1 , 𝑛2 , … , 𝑛𝑘 . Razmatraćemo slučaj kada se svaki od


uzoraka sastoji od najmanje 5 jedinica, a kasnije će biti reči zašto. Neka su dati uzorci izvučeni
na slučajan način iz jedne populacije ili iz k populacija.

Rang (poredak) elementarnih jedinica uzoraka formira se na osnovu združenog uzorka


𝑛 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 . Rangiranje elementarnih jedinica vrši se počev od najmanje vrednosti,
tj, istoj se dodeljuje rang 1.

Postavka modela može imati varijante:

 Svi uzorci su izvučeni iz jedne populacije.


 Uzorci su izvučeni iz populacija koje su identične
 Uzorci su izvučeni iz populacija koje imaju istu medijanu.

Postupak testa se vrši korišćenjem test statistike:

12 𝑇𝑖 2
𝐻= ∑ − 3(𝑛 + 1)
𝑛(𝑛 + 1) 𝑛𝑖
2
Kada su svi uzorci obima najmanje 5, tada H ima približno 𝜒𝑘−1 raspodelu, gde je k broj
uzoraka.

U statistici H je:

𝑇𝑖 - zbir rangova u i-tom uzorku

𝑛𝑖 - obim uzorka i

𝑛- zbir obima svih uzoraka

15
Nulta hipoteza može imati varijante prema navedenim specifikacijama modela i to:

𝐻0 :

o Svi uzorci su iz jedne populacije


o Uzorci su izvučeni iz populacija koje su identične
o Uzorci su izvučeni iz populacija koje imaju istu medijanu

Alternativna hipoteza 𝐻1 negira svaku od odgovarajućih gore navedenih varijanti nulte


hipoteze.

Procedura zaključivanja je nakon toga identična proceduri zaključivanja kod hi-kvadrat


testa tj.pošto je efiksnost testa 0.95 to je prag značajnosti 𝛼 = 0,05, odnosno tražimo c
tako da 𝑃(𝜒2𝑘−1 ≥ 𝑐) = 0,05 iz tablice za hi-kvadrat raspodelu. Ako je realizovana
vrednost test statistike H veća ili jednaka c odbacujemo nultu hipotezu.

Primer. Na 4 nezavisna uzorka dobili smo ove rezultate (zbog preglednosti oni su
poređani prema veličini):

I 8 12 13 14 20 21 25 33 43 45 47

II 10 15 19 25 30 38 40 45 47 48 51 54 55

III 16 16 17 21 29 33 44 45 46 53 62 67

IV 22 41 49 54 59 60 65 69 71 75.

1. Svi se rezultati rangiraju, i to tako da najmanji rezultat dobije rang 1.

16
2. Izračunamo sume rangova u svakom uzorku. Broj rezultata u svakom uzorku označiti ćemo s
ni. Dobijene brojeve korisno je kontrolisati: suma Ti mora iznositi:
𝑛(𝑛 + 1)
∑ 𝑇𝑖 =
2

46(46 + 1)
1081 = = 1081
2
3. Izračunamo izraz H prema formuli:

12 𝑇𝑖 2
𝐻= ∑ − 3(𝑛 + 1)
𝑛(𝑛 + 1) 𝑛𝑖

Gde je Ti = suma rangova u jednom uzorku, n = ukupan broj vrednosti, ni = broj vrednosti u
jednom uzorku. Ako kvadriramo svaki i rezultat podelimo korespondentnim ni, zatim zbrajanjem
tih vrednosti i konačno imlementiranjem dobijenog u formulu dobijamo: H=14,75

Ako su uzorci dovoljno veliki (kod ovog se računa smatra da su uzorci dovoljno veliki
ako svaki uzorak sadrži više od 5 rezultata), H se može aproksimirati hi-kvadrat raspodelom, pa
zato možemo značajnost očitati iz 𝜒 2 tablice uz k - 1 stepeni slobode (k = broj uzoraka). Budući
da naš broj stepeni slobode iznosi 3, a granična vrednost 𝜒 2 = 7,815, morali bismo zaključiti da
se uzorci statistički značajno razlikuju, tj. da ne pripadaju istoj populaciji. Dakle, nultu hipotezu
odbacujemo.

Ako imamo veći broj „vezanih“ rangova, a H je nešto ispod granice značajnosti, treba upotrebiti
drugu, korigovanu, formulu za izračunavanje H, u kojoj gore navedenu formulu delimo s 1 −
∑𝑇
, dakle:
𝑠3 −𝑠

12 𝑇𝑖 2
∑ − 3(𝑛 + 1)
𝑛(𝑛+1) 𝑛𝑖
𝐻= ∑𝑇
1 − 𝑠3 −𝑠

gde je T = s(s2-1), a s = broj rezultata koji čine zajednički rang.

Taj račun treba posebno sprovesti za sve zajedničke rangove: na primer, ako imamo dva puta po
2 "vezana" ranga, dva puta po 3 vezana ranga i po jedanput 4, 5, 7 i 10 vezanih rangova, onda će
vrednost T iznositi:

17
Taj će postupak nešto povećati vrednost H. U našem slučaju tu korekciju ne treba upotrebiti, jer
je vrednost H ionako veća od granične vrednosti i zbog relativno malog broja zajedničkih
rangova konačan rezultat bio bi samo neznatno promenjen (možda tek u drugoj decimali) .

18
Fridmanov test

Ako na istoj grupi ispitanika vršimo merenje u različitim uslovima, onda su rezultati
dobijeni u svakom od tih uslova u korelaciji s ostalim rezultatima, pa se zbog toga više ne
možemo služiti Kruskal-Valis testom.

U tom slučaju Fridmanov test "dvostruke disperzione analize rangova" prestavlja vrlo
korisnu i upotrebljivu metodu kojoj u parametarskoj statistici odgovara "dvofaktorska
disperziona analiza", a koja se upotrebljava, između ostalog, i pri testiranju razlika između
aritmetičkih sredina više zavisnih uzoraka.

Postupak Fridmanovog testa sastoji se u tome da se rezultati najpre razvrstaju u tablicu s


N redova i k kolona. Redovi odgovaraju pojedinim ispitanicima (ili grupama ispitanika), a kolone
predstavljaju eksperimentalne uslove. Rezultati u svakom redu (dakle za svakog ispitanika
posebno) pretvore se u rangove. U slučaju jednakih rezultata, dobijamo naravno zajedničke
rangove, ali to prema Fridmanu ne utiče na vrednost testa.

Rangovi se u svakoj koloni (eksperimentalnoj situaciji) saberu (T). Kada ne bi bilo


razlika u rezultatima među uzorcima iz različitih eksperimentalnih uslova (tj. kad bi svi uzorci
bili iz iste populacije), sume rangova poprimale bi slične vrednosti. Ako se te sume značajno
razlikuju, možemo odbaciti nultu hipotezu. Da bismo izmerili relativnu veličinu tih razlika,
sabraćemo kvadrirane sume rangova (suma rangova = Ti ), i nakon toga ćemo izračunati
realzovanu vrednost test statistike:

𝑁
12
𝑄= ∑ 𝑇𝑖2 − 3𝑁(𝑘 + 1) (1)
𝑁𝑘(𝑘 + 1)
𝑖=1

Ako su broj ispitanika N i broj eksperimentalnih uslova k dovoljno veliki, izraz Q ima
približno hi-kvadrat raspodelu sa k - 1 stepeni slobode, stoga značajnost za unapred zadati prag
značajnosti očitavamo iz tablice graničnih vrednosti hi-kvadrata.

Primer. Jedan je istraživač ispitivao kako na radni učinak utiče više odmora i je li u toku
rada racionalnije uzeti jedan duži odmor ili više kraćih odmora. Izmerio je ukupan radni učinak
kod rada od 4 minuta bez odmora (eksperimentalna situacija "a"), kod rada od ukupno 3 minuta s
jednim odmorom od 60 sekundi u sredini rada (eksperimentalna situacija "b") kod rada
odukupno 3 minuta s 2 odmora od po 30 sekundi u toku rada (eksperimentalna situacija "c") i
kod rada od ukupno 3 minute s 3 odmora od po 20 sekundi (eksperimentalna situacija "d"). Na
ukupno 11 ispitanika dobio je ove rezultate, koje je za svakog ispitanika posebno pretvorio u
rangove (rang je uz svaki rezultat označen u zagradi):

19
Zbog kontrole treba izračunati sumu rangova:
𝑁
𝑁𝑘(𝑘 + 1)
∑ 𝑇𝑖 =
2
𝑖=1

44 ∙ 5
110 = = 110
2

Izračunamo li zbir kvadriranih suma rangova, dobijamo:

∑ 𝑇𝑖2 = 352 + 332 + 222 + 202 = 3198

Uvrstimo li dobijene vrednosti u formulu (1), dobijamo:

𝑄 = 9.44

Granična vrednost za 𝜒 2 sa k-1, dakle 3 stepena slobode iznosi 7,815 što je manje od
dobijenog Q pa se može reći da uzorci ne pripadaju istoj populaciji, tj. da se statistički značajno
razlikuju. Dakle, odbacujemo nultu hipotezu.

20
Kendalov W test

Kendalov W test, takođe se kaže da je Kendalovo W njegov keoficijent usklađenosti, je


test neparametarske disperzione analize. Isti predstavlja normalizaciju statistike Fridmanovog
testa, i koristi se za ocenjivanje usklađenosti između više procena rangiranja datih podataka. W
se kreće od 0 što predstavlja potpunu neusklađenost, do1 što je potpuna usklađenost.
Neka je dato n uzoraka, koje rangiramo sa 𝑟𝑖𝑗 , gde je navedeno rang 𝑗-te vrednosti iz 𝑖-tog
uzorka gde svaki od uzoraka ima m vrednosti. (𝑖 = 1, … , 𝑛, 𝑗 = 1, … , 𝑚). Računamo sumu
rangova svakog uzorka:
𝑚

𝑅𝑖 = ∑ 𝑟𝑖𝑗
𝑗=1

A zatim i uzoračku sredinu suma rangova uzoraka:


𝑛

𝑅̅ = ∑ 𝑅𝑖
𝑖=1

I na kraju uzoračku disperziju za sume:


𝑛

𝑆 = ∑(𝑅𝑖 − 𝑅̅ )2
𝑖=1

Kendalovo W se definiše sa:

12𝑆
𝑊=
𝑚2 (𝑛3 − 𝑛)

Veličina W predstavlja nivo usklađenosti rangiranja među uzorcima.

Ukoliko među uzorcima dolazi do veza odnosno da se neke vrednosti unutar uzoraka
ponavljaju više puta, može se izvršiti korekcija vrednosti W transformisanjem prethodnog izraza
na sledeći način:

12 ∑𝑛𝑖=1(𝑅𝑖 )2 − 3𝑚2 𝑛(𝑛 + 1)2


𝑊=
𝑚2 𝑛(𝑛2 − 1) − 𝑚 ∑𝑚 𝑗=1 𝑇𝑗

Gde je:

21
𝑔𝑗

𝑇𝑗 = ∑(𝑡𝑖3 − 𝑡𝑖 )
𝑖=1

𝑡𝑖 broj jednakih vrednosti u i-tom uzorku, a 𝑔𝑗 broj uzoraka sa vezanim rangovima.


Vrednost izraza W se ovom transformacijom ne menja značajno osim u slučaju kad je broj
vezanih rangova zaista veliki.

Kohranov Q test

Ako na istoj skupini ispitanika (ili na različitim skupinama, ali one moraju biti
"mečovane“, tj. svaki ispitanik u svakoj skupini mora imati svog "dvojnika" u drugim skupinama
koji mu je u svim relevantnim faktorima veoma sličan) vršimo merenje u različitim uslovima, ali
su rezultati ispitanika „dihotomni“, tj. svrstani u samo dve kategorije (pao-prošao, zdrav-
bolestan, i sl.), onda je za testiranje postoje li razlike između pojedinih situacija pogodan
Kohranov Q test. Tim testom zapravo se testira razlika između proporcija neke karakteristike u
različitim uslovima.

Kohranov Q test ilustrovaćemo primerom.

Pretpostavimo da je 20 studenata polagalo tri ispita, i da smo na svakom ispitu


registrovali da li je student prošao ili pao, pa nas zanima postoji li razlika u proporciji uspešnosti
polaganja tih ispita. Na donjoj tablici pokazani su rezultati (+ = prošao. - = pao):

Postupak za izračunavanje može se podeliti u tri „koraka":

1. Naći sumu svakog eksperimentalnog uslova (situacije) (dakle ∑ 𝑋1, ∑ 𝑋2 , ∑ 𝑋3 ,... itd.)
U našem slučaju to su ove sume: ∑ 𝑋1 = 17, ∑ 𝑋2 = 9, ∑ 𝑋3 = 7.

2. Sumirati rezultate svakog ispitanika u svim eksperimentalnim uslovima (situacijama),


tj. izračunati sumu za svaki red (∑ 𝑋𝑅 ) i tu sumu kvadrirati (odrediti (∑ 𝑋𝑅 )2).

3. Sumirati obe kolone, tj. sumirati kolonu ∑ 𝑋𝑅 i kolonu ∑(𝑋𝑅 )2. Formula (statistika) za
Q glasi:
2
[𝑘 ∑(∑ 𝑋)2 − (∑ 𝑋𝑅 ) ]
𝑄 = (𝑘 − 1) gde je 𝑘 broj situacija (ispita)
𝑘 ∑ 𝑋𝑅 − ∑(𝑋𝑅 )2

22
U našem slučaju dakle imamo: 𝑄 = 9,88

Q test distribuira se približno kao i hi-kvadrat test, sa k-1 stepeni slobode, pa u našem
slučaju imamo 2 stepena slobode. Granična vrednost hi-kvadrata (uz prag značajnosti od 5%)
iznosi 5,99. Budući da je dobijeni Q veći, odbacujemo nultu hipotezu i zaključujemo da se
rezultati ispita statistički značajno razlikuju. (To nam ne kaže kako takav rezultat valja
interpretirati: možda je razlog razlikama u težini predmeta, možda u različitoj strogosti pojedinih
nastavnika, možda u manjem interesu studenata za neki predmet, itd.)

Kao što iz ovog primera vidimo, Q test nam slično kao i ANOVA daje podatak da
rezultati različitih ispitivanih uslova ne pripadaju istoj populaciji, ali nam ne kaže koji se
rezultati među sobom statistički značajno razlikuju.

23
Post hoc testovi

U uopšteno naučnim analizama, post hoc analiza se odnosi na vršenje testiranje neke
pojave pre nego što su nam dati podaci o istoj (post hoc znači „posle ovoga“). Ovo obično pravi
problem „višestrukog upoređenja“, jer se svaka potencijalna analiza smatra efektivnim
statističkim testom. Procedura višestrukog upoređenja se često koristi u svrhu kompenzacije post
hoc testa statističkim ili obratno, međutim to je uglavnom vrlo teško ili nemoguće uraditi
precizno. Sprovođenje post hoc analize bez adekvatnog tumačenja se često kritički karakteriše
kao trošenje podataka, jer, kako kritičari smatraju, što više nešto tražimo, više je verovatno da
ćemo to i naći.

Ponekad je razlog vršenja post hoc analize želja za postizanjem pozitivnih rezultata, ili to
da se projekat vidi kao uspešan, međutim u slučaju loše procene u farmaceutskoj industriji, može
doći do velikih negativnih finansijskih i pravnih posledica. Zbog toga, na primer, državne
administracije za hranu i lekove ne koriste post hoc analizu.

U matematičkoj statistici takozvani post hoc ili a posteriori postupci podrazumevaju


izvođenje svih mogućih upoređenja između aritmetičkih sredina tretmana. Post hoc postupci
mogu da se odnose na individualna upoređenja aritmetičkih sredina tretmana ili na grupe ovih
sredina. Mnogi postupci višestrukih upoređenja odnose se i na upoređenja između proseka
tretmana pomoću kontrasta (unapred određena upoređenja). Uopšteno, kontrast predstavlja
upoređenje proseka tretmana koji su od interesa primenjujući linearnu kombinaciju totala
tretmana.

U istraživačkom radu, prilikom izvođenja analize varijanse, statistički značajan F-test


podrazumeva odbacivanje nulte hipoteze o jednakosti aritmetičkih sredina tretmana. U takvom
slučaju izvode se dalja isptivanja kako bi se utvrdilo postojanje razlike između tretmana, pri
čemu se češće upoređuju proseci nego totali tretmana. Zbog toga je nekad pogodnije vršiti post
hoc analizu.

U većini praktičnih situacija obično su upoređenja zasnovana na parovima aritmetičkih


sredina. Pri tome se upoređuju svi parovi aritmetičkih sredina k ispitivanih tretmana, pri čemu se
definiše sledeća polazna nulta hipoteza, 𝐻0 (𝜇𝑖 = 𝜇𝑗 ) za sve vrednosti 𝑖 ≠ 𝑗.

Osnovne karakteristike primenjenih testova daju se u produžetku. Karakteristično za ove


testove je da se pri utvrđivanju kritične vrednosti koristi ocenjena standardna greška razlike dve
aritmetičke sredine i ocenjena standardna greška aritmetičke sredine, koje su zasnovane na
ocenjenoj disperziji pogreške (𝑆𝑝2 ) iz tabele disperzione analize. U slučaju LSD testa koristi se
standardna greška razlike dve aritmetičke sredine data sledećim izrazom:

1 1
𝑆(𝑥̅𝑖 −𝑥̅̅̅)
𝑗
= √𝑆𝑝2 ( − )
𝑛𝑖 𝑛𝑗

24
ukoliko se radi o nejednakom broju ponavljanja tretmana.

Ili,

2𝑆𝑝2
𝑆(𝑥̅𝑖 −𝑥̅̅̅)
𝑗
=√
𝑛

ukoliko se radi o jednakom broju ponavljanja tretmana, tj. ako je ogled balansiran, tada je
𝑛1 = 𝑛2 = ⋯ = 𝑛𝑘 = 𝑛.

U slučaju ostalih testova koristi se standardna greška aritmetičke sredine data izrazom:

𝑆𝑝2
𝑆𝑥̅ = √ (1)
𝑛

Ukoliko je broj ponavljanja tretmana nejednak, tada se 𝑛 u izrazu (1) zamenjuje


vrednošću 𝑛̅, koja je data izrazom:

𝑘
𝑛̅ = 1 1 1
[𝑛 + 𝑛 + ⋯ + 𝑛 ]
1 2 𝑘

pri čemu je k broj tretmana.

Ono što se takođe puno koristi i čije poznavanje je neophodno da bi se razumeli mnogi
post hoc testovi je F-raspodela ili Fišerova raspodela. Naime, ako su dve slučajne veličine U i V
nezavisne sa rapodelama 𝜒𝑚 2
i 𝜒𝑘2 , redom, tada slučaja veličina
2
𝜒𝑚 ⁄𝑚
𝑋= 2
𝜒𝑘⁄
𝑘

ima F-raspodelu sa m i k stepeni slobode, u oznaci 𝐹𝑚,𝑘 . Neke osobine F-raspodele su:

1
a) Ako 𝑋: 𝐹𝑚,𝑘 tada 𝑋 : 𝐹𝑘,𝑚
b) Ako 𝑋: 𝐹1,𝑘 tada √𝑋: 𝑡𝑘
𝑘
c) Ako 𝑋: 𝐹𝑚,𝑘 , i ako je 𝑘 > 2, onda je 𝐸(𝑋) = 𝑘−2.

25
LSD test

Test najmanje značajne razlike (LSD test) zasnovan je na utvrđivanju sledeće kritične
vrednosti:

𝐿𝑆𝐷𝛼 = 𝑡𝛼(𝑁−𝑘) 𝑆(𝑥̅𝑖 −𝑥̅̅̅)


𝑗
(2)

U izrazu (2) 𝑡𝛼(𝑁−𝑘) je kritična vrednost iz tablica Studentove distribucije; 𝑆𝑝2 je


disperzija pogreške iz tabele analize varijanse; (𝑁 − 𝑘) su stepeni slobode pogreške iz tabele
analize varijanse (ANOVA).Razlika svakog para proseka,|𝑋̅𝑖 − 𝑋̅𝑗 |, upoređuje se sa najmanje
značajnom razlikom 𝐿𝑆𝐷𝛼 . Ukoliko je ta razlika |𝑋̅𝑖 − 𝑋̅𝑗 | ≥ 𝐿𝑆𝐷𝛼 zaključuje se da se polazna
nulta hipoteza odbacuje, tj. zaključuje se da se proseci osnovnih skupova 𝜇𝑖 i 𝜇𝑗 značajno
razlikuju.

Ovaj test se koristi kada je F-test značajan i kada se žele sačiniti planirana upoređenja
proseka. Iako je 𝐿𝑆𝐷 test najrasprostranjeniji u primenama, ukoliko se primeni za broj poređenja
koji je veći od broja stepeni slobode sume kvadrata tretmana iz analize varijanse, za rezultat ima
nerealno veliki broj statistički značajnih poređenja. Ako je 𝛼 prag značajnosti za jedno
poređenje, verovatnoća da se pogrešno odbaci bar jedna nulta hipoteza u slučaju 𝑚 poređenja je
1 − (1 − 𝛼)𝑚 . Tako, na primer, u slučaju 𝛼 = 0,05 i 𝑘 = 5 tretmana ako bi se primenila sva
poređenja (𝑚 = 10), verovatnoća pogrešnog odbacivanja nulte hipoteze je 0,40. Postoje
procedure korekcije 𝐿𝑆𝐷 testa u slučaju višestrukih poređenja, kao što su Bonferonijev
(Bonferroni) test, gde je prag značajnosti za individualna poređenja 𝛼 ′ = 𝛼⁄𝑚 i Dan-Šidakov
1
(Dunn-Šidák) test gde je 𝛼 ′ = 1⁄2 ∙ (1 − (1 − 𝛼) ⁄𝑚 ).

Takijev test

Takijev test je sličan LSD testu. Ovaj test ima i naziv HSD (honestly significant
difference) test. U primeni ovog testa utvrđuje se sledeća kritična vrednost.

𝐻𝑆𝐷𝛼 = 𝑞𝛼(𝑘;𝑁−𝑘) 𝑆𝑥̅ (3)

Vrednost 𝑞𝛼 u izrazu (3) utvrđuje se iz posebnih tablica po Takiju, u zavisnosti od broja


tretmana k i stepena slobode pogreške.

Ukoliko je razlika |𝑋̅𝑖 − 𝑋̅𝑗 | ≥ 𝐻𝑆𝐷𝛼 , nulta hipoteza o jednakosti sredina se odbacuje.

26
Takijev test je više konzervativan u odnosu na Dankanov ili Njuman - Kelsov test.
Analitički je pokazano da od svih testova koji daju jednake intervale poverenja za sve parove
sredina, ovaj test daje najkraći interval.

Dankanov test

Dankanov test (višestruki intervalni test) ima čestu primenu u praktičnom radu. Kritična
vrednost ovog testa utvrđuje se primenom sledećeg izraza:

𝑅𝑝 = 𝑟𝛼(𝑝;𝑁−𝑘) 𝑆𝑥̅ (za 𝑝 = 2,3, . . . , 𝑘) (4)

Kritična tablična vrednost 𝑟𝛼 , iz izraza (4) određuje se iz posebnih tablica po Dankanu, u


zavisnosti od stepena slobode pogreške u tabeli analize varijanse i broja intervala sredina 𝑝 =
2,3, . . . , 𝑘.

U primeni ovog testa proseci tretmana se rangiraju prema veličini. Tada se razlika
najvećeg i najmanjeg proseka upoređuje sa najmanje značajnim intervalom 𝑅𝑝 . Ukoliko je
razlika |𝑋̅𝑖 − 𝑋̅𝑗 | ≥ 𝑅𝑝 , ona je statistički značajna.

Ovaj test je vrlo efikasan test i zbog toga se često koristi. Pogodan je ukoliko se žele
testirati višestruke hipoteze.

Njuman-Kels test

Njuman-Kels test je sličan Dankanovom testu. Kritična vrednost se utvrđuje primenom


sledećeg izraza:

𝐾𝑝 = 𝑞𝛼(𝑘;𝑁−𝑘) 𝑆𝑥̅ (za 𝑝 = 2,3, . . . , 𝑘) (5)

Tablična vrednost 𝑞𝛼 , u izrazu (5) preuzima se iz posebnih tablica za ovaj test. Postupak
upoređenja je analogan kao i kod Dankanovog testa. I kod ovog testa aritmetičke sredine
tretmana su rangirane.

Njuman-Kels test je više konzervativan u odnosu na Dankanov test i ovaj test se može
primeniti ukoliko se testiraju višestruke hipoteze.

27
Šefeov metod

Šefeov metod se koristi kada je F-test statistički značajan i kada se žele sačiniti
neplanirana upoređenja sredina tretmana. Šefeov postupak se sastoji u utvrđivanju sledeće
kritične vrednosti:

𝑘
𝐶𝑗2
𝑆 = √(𝑘 − 2
1)𝐹𝛼(𝑟1 ,𝑟2 ) √𝑆𝑝 [∑ ]
𝑛𝑗
𝑗=1

gde je 𝐹𝛼 tablična vrednost iz tablica F-distribucije; 𝑟1 i 𝑟2 su stepeni slobode pogreške iz


tabele analize varijanse; k je broj tretmana; Cj koeficijent kontrasta; nj je koeficijent nivoa
tretmana. Ukoliko je kontrast proseka tretmana veći od kritične vrednosti, tada se hipoteza da je
kontrast jednak nuli odbacuje. Šefeov test je više konzervativan u odnosu na Njuman – Kels test
i Dankanov test, što uslovljava da će primenom ovog testa biti znatno manje značajnih poređenja
u odnosu na druge testove. Prednost ovog testa je u manjoj osetljivosti na odstupanje raspodele
podataka od normalne distribucije, kao i narušavanje pretpostavke o homogenosti varijansi.□

Bonferonjeva metoda t-testova

Kaže se da se ispituje uticaj jednog određenog faktora A na vrednosti obeležja X koje se


posmatra na populaciji E. Populacija E je podeljena na k podpopulacija 𝐸1 , … , 𝐸𝑘 . Faktor A ima k
(𝑘 ≥ 2) različitih nivoa i pretpostavlja se da na svaku podpopulaciu deluje samo po jedan nivo
faktora, tj. na podpopulaciju 𝐸𝑖 , utiče nivo 𝐴𝑖 faktora A.

Ovaj test predstavlja testiranje jednakosti matematičkih očekivanja svih parova nivoa
faktora A. Nulte hipoteze su 𝐻0 (𝑚𝑖 = 𝑚𝑗 ), a alternativne 𝐻1 (𝑚𝑖 ≠ 𝑚𝑗 ), 𝑖, 𝑗 = 1, … , 𝑘, 𝑖 ≠ 𝑗.
𝑘
Svaki od tih ( ) je istog tipa i koristi t-raspodelu.
2

U slučaju k=2 jednofatorska disperziona analiza se svodi na Studentov t-test. Naime, u


tom slučaju testira se 𝐻0 (𝑚1 = 𝑚2 ) protiv 𝐻1 (𝑚1 ≠ 𝑚2 ) i tada je 𝑛 = 𝑛1 + 𝑛2 kao i 𝑋̅ =
1
(𝑛1 𝑋̅1 + 𝑛2 𝑋̅2 ). Vrednost test-statistike se dobija neposrednim izračunavanjem itd.
𝑛

Postupak ovde nećemo izložiti jer se u istom javlja puno nepoznatih oznaka i pojmova
vezanih za jednofaktorsku diperzionu analizu, što nije tema ovog rada, a čije bi bliže izlaganje
bilo neophodno.

28
Neujednačenost značajnosti rezultata upoređenja pojedinih testova indikator je njihove
različite rigoroznosti i efikasnosti, odnosno, konzervativnosti. Proizilazi da je najmanje rigorozan
LSD – test, a da je Šefeov test najviše rigorozan, odnosno, ovaj test je više konzervativan u
odnosu na ostale testove. Tako se u literaturi navodi da je, na primer, Takijev HSD test, s
obzirom na konzervativizam, između Njuman – Kelsovog i Šefeovog testa a da je Šefeov metod,
najčešće, više konzervativan u odnosu na Njuman – Kelsov i Dankanov test.

Narednom tabelom je površno ilustrovan primer primene navedenih prvih pet pos hoc
testova:

29
30
Literatura:

1. Verovatnoća i statistika – dr Vesna Jevremović, Univerzitet u Beogradu,


Matematički fakultet.
2. Statistika u ekonomiji i menadžmentu – dr Njegoš Šolak
3. Eksperimentalno ispitivanje rezultata nekih testova – S. Hadživuković, R.
Zengal, K. Čobanović, Statistička revija, Beograd 1972.
4. D. C. Montgomery – Design and Analysis of Experiments, John Wiley and Sons,
inc., 1997.
5. R. E. Kirk – Eksperimental Design: Procedures for the Behavioral Sciences,
Brooks/Cole Publishing Company, Belmont, California, 1968.
6. Vjerojatnost i statistika - Statistika i procesi – Neven Elezović
7. Wikipedia, i brojni sažeci sa interneta.

31

You might also like