You are on page 1of 5

HI KVADRAT TEST

SEMINARSKI RAD IZ MEDICINSKE STATISTIKE

Autor Mentori:
Student medicine: Prof.dr Srđan Mašić
Lazo Pavić Ass.dr Dragan Spajić
Hi-kvadratni test, takođe napisan kao χ2 test, jeste test statističke hipoteze gde
je distribucija uzorka testirane statistike hi-kvadratna distribucija kad je nulta
hipoteza istinita. Bez druge kvalifikacije, hi-kvadratni test često se koristi kao zamena
za Pirsonov hi-kvadratni test. Hi-kvadratni test se koristi da se utvrdi da li postoji
značajna razlika između očekivanih frekvencija i posmatranih frekvencija u jednoj ili više
kategorija.

U standardnim primenama ovog testa, zapažanja su svrstana u međusobno isključive


klase, i postoji neka teorija, ili nulta hipoteza, koja daje verovatnoću da bilo koje
opažanje padne u odgovarajuću klasu. Svrha testa je da se proceni koliko su verovatne
opservacije, pod pretpostavkom da je nulta hipoteza tačna.

Hi-kvadratni testovi se obično konstruišu iz sume kvadriranih grešaka, ili pomoću


varijanse uzorka. Statistika testa koja sledi hi-kvadratnu distribuciju proizilazi iz
pretpostavke nezavisnih normalno distribuiranih podataka, koja je u mnogim
slučajevima validna zbog centralne granične teoreme. Hi-kvadratni test može se koristiti
za pokušaj odbacivanja nulte hipoteze da su podaci nezavisni.

ISTORIJAT

U 19. veku, statističke analitičke metode uglavnom su primenjivane u analizi bioloških


podataka i bilo je uobičajeno da istraživači pretpostavljaju da su zapažanja
pratila normalnu distribuciju, kao što su to činili Ser Džordž Eri i profesor Meriman, čije
je radove kritikovao Karl Pirson u svom radu iz 1900. godine.
Do kraja 19. veka, Pirson je uočio postojanje značajne asimetrije unutar nekih bioloških
posmatranja. Da bi modelovao zapažanja nezavisno od toga da li su normalna ili
asimetrična, Pirson je u nizu članaka objavljenih od 1893 do 1916,osmislio Pirsonovu
distribuciju, porodicu neprekidnih raspodela verovatnoće, koja uključuje normalnu
distribuciju i mnoge asimetrične distribucije. On je predložio metod statističke analize
koji se sastoji od upotrebe Pirsonove distribucije za modelovanje posmatranja i vršenja
testa dobrog uklapanja kako bi se utvrdilo koliko se model i posmatranje zaista
uklapaju.

Pirsonov hi-kvadratni test

Godine 1900, Pirson je objavio publikaciju o χ2 testu, koja se smatra jednim od


fundamentalnih radova u modernoj statistici. U tom radu, Pirson je istražio test
adekvatnosti uklapanja.

Ako se pretpostavi da je n opažanja slučajnog uzorka iz populacije klasifikovano u k


međusobno isključujućih klasa sa odgovarajućim posmatranim brojevima xi (za i =
1,2,…,k), a da nulta hipoteza daje verovatnoću pi da će opažanje pasti u i-tu klasu.
Dakle, dostupni su očekivani brojevi mi = npi za svako i, gde

Pirson je predložio da u slučaju da je nulta hipoteza tačna kao n → ∞, ograničavajuća


distribucija navedene količine je raspodela χ2.

Pirson se prvo bavio slučajem u kojem su očekivani brojevi mi dovoljno veliki poznati
brojevi u svim ćelijama pod pretpostavkom da se svaki xi može uzeti kao normalno
raspodeljen, i postigao je rezultat da, na granici kada n postane veliko, X2 sledi χ2
raspodelu sa k − 1 stepeni slobode.

Pirson je zatim razmotrio slučaj u kojem očekivani brojevi zavise od parametara koji se
moraju proceniti iz uzorka. On je predložio da kad mi označava prave očekivane
brojeve, a m′i procenjene očekivane brojeva, razlika

obično biva pozitivna i dovoljno mala da se može zanemariti. U zaključku, Pirson je


tvrdio da ako se smatra da je X′2 takođe raspodeljena kao χ2 distribucija sa k − 1
stepeni slobode, greška u ovoj aproksimaciji neće uticati na praktične odluke. Ovaj
zaključak izazvao je određene kontroverze u praktičnim primenama i to nije bilo
rarešeno tokom 20 godina, do objavljivanja Fišerovih publikacija iz 1922. i 1924. godine.
U kriptoanalizi, hi-kvadratni test se koristi za upoređivanje distribucije otvorenog teksta i
(mogućeg) dekriptovanja šifroteksta. Najniža vrednost testa znači da je dešifrovanje bilo
uspešno sa velikom verovatnoćom. Ova metoda se može generalizovati za rešavanje
savremenih kriptografskih problema.
U bioinformatici, hi-kvadratni test se koristi za upoređivanje raspodele određenih
svojstava gena (npr. genomskog sadržaja, brzine mutacije, interakcione mreže
klasterovanja itd.) koje pripadaju različitim kategorijama (npr. geni bolesti, osnovni geni,
geni na određenom hromozomu itd.).

HI HVADRATNA RASPODELA

U teoriji verovatnoće i statistici, hi-kvadratna raspodela (takođe hi-kvadrat ili χ2-


raspodela) sa k stepena slobode je distribucija sume kvadrata k nezavisnih standardno
normalnih randomnih promenljivih. Hi-kvadratna distribucija je specijalni slučaj gama
distribucije i jedna je od od najšire korištenih distribucija verovatnoće u inferencijskoj
statistici, naročito u testiranju hipoteza ili u konstrukciji intervala pouzdanostiKada se
pravi razlika od opštije necentralne hi-kvadratne raspodele, ova distribucija se ponekad
naziva centralnom hi-kvadratnom raspodelom. Hi-kvadratna raspodela se koristi u
uobičajenim hi-kvadratnim testovima za adekvatnost uklapanja posmatrane distribucije
u teorijski očekivanu, nezavisnost dva kriterijuma klasifikacije kvalitativnih podataka, i
procenu intervala pouzdanosti za populaciju standardnih devijacija normalne distribucije
iz standardne devijacije uzorka. Mnogi drugi statistički testovi takođe koriste ovu
distribuciju, kao što je Fridmanova analiza varijanse po rangovima.
p-vrednost je verovatnoća opservacije
statističkog testa bar kao ekstrema u hi-kvadratnoj distribuciji. Shodno tome,
pošto kumulativna funkcija raspodele (CDF) za odgovarajuće stepene slobode (df) daje
verovatnoću da je dobijena vrednost manje ekstremna od ove tačke, oduzimanje CDF
vrednosti od 1 daje p-vrednost. Mala p-vrednost, ispod izabranog nivoa značaja, ukazuje
na statistički značaj, tj. dovoljan dokaz da se odbaci nulta hipoteza. Nivo značaja od 0,05
se često koristi kao granica između značajnih i neznačajnih rezultata.
Donja tabela daje broj p-vrednosti koje odgovaraju sa χ2 za prvih 10 stepeni slobode.

You might also like