Professional Documents
Culture Documents
Primer 1: Ispitivana je učestalost krvnih grupa u određenoj populaciji. Na slučajnom uzorku od 140
osoba, nađeno je da krvnu grupu O ima 55 osoba, krvnu grupu A 59 osoba, krvnu grupu B 19 osoba
i krvnu grupu AB 7 osoba. Podaci se nalaze u dokumentu Krvne grupe.xlsx koji se može preuzeti sa
naslovne stranice kursa. Na osnovu ranijih istraživanja poznato je da je relativna učestanost tih
krvnih grupa: O – 44.5%, A – 38.9%, B – 12.1%, AB – 4.5%. Da li se aktuelne učestalosti krvnih grupa
razlikuju od očekivanih? Testirati na nivou značajnosti od 0,05.
Rešenje:
Učestalost opaženih krvnih grupa iznosi: Očekivane učestalosti:
O – 55 O – 44.5%
A – 59 A – 38.9%
B – 19 B – 12.1%
AB – 7 AB – 4.5%
odabrati variablu
čekirati Hi-kvadrat
test slaganja
u okviru polja Variables (pick one or more) odabrati varijablu za koju se izračunava Hi-
kvadrat test slaganja
čekirati polje Chi-square goodness-of-fit test (for one variable only)
kliknuti na dugme OK.
4) U dijalog prozoru koji se pojavio, ukucati očekivane učestalosti za sve kategorije ispitivane
varijable, pa kliknuti na dugme OK. Zbir očekivanih učestalosti mora da bude 1. Obratiti pažnju
da je redosled kategorija u dijalog prozoru po abecednom redu i da se može razlikovati od
redosleda u zadatku.
Hi-kvadrat test za r x k tabele se može koristiti za testiranje hipoteza kada su podaci organizovani u
vidu tabela kontingencije. Ako jedna varijabla ima r kategorija, a druga k kategorija, onda tabela ima
dimenzije r x k.
Tabela kontingencije je složena kombinovana tabela u kojoj raspodela zavisi od dve varijable.
Kategorije prve varijable nalaze se u pretkoloni a kategorije druge varijable u zaglavlju tabele. Na
presecima kategorija obe varijable nalaze se ćelije koje sadrže opažene učestalosti (kontingenti)
kombinacija kategorija dve varijable, a koje se u opštem prikazu tabele kontingencije označavaju
slovima a, b, c i d.
Zavisno od cilja istraživanja i načina biranja uzorka, analizom tabela kontingencije možemo testirati
(1) nezavisnost dve varijable ili (2) homogenost dve populacije. U oba ova slučaja za testiranje
hipoteza može se upotrebiti hi-kvadrat test, a način izračunavanja hi-kvadrat statistike je identičan.
Primer 2 (primer hi-kvadrat testa kada tabelu kontingencije treba formirati iz sirovih podataka):
Za slučajan uzorak od 40 osoba obolelih od osteoporoze dati su podaci o fizičkoj aktivnosti i
frakturama. Da li postoji povezanost fizičke aktivnosti i fraktura u populaciji obolelih od osteoporoze?
Testirati na nivou značajnosti od 0.05.
Testiramo nultu hipotezu da ne postoji povezanost fizičke aktivnosti i fraktura u populaciji obolelih
od osteoporoze. U pitanju je raspodela prema dve varijable (fizička aktivnost i prelomi) na osnovu
kojih treba formirati tabelu kontingencije. Podaci su dati u sirovom (neobrađenom,
neorganizovanom) obliku.
Sledećim komandama biće dobijena tabela kontingencije, procenti, očekivane učestalosti, i vrednost
hi-kvadrat statistike na osnovu koje će biti doneta odluka o odbacivanju ili prihvatanju nulte
hipoteze:
1) Preuzeti i učitati bazu podataka Osteoporoza.xlsx
2) Kliknuti na liniji sa komandama: Statistical analysis→Discerete variables→Create two-way
table and compare two proportions (Fisher`s exact test)
u okviru polja Row variable (pick one or more): odabrati varijablu koja će definisati redove u
tabeli kontingencije
u okviru polja Column variable (pick one): odabrati varijablu koja će definisati kolone u tabeli
kontingencije
u delu Compute Percentages označiti Row percentages za izračunavanje procenata po
redovima
u delu Hypothesis Tests:
o čekirati polje Chi-square test za izračunavanje Hi-kvadrat testa
o čekirati polje Print expected frequencies za izračunavanje očekivanih učestalosti
u delu Continuity correction of chi-square test: označiti No, da bi se Hi-kvadrat test izračunao
bez Yatesove korekcije
4) U prozoru sa rezultatima pojavili su se rezultati primenjene statističke procedure.
tabela kontingencije sa
opserviranim učestalostima
procenti po redovima
očekivane učestalosti
5) Zaključak: Učestalost fraktura iznosila je 12.5% kod fizički aktivnih ispitanika, i 50.0% kod fizički
neaktivnih ispitanika. U populaciji obolelih od osteoporoze frakture su statistički značajno
povezane sa fizičkom neaktivnošću (Hi-kvadrat = 5.934, DF = 1, p = 0.015).
Primer 3 (primer hi-kvadrat test kada je tabela kontingencije već formirana): Cilj u studiji preseka
bio je ispitivanje odnosa konzumiranja alkohola i patološkog nalaza na jetri. Formiran je slučajan
uzorak, veličine 118 ispitanika, iz opšte populacije odraslih osoba. Rezultati su prikazani u tabeli
kontingencije:
Patološki nalaz na jetri
+ – Ukupno
Konzumiranje + 10 16 26
alkohola – 13 79 92
Ukupno 23 95 118
1) Kliknuti na komande:
Original menu→Statistics→Contingency tables→Enter and analyze two-way table…
tabela kontingencije sa
opserviranim učestalostima
procenti po redovima
očekivane učestalosti
4) Zaključak: Patološki nalaz na jetri imalo je 38% ispitanika koji konzumiraju alkohol i 14%
ispitanika koji ne konzumiraju alkohol. Patološke promene na jetri su statistički značajno
povezane sa konzumiranjem alkohola (Hi-kvadrat = 7.647, DF = 1, p = 0.006).