You are on page 1of 73

Odabir statističkih testova

Prof dr med Aida Ramić-Čatak


Sadržaj predavanja
• Vrste statističkih testova
• Značaj statističkih testova
• Faktori koji utiču na odabir statističkog testa
Statistički testovi
• Postupci pomoću kojih se dolazi do odluke o prihvatanju
ili odbacivanju statističke hipoteze .
• Određuje odnos između pojedinih statističkih obilježja tj.
varijabli.
Vrste statističkih testova

Odabir statističkog testa ovisi o :


• Vrste istraživačkog problema, predmeta i teme
istraživanja
• Karakteristikama/obilježjima analiziranih varijabli
• Tipu i strukturi istraživanja
Od čega ovisi odabir testa?
• Od vrste, ciljeva i hipoteze istraživanja.
• Od raspodjele podataka ( parametrijski, neparametrijski,
pri čemu gotovo svaki parametrijski statistički test ima
odgovarajuću neparametrijsku inačicu).
Od čega ovisi odabir testa?
• Od veličine i vrste uzorka koji je procjenjen kao optimalan
za određenu vrstu istraživanja.
• Prije odabira testa potrebno je ispitati vrstu podataka,
normalnost raspodjele podataka, homogenost varijanci.
Od čega zavisi odabir testa?

Četiri stvari su posebno bitne za odabir „prave“ statističke


metode:
• 1. Tip podataka – vrsta mjerne skale podataka
(nominalni, ordinalni, intervalni ili omjerni)
• 2. Veličina uzorka – veliki ili mali
Od čega zavisi odabir testa?
• 3. Ovisni ili neovisni uzorci – isti ili različiti ispitanici,
koliko ima grupa, obično su to ispitivana i kontrolna
grupa), jesu li grupe uparene ili nisu – ovisni ili neovisni
uzorci.
• 4. Vrsta distribucije rezultata – slijede li podaci iz
uzoraka normalnu raspodjelu određuje odabir
parametrijskih ili neparametrijskih metoda.
1. Tip podataka - Skala mjerenja varijabli
Određena je svojstvima brojčanog sistema koja određuju pravila
pridjeljivanja brojeva pojavama :
• 1. utvrđivanje identiteta – NOMINALNA SKALA
• 2. utvrđivanje reda – ORDINALNA SKALA
• 3. utvrđivanje razlika – INTERVALNA SKALA
• 4. utvrđivanje omjera – OMJERNA SKALA
Skale mjerenja vrijednosti varijabli

Nominalna
Identitet (deskriptivna kategorija)
KVALITATIVNE VARIJABLE
Ordinalna
Identitet i jačina

Intervalna
Identitet, jačina i jednaki intervali
KVANITATIVNE VARIJABLE
Omjerna skala
Identitet, jačina, jednaki intervali
i apsolutna nula
Oblici mjerenja / vrste varijabli
Vrsta varijable Obilježja varijable Primjer
(oblik
mjerenja)
Kvalitativne Nominalne Neuređene kategorije, Spol
nemaju brojevne
vrijednosti
Ordinalne Uređene kategorije Ocjene( 1-5)
Skale (1-5)

Kvantitativne Intervalne Razlike Nema Temperatura,


(numeričke ili između apsolutne pH vrijednost
brojčane) brojčanih 0,
vrijednosti rijetke
imaju
Omjerne značenje Apsolutna Visina u m
(2kg, 2cm), 0 Težina u kg
Uzorak - temeljni pojmovi
• Ciljna populacija (Target population) – skupina
jedinki na koje se istraživanje odnosi.
• Osnovni skup – skupina jedinki iz koje biramo
uzorak.
• Okvir za izbor uzorka (Sampling frame) –
popis jedinica osnovnog skupa - podaci iz koji
se formira uzorak.
• Uzorak – dio populacije na kojem se provodi
istraživanje i temeljem kojega se zaključuje o
cijeloj populaciji.
• Element – pojedinačni član populacije čija će se
svojstva(osobine) mjeriti.
Uzorak je podskup populacije
Različite populacije unutar Odnos populacije i uzorka
stanovništva
Vrste uzoraka u statističkim istraživanjima
Uzorak

Nereprezentativan

Reprezentativan
Nezavršena
osnovna škola Osnovna škola
19% 22%
Više ili visoko
obrazovanje
Nereprezentativan 12%

Srednja škola
47%
2. Veličina uzorka (1)
• Uzorci se razlikuju po veličini: do 30 se smatraju mali, a iznad toga
su veliki, mada neki autori smatraju da do 50 podataka (ispitanika,
mjerenja) predstavlja mali uzorak.
• Činjenica da li je uzorak veliki ili mali zavisi od statističke metode
koja se želi primijeniti.
• Parametrijske metode primjenjive su uglavnom na velikim
uzorcima, i to sa normalnom distribucijom (sa izuzecima t-testova
za male ovisne i neovisne uzorke, te još nekim metodama).
2. Veličina uzorka (2)
• U slučaju jednog uzorka postavlja se važno pitanje: kakav se
statistički zaključak može donijeti, budući da je očigledno kako
nisu ispunjeni uslovi za poređenje?
• Ako su u istraživanju dva uzorka (što je najčešće), potrebno
pratiti ispravni postupak inferencijalne statistike kako bi se
uradilo ispravno poređenje između uzoraka.
2. Veličina uzorka (3)
• Kod više od dva uzorka, statistička analiza je nešto
kompliciranija, ali postoje statistički testovi sa kojima se mogu
obraditi ovakvi podaci.
• Može se raditi poređenje srednjih vrijednosti za sve uzorke u
jednom trenutku koristeći analizu varijance (ANOVA test).
• U daljnjoj analizi, mogu se uraditi poređenja između svakog para
uzoraka post hoc testovima koji se primjenjuju u drugom stepenu
analize varijance u slučaju da je nulta hipoteza odbačena.
3. Ovisni i neovisni uzorci
Ovisni uzorci
• Jedna grupa ispitanika na kojoj je dva puta mjerena ista pojava.
(zbog čega se nazivaju i parni)
• Općenito, kad god je ispitanik u jednoj grupi povezan sa
ispitanikom u drugoj grupi , govorimo o ovisnim uzorcima. Znači,
ispitanici u dva uzorka nisu neovisni jedni od drugih.
3. Ovisni i neovisni uzorci
Ovisni uzorci
• Ovisni ( parni) podaci se definirati kao vrijednosti koje se obično
mjere u parovima uzoraka i stoga se može očekivati da oni više
variraju između parova, nego između ispitanika unutar para
uzoraka.
3.Ovisni i neovisni uzorci
Neovisni uzorci
• Dvije odijeljene skupine ljudi (u određenim slučajevima, dokazano
neovisne osobine kod istih ljudi).
• Za neovisne uzorke vjerovatnost da član populacije bude odabran
u uzorak je potpuno neovisna o bilo kojem drugom odabranom
članu, bilo da se radi o grupi tog člana ili nekoj drugoj grupi u
istraživanju.
4. Vrsta distribucije rezultata
• Od raspodjele podataka ovisi metoda i tok analize.
• Normalna raspodjela omogućuje upotrebu parametrijskih metoda
analize.
• Odstupanje od normalne raspodjele ne omogućuje upotrebu
parametrijskih metoda.
Da ponovimo : šta su parametrijske i
neparametrijske metode?
• Od raspodjele podataka ovisi metoda istraživanja i vrsta statističke
analize (testa).
• Analiza raspodjele omogućuje uočavanje mogućih grešaka u
podacima.
• Normalna raspodjela podataka omogućuje upotrebu
parametrijskih metoda analize.
• Odstupanje od normalne raspodjele podataka ne omogućuje
upotrebu parametrijskih metoda, koriste se neparametrisjke
metode.
Parametrijske metode
• Analitičke metode koje se zasnivaju na pretpostavci NORMALNE
raspodjele podataka.
• IMAJU srednje vrijednosti i standardne devijacije.
Parametrijske metode
• Temelje se na parametrima iz uzorka/populacije
• Zahtijevaju normalnu raspodjelu podataka
Normalna raspodjela podataka

• “Gaussova” krivulja.
• Srednja vrijednost ista
kao i medijana.
• Standardna devijacija
određuje širinu.
Normalna raspodjela podataka
Primjer : Srednje vrijednosti i standardne devijacije
Neparametrijske metode

• Analitičke metode koje se ne zasnivaju na pretpostavci


normalne raspodjele podataka - neparametrijski testovi
neovisni su o vrsti i pravilnosti distribucije podataka.
• NEMAJU srednje vrijednosti i standardne devijacije.
• Podaci su po svojoj prirodi nominalni ili ordinalni.
Osobine neparametrijske metode
• Pruža mogućnost analize različitih uzoraka, sa
odstupajućim podacima (engl. outliers)
• Analiza se svodi na rang podataka a ne na stvarne
vrijednosti.
• Mali uzorci (N<30)
• Varijable koje nemaju normalnu raspodjelu (npr. enzimi,
biohemijski pokazatelji, krvni tlak, …)
• Ordinalne varijable (ocjene, starost u godinama, …)
Slabosti neparametrijske metode
• Otežana interpretacija podataka.
• Ponekad nemoguće pokazati razliku dvije skupine uzoraka
(iste vrijednosti medijana)
• Obično imaju manju snagu testa i vjerovatnije će proglasiti
neku razliku/korelaciju statistički neznačajnom, čak i ako
realna razlika/povezanost postoji.
• Veća šansa da se napraviti grešku tipa II ili β – lažna
negativnost, greška neodbacivanja nulte hipoteze iako
postoje argumenti za to.
Odabir testa u odnosu na vrstu uzorka i
raspodjelu podataka
Vrsta uzorka/istraživanja Parametrijske metode Neparametrijske metode
Dva neovisna uzorka T-test varijanta za neovisne Mann-Whitney U-test
uzorke
Dva ovisna uzorka T-test varijanta za ovisne uzorke Wilcoxonov test ekivalentnih
nizova
Nekoliko neovisnih grupa ANOVA Kruskal-Wallis test
Nekoliko ovisnih grupa ANOVA, ponovljena mjerenja Friedman test
Korelacijsko istraživanje Pearson r Spearman rs. Kendall
T-test (student analiza)

• T-test je statistički postupak za testiranje značajnosti razlike


između dva uzorka.
• Uspoređuju se njihove aritmetičke sredine.
• T-test služi za provjeru nulte hipoteze koju postavljamo prilikom
formiranja nacrta istraživanja.
T-test (student analiza)

• Ovisno o tome da li su uzorci ovisni ili neovisni, služi za


utvrđivanje značajnosti razlike između nekog tretmana ili uzoraka,
najčešće između dva tretmana ili uzorka, ili za poređenje sa nekim
standardom (jedan uzorak).
• Npr. razlika u efektima nekog lijeka kao ovisne varijable, kod dvije
različite grupe pacijenata kao neovisne varijable.

(Petz).
T-test za ovisne uzorke (1)
• Koristimo u situacijama kada god očekujemo da će nam
izmjerene vrijednosti u jednom uzorku biti bliže
određenoj vrijednosti u drugom uzorku, nego što bi to bilo
kod slučajno odabrane vrijednosti u drugom uzorku.
• Wilcoxonov test je ekvivalent t-testa za ovisne uzorke.
T-test za ovisne uzorke (2)
• Koristi se kada se odabiru ispitanici kao parovi, upareni prema
varijablama kao što su npr. dob, spol ili stepen ozbiljnosti bolesti;
pri čemu jedan od parova bude liječen na jedan načina a drugi par
na alternativni način.
• Koristi se kada se izvodi laboratorijski pokus nekoliko puta, svaki
put sa ispitivanim i kontrolnim uzorkom u duplikatu.
• Koristi se kada se mjeri varijabla ishoda kod parova
dijete/roditelj (ili bilo koji slični par).
T-test za neovisne uzorke
• Test koji se najčešće koristi za međusobno neovisne grupe
ispitanika u uzorku.
• Mann-Whitneyev U-test je neparametrijska inačica
( vrsta) t- testa za neovisne uzorke.
Analiza varijance (ANOVA)
• Praktičnija od T-testa jer omogućuje ispitivanje razlika između
većeg broja tretmana jedne neovisne varijable, što bi tražilo veći
broj t-testova.
• Služi za poređenje (nalaženje razlika) između više neovisnih
uzoraka (npr. razlika u efektima nekog lijeka kao ovisne varijable,
kod više različitih grupa pacijenata kao neovisne varijable).
• Kruskal-Wallisov test neparametrijska je inačica ANOVA-e za više
za neovisnih uzoraka, a Friedmanov test je inačica ANOVA-e za više
za ovisnih uzoraka.

(Petz).
Anova
• Analiza varijance ( nalaženje razlika)
• Poređenje više od 2 neovisne varijable , a kada test nije
dovoljan (P<0,001) radi se Post-hoc test – poređenje
svake varijable sa svakom.
Analiza varijance (ANOVA)
Š ta je korelacija ili povezanost?
• Korelacija je statistički postupak pomoću kojeg se upoređuju
promjene unutar dvije (ili više) varijabli, i rezultat govori o tome
koliko su te promjene slične.
• Označava se kao Koeficijent korelacije (r).
Š ta je korelacija ili povezanost?
• Vrijednosti variraju u rasponu (-1, 0 +1) i označavaju stepen
sličnosti.
• Š to je apsolutna vrijednost veća, veća je i sličnost, a predznak
govori u kojem smjeru se povezanost kreće, ako je pozitivna, tada
su promjene proporcionalne, a ako je negativna, promjene su
obrnuto proporcionalne.
• Koeficijent korelacije r=0 ukazuje na nepostojanje korelacije
između varijabli.
Vrste korelacije ili povezanosti?
Primjer za negativnu korelaciju:
• Između (starije ili veće ) dobi i (boljeg) zdravstvenog stanja
ispitanika- negativna korelacija znači da su stariji u prosjeku
manje zdravi.
Primjer za pozitivnu korelaciju:
• Povezanost između uspjeha na ispitu i količine učenja: veća
količina učenja znači najčešće i bolji uspjeh na ispitu.
Grafički prikaz maksimalno pozitivne korelacije
( r=1)
Grafički prikaz visoke i niske pozitivne korelacije
( r veće od 0)
Grafički prikaz maksimalno negativne korelacije
( r= -1)
Grafički prikaz niske i visoke negativne korelacije
( r manje od 0)
Grafički prikaz nepostojanja korelacije
( r = 0)
Statistički postupci za određivanje korelacije

• Spearmanov koeficijent (ρ),


• Pearsonov koeficijent (r),
• Point-biserijalni koeficijent,
• Koeficijent konkordacije (W),
• Φ-koeficijent, k
• Koeficijent kontingencije.
Zašto nam treba korelacija ili povezanost ?
• Nulta hipoteza : znači pretpostavku da neka nađena povezanost
između vrijednosti dvije varijable nije statistički značajna, tj. da
povezanost ne postoji nego je dobivena slučajno.
• Alternativna hipoteza : u kontekstu korelacije znači da postoji
statistički značajna povezanost između dvije ili više varijabli.
• Nulta hipoteza je svaka hipoteza koja se testira prema nekoj drugoj,
alternativnoj hipotezi i potvrđena ako se ne uspije dokazati da se
ove hipoteze međusobno razlikuju.
Zašto nam treba korelacija ili povezanost ?
• Direktivna hipoteza : ukazuje i na smjer povezanosti između
varijabli.
• Direktivna hipoteza je zapravo podvrsta alternativne hipoteze,
koja ukazuje na smjer razlike ili povezanosti (npr. pretpostavljamo
da će pripadnici ženskog spola biti otpornije na neku bolest, u
odnosu na muškarce. )
Testiranje hipoteze
• Testiranje razlika u tvrdnjama hipoteza se provodi po načelu
uspoređivanja aritmetičkih sredina i standardnih devijacija
izmjerenih distribucija podataka, na temelju čega je moguće
brojčano izraziti koliko je odstupanje između njih, tj. da li je veće ili
manje od neke kritične vrijednosti (što određuje da li je razlika
statistički značajna).
• Statistički značajna razlika znači da postoji statistički dokaz te
razlike; što ne mora da znači da je razlika nužno velika, važna ili
značajna u kliničkom smislu korisnosti.
Testiranje hipoteze
• Aritmetička sredina predstavlja sumu svih rezultata na nekoj
varijabli podijeljena sa brojem tih rezultata.
• Naziva se i prosječna vrijednost.
• Aritmetičku sredinu ima smisla izračunavati jedino ako je
distribucija podataka barem približno normalna.
Aritmetička sredina ( AS)
Primjer :
• Za 20 zaposlenih zdravstvene ustanove prikupljeni su podaci o
godinama starosti i uređeni po veličini.
• Podaci : 19 19 20 20 20 21 22 24 24 25 25 25 28 30 36 36 41 45 53 60
• Total iznosi: 19 + 19 + 20 + 20 + 20 + ... + 60= 593 godine (ukupni
broj navršenih godina starosti : 20 zaposlenih)
• Aritmetička sredina (AS), tj. prosječna starost radnika iznosi :
29.65 godina
Aritmetička sredina ( AS)
U Excelu, aritmetička se sredina lako
računa pomoću funkcije (fx) AVERAGE,
gdje se u polje Number1 zadaju
brojčane vrijednosti kolone za koju
aritmetičku sredinu želimo računati,
npr. B2:B6 na primjeru. Uvijek se
mogu zadati i pojedinačno brojevi u
polja od Number1nadalje, ali ovo je
jednostavniji način.
Testiranje hipoteze
• Standardno raspršenje (devijacija) je mjera normalne
distribucije koja pokazuje koliko su gusto rezultati raspoređeni
oko aritmetičke sredine.
• Najčešće se obilježava sa SD ili σ (sigma).
• Unutar ±1 σ nalazi se 68.26% rezultata mjerenja, unutar ±2 σ
nalazi se 95.44% rezultatamjerenja , a unutar ±3 σ nalazi se
99.73% rezultata mjerenja, tako da je u praksi gotovo potpuni opis
pojave unutar tog intervala.
• Ako znamo iznose aritmetičke sredine i standardne devijacije,
imamo potpuni opis normalne distribucije podataka.
Normalna raspodjela podataka

parametri
Standardna devijacija SD ili σ
• U Excelu, standardna
devijacija lako se računa
pomoću funkcije (fx) npr.
=STDEV (A2:A12)
Važno za testiranje hipoteze
Dva komplementarna ključna segmenta inferencijske statistike
neophodna za testiranje hipoteze:
1. Interval pouzdanosti
2. Nivo značajnosti (engl. significance level, α ili alpha).
Testiranje hipoteze
• P vrijednost (eng. probability - vjerojatnost)
• Govori o tome kolika je vjerovatnost da je rezultat tačan ili
da nije tačan.
• Manja od 0,05 – govori o tome da je vjerovatnost
slučajnog i netačnog rezultata manja od 5%.
• Manja od 0,01 govori o tome da je vjerovatnost slučajnog i
netačnog rezultata manja od 1%.
Tumačenje P-vrijednosti
• P-vrijednost je vjerovatnost da su uočene razlike između skupina
slučajne (beznačajne)

• P=0.1=10% vjerovatnosti (1 događaj u 10)


• P=0.99=99% vjerovatnosti(99 događaja u 100)
• P=0.001=0.1% vjerovatnosti(1 događaj u 1000)
Važno za testiranje hipoteze
• Nivo značajnosti može se definirati kao vjerovatnost odluke o
odbijanju nulte hipoteze.
• Nivo pouzdanosti pokazuje sa kolikom vjerojatnošću možemo
tvrditi da određena izmjerena vrijednost i način distrubucije
podataka zaista dobro predstavlja populaciju.
• Najčešće korišteni nivo značajnosti od 5%, 1% i 0,1%, što
empirijski odgovara nivou pouzdanosti od 95%, 99% i 99,9%.
Primjer za testiranje hipoteze – Test
95% CI razlike aritmetičkih sredina između
grupa u uzorku
Grupa A Grupa B

Izračunavanje
1. Glavni učinak (razlika u ishodu!)
2. Varijabilnost glavnog učinka

Postavljanje nulte hipoteze


(glavni učinak je 0)
Izračunavanje
95% CI oko glavnog učinka

Izračunavanje
P-vrijednosti

Izvor: American College of Physicians – American Society of Internal Medicine: Effective Clinical Practice
Odnos između P vrijednosti i 95% CI

Ako 95% CI uključuje 0


tj. nepostojanje razlike
između skupina, tada je
P>0.05.

Ako 95% CI NE uključuje


0 tj. ima razlike između
skupina tada je P<0.05. 0
Nema razlike
između
skupina
Kada razlike nisu statistički značajne ?
• Kada je p>0,01 NE POSTOJI STATISTIČKA ZNAČAJNOST
između pojedinih varijabli.
• Znači : u 99 % slučajeva statistička značajnost ne postoji a
u 1% slučajeva ima statističke značajnosti, čime se stiču
argumenti da se Nulta hipoteza (HO) prihvata.
• Kada je p>0,01 Nulta hipoteza (HO) se prihvata.
Kada razlike nisu statistički značajne?
• Kada je p>0,05 NE POSTOJI STATISTIČKA ZNAČAJNOST
između pojedinih varijabli.
• Znači : u 95 % slučajeva statistička značajnost ne postoji a
u 5% slučajeva ima statističke značajnosti, čime se stiču
argumenti da se Nulta hipoteza (HO) prihvata.
• Kada je p>0,05 Nulta hipoteza (HO) se prihvata.
Kada razlike jesu statistički značajne ?
• Pomoću vrijednosti Hi-kvadrat test i iznosa p određuje se
da li statistički značajno postoji veza ili relacija između
pojedinih varijabli.
• Kada je p<0,05 POSTOJI STATISTIČKA ZNAČAJNOST između
pojedinih varijabli.
• Znači : u 95 % slučajeva statistička značajnost postoji a u
5% slučajeva nema statističke značajnosti, čime se stiču
argumenti za odbacivanje nulte hipoteze (HO).
• Kada je p<0,05 Nulta hipoteza se odbacuje.
Kada razlike jesu statistički značajne ?
• Pomoću vrijednosti Hi-kvadrat test i iznosa p određuje se
da li statistički značajno postoji veza ili relacija između
pojedinih varijabli.
• Kada je p<0,01 POSTOJI STATISTIČKA ZNAČAJNOST između
pojedinih varijabli.
• Znači : u 99 % slučajeva statistička značajnost postoji a u
1% slučajeva nema statističke značajnosti, čime se stiču
argumenti za odbacivanje nulte hipoteze (HO).
• Kada je p<0,01 Nulta hipoteza se odbacuje.
Tumačenje P-vrijednosti (0.01)

P>=0.01 P<0.01 tj. 1%


Razlike između skupina su Razlike između skupina su
slučajne (beznačajne). značajne.
Nulta hipoteza se prihvata. Nulta hipoteza se odbacuje.
Tumačenje P-vrijednosti (0.05)

P>=0.05 P<0.05 tj. 5%


Razlike između skupina su
slučajne (beznačajne). Razlike između skupina su značajne.

Nulta hipoteza se prihvata. Nulta hipoteza se odbacuje.


Greške pri zaključivanju

Greške tipa 1 (lažni pozitivi) Greške tipa 2 (lažni negativi)


• Nulta hipoteza je pogrešno • Nulta hipoteza je pogrešno
odbačena (iako stvarna razlika prihvaćena (iako stvarna razlika
ne postoji). postoji)
• Npr. puštanje neučinkovitog • Npr. Nedostupnost učinkovitog
lijeka za pacijente
lijeka na tržište
• Statistički je utvrđeno da je lijek
A učinkovitiji od placeba iako u • Statistički je utvrđeno da lijek A nije
stvarnosti između njih nema učinkovitiji od placeba iako je u
stvarnosti lijek A značajno
razlike!
učinkovitiji!

You might also like