You are on page 1of 32

NEPARAMETARSKI TESTOVI

Procedure za testiranje hipoteze

Testiranje
Testiranje hipoteze
hipoteze
-- testovi
testovi --

Parametarski
Parametarski Neparametarski
Neparametarski

z-test
z-test t-test
t-test F-test
F-test ANOVA
ANOVA

Mann-
Mann- Kruskal-
Kruskal-
Whitney
Whitney test
test Wallis-ov
Wallis-ov
test
test
Razlike između parametarskih i neparametarskih testova

Parametarski: Neparametarski:

f(x) normalna raspodela f(x) asimetrična raspodela

x x
Xsr Me Xsr
Normalna raspodela: Asimetrična raspodela:
• podaci su grupisani oko Xsr • podaci nisu grupisani oko Xsr
• rasipanje podataka je malo (mala Sd) • rasipanje podataka je veliko (velika Sd)
• najbolja mera centralne tendencije je Me

Parametarski testovi: Neparametarski testovi:


testira se značajnost parametara populacije: Ne vrši se poređenje vrednosti podataka u
grupama, već se porede njihovi redni brojevi
1. srednja vrednost – t-test (položaj u skupu).
2. st. devijacija (varijansa) – F test
Testira se značajnost medijana:
1. dve grupe podataka – Mann-Whitney test
2. više od dve grupe – Kruskal-Wallis test
1. Mann-Whitney U test (neparametarski t-test)
 Primer

Prikazani su rezultati ispitivanja rastvorljivosti tableta (dissolution test) na dve


različite aparature. Aparaturom A je testirano 11, a aparaturom B 12
pojedinačnih tableta, a za svaku tabletu je određena količina leka rastvorena u
toku 30 minuta. Cilj eksperimenta je bio da se uporedi da li se razlikuje
efikasnost aparatura.

Aparatura A: 53 61 57 50 63 62 54 52 59 57 64
Aparatura B: 58 55 67 62 55 64 66 59 68 57 69 56

Hipoteze:
Ho: Dve populacije su jednake
HA: Dve populacije nisu jednake
1.Uređivanje podataka po veličini (rangiranje)
Važno!!!
Grupa koja ima manji broj podataka se obeležava sa 1,
a grupa sa većim brojem podataka sa 2!
redni broj redni broj
Aparatura A Aparatura B
(R2) (R1)

53 3 58 11
61 14 55 5 5,5
57 8 9 67 21
50 1 62 15 15,5
63 17 55 5 5,5
62 15 15,5 64 18 18,5
54 4 66 20
52 2 59 12 12,5
59 12 12,5 68 22
57 8 9 57 8 9
64 18 18,5 69 23
56 7
ukupno: ∑R1=105,5 ∑R2=170,5
2. Izračunavanje U vrednosti

N1 = 11
N2 = 12 N 1 ( N 1  1)
U  N1 N 2    R1
∑ R1 = 105,5 2
∑ R2 = 170,5

Manja od izračunatih U vrednosti


se poredi sa tabelarnom
U   N1 N 2  U vrednošću U za α=0,05 i
odgovarajući broj podataka.
N2

Uizračunato = 39,5
N1 = 11
N2 = 12

Utabelarno =?
N1
33

U tabelarno = 33
U izračunato = 39,5 U tabelarno = 33

U izračunato >U tabelarno → Ho se prihvata → HA: Dve populacije su jednake

Važno!!!

U izračunato < U tabelarno → Ho se odbacuje


U izračunato > U tabelarno → Ho se prihvata

Zaključak:
Ne postoji statistički značajna razlika u količini leka rastvorenog
aparaturom A i aparaturom B.
Neparametarska korelacija
(Spearman-ova neparametarska korelacija)

 Primer

Kod 12 studenata je proučavana zavisnost između broja sati nedeljno


provedenih u učenju za vreme ispitnog roka i srednje ocene dobijene u
istom roku. Pokazati da li između dobijenih vrednosti postoji korelacija.

sati: 24 17 20 41 52 23 48 17 15 29 25 30
ocena: 9,6 6,0 6,7 9,6 9,7 9,1 9,8 6,5 6,3 9,3 8,4 9,0
10

srednja ocena
Hipoteze:
8
Ho: x i y su nezavisni
HA: x i y su u korelaciji 7

5
10 15 20 25 30 35 40 45 50 55

broj sati provedenih u učenju


1. Uređivanje podataka po veličini (rangiranje)

sati redni broj srednja redni broj d d2


učenja (R1) ocena (R2) (R1 – R2) (R1 – R2)2
24 6 9,6 9,5 -3,5 12,25
17 2,5 6,0 1 1,5 2,25
20 4 6,7 4 0 0
41 10 9,6 9,5 0,5 0,25
52 12 9,7 11 1 1
23 5 9,1 7 -2 4
48 11 9,8 12 -1 1
17 2,5 6,5 3 -0,5 0,25
15 1 6,3 2 -1 1
29 8 9,3 8 0 0
25 7 8,4 5 2 4
30 9 9,0 6 3 9

∑ d2 = 35
promenljive se rangiraju
pojedinačno!!!
2. Izračunavanje Spearman-ovog koeficijenta
korelacije – ρ (Rho)

N = 12
N – broj parova vrednosti za x i y 6 d 2
  1
N ( N 2  1)
∑ d2 = 35

6  35 210
  1  1  0,878
12(144  1) 1716
Da bismo mogli da donesemo zaključak o prihvatanju ili odbacivanju
H0, izračunato ρ upoređujemo sa kritičnom vrednošću ρ za određeni
broj stepeni slobode φ i zadati nivo značajnosti (α = 0,05).

φ= N
N – broj parova vrednosti za x i y

ρ = 0,878
φ = N = 12 0,580

ρ tabelarno =?

ρ tabelarno = 0,580
ρ izračunato = 0,878 ρ tabelarno = 0,580

ρ izračunato >ρ tabelarno → Ho se odbacuje → HA: x i y su u korelaciji

Zaključak:
Postoji korelacija (pozitivna) između broja sati provedenih u učenju
i srednje ocene u ispitnom roku.

ρ = + 0,878 → predznak u koeficijentu korelacije nam govori da je


korelacija pozitivna
Hi-kvadrat test
Podaci
Podaci

Numerički
Numerički Kategorički
Kategorički
(kvantitativni)
(kvantitativni) (kvalitativni)
(kvalitativni)

Diskretni
Diskretni Kontinuirani
Kontinuirani
χ2 (hi-kvadrat, engl. Chi-square) test
 Analiziraju se kategorički podaci
 Upoređuju se dobijene sa očekivanim frekvencijama
 Što su dobijene frekvencije bliže očekivanim, to je veća verovatnoća da
je H0 ispravna

 Statistička veličina χ2 izračunava se prema izrazu:

2  fd  fo  2
χ  fd – dobijena frekvencija
fo fo – očekivana frekvencija

 Primena:
1. test slaganja
2. test nezavisnosti
3. test homogenosti
Uslovi za χ2 test
1. Frekvencije moraju biti apsolutne i nezavisne

2. Zbir dobijenih je jednak zbiru očekivanih frekvencija ∑f d=∑fo

3. Ne može da se primenjuje kada je n<20

4. Nijedna pojedinačna frekvencija ne sme biti manja od 5

5. Kod tabela kontingencije 2x2, kada je n>40, sve očekivane frekvencije


moraju biti ≥1, a kada je 20<n< 40, sve očekivane frekvencije moraju
biti ≥5

6. Kod tabela kontingencije većih od 2x2, nijedna očekivana frekvencija ne


sme biti manja od 1 i ne sme biti više od 20% očekivanih frekvencija
manjih od 5. Da bi bio ispunjen ovaj uslov srodne kategorije mogu da se
sažimaju
1. Test slaganja
Primena

Primenjuje se kada treba proveriti da li se raspodela dobijenih frekvencija


slaže sa unapred određenom raspodelom očekivanih frekvencija u jednom
uzorku, npr. ispitivanje da li je dobijena raspodela podataka normalna u
cilju pravilnog odabira tipa testa koji će biti korišćen za analizu podataka

- raspodela je normalna → parametarski testovi


- raspodela nije normalna → neparametarski testovi

 Dobijeni
podaci se organizuju se u klasne intervale
- dobijena frekvencija = odgovarajuća frekvencija određenog KI
- očekivana frekvencija = izračunata frekvencija za određeni KI kada
je raspodela normalna

 Testira se razlika između dobijenih i očekivanih frekvencija


Primer:
Kod 120 studenata merena je koncentracija triglicerida. Dobijeni podaci su
uređeni u klasne intervale i prikazani kao raspodela frekvencija, a zatim su
iz izračunate srednje vrednosti i standardne devijacije, izračunate i
očekivane frekvencije za normalnu raspodelu. Istraživač želi da utvrdi da li
su vrednosti triglicerida normalno distribuirane.

KI = 0,3
fdobijene fočekivane
mmol/L
0,8 – 1,1 4 1
1,2 – 1,5 2 6
1,6 - 1,9 24 20
2,0 – 2,3 40 37
2,4 – 2,7 30 34
2,8 – 3,1 14 17
3,2 – 3,5 6 4
3,6 – 3,9 0 1
Hipoteze:
H0: Podaci slede normalnu raspodelu
HA: Podaci ne slede normalnu raspodelu

KI = 0,3
fd fo (fd – fo)2 / fo
mmol/L
0,8 – 1,1 4 1 9

1,2 – 1,5 2 6 2,67

1,6 - 1,9 24 20 0,8

2,0 – 2,3 40 37 0,24

2,4 – 2,7 30 34 0,47

2,8 – 3,1 14 17 0,53

3,2 – 3,5 6 4 1

3,6 – 3,9 0 1 1

ukupno 120 15,71

2 ( fd  fo )2
   15,71
fo
Da bismo mogli da donesemo zaključak o prihvatanju ili odbacivanju H 0, χ2izračunato
upoređujemo sa kritičnom vrednošću χ2 koja se očitava iz tabele za χ2 -raspodelu
(χ2 tabelarno) za određeni broj stepeni slobode (φ) i zadati nivo značajnosti (α).

φ=r–1
r – broj redova, tj. klasnih intervala

U našem primeru:
χ2 izračunato = 15,71
φ=8–1=7 14,067
α = 0,05
χ2 tabelarno = ?

χ2tabelarno = 14,067
χ2 izračunato = 15,71 χ2 tabelarno = 14,067

χ2 izračunato > χ2tabelarno → Ho se odbacuje → HA: Podaci ne slede normalnu raspodelu

Zaključak:
Vrednosti triglicerida nisu normalno distribuirane.
2. χ2 test homogenosti proporcija
Primena

Testiranje homogenosti grupa


Ispitanici su unapred razvrstani prema jednom kriterijumu,
a porede se u odnosu na drugi kriterijum klasifikacije
Pod kontrolom je samo veličina svakog uzorka i ukupan broj
podataka, a broj podataka prema drugom kriterijumu ne zavisi
od istraživača !!!

Hipoteze
H0: p1 = p2 = p3 = … = pn
HA: Najmanje jedna proporcija se razlikuje od drugih
Primer:

Kod 250 muškaraca i 450 žena na terapiji statinima praćen je efekat leka. Pre
terapije i posle određenog vremena primene terapije određena je
koncentracija LDL-holesterola, a na osnovu promene u koncentraciji LDL-
holesterola ispitanici su podeljeni u tri kategorije: bez poboljšanja, delimično
poboljšanje i izraženo poboljšanje. Dobijeni su sledeći rezultati:

Muškarci: Žene:
bez poboljšanja – 54 bez poboljšanja – 87
delimično poboljšanje – 76 delimično poboljšanje – 178
izraženo poboljšanje - 120 izraženo poboljšanje - 185

Istraživač želi da ispita da li je efekat leka zastupljen u istoj proporciji u grupi


muškaraca i u grupi žena.

Hipoteze
Ho: različite kategorije efekta leka su zastupljene u istoj proporciji kod muškaraca i žena
HA: proporcija najmanje jedne kategorije efekta leka se razlikuje kod muškaraca i žena
kriterijum po kome su
ispitanici UNAPRED
razvrstani

pol

grupa m ž ukupno

bez
54 87 141
poboljšanja
kriterijum
po kome
delimično
se ispitanici poboljšanje
76 178 254
UPOREĐUJU
izraženo
120 185 305
poboljšanje

ukupno 250 450 700


Izračunavanje očekivanih frekvencija

Primeri:
Raspodela dobijenih i očekivanih frekvencija

muškarci žene
grupe
fd fo fd fo

bez
54 50,36 87 90,64
poboljšanja

delimično
76 90,71 178 163,29
poboljšanje

izraženo
120 108,93 185 196,07
poboljšanje

ukupno 250 250 450 450


Izračunavanje χ 2

rizik, pol fd fo (fd-fo)2/fo

bez poboljšanja, m 54 50,36 0,263

delimično poboljšanje, m 76 90,71 2,385

izraženo poboljšanje, m 120 108,93 1,125

bez poboljšanja, ž 87 90,64 0,146

delimično poboljšanje, ž 178 163,29 1,325

izraženo poboljšanje, ž 185 196,07 0,625

ukupno 700 700 5,869


Da bismo mogli da donesemo zaključak o prihvatanju ili odbacivanju H 0,
χ2izračunato upoređujemo sa kritičnom vrednošću χ2 koja se očitava iz tabele za χ2
-raspodelu (χ2 tabelarno) za određeni broj stepeni slobode (φ) i zadati nivo
značajnosti (α).

φ = (k-1) x (r-1)
k – broj kolona
r – broj redova 5,991

U našem primeru:
χ2 izračunato = 5,869
φ = (2-1) x (3-1) = 2
α = 0,05
χ2 tabelarno = ?

χ2 tabelarno = 5,991
χ2 = 5,869 χ2 tabelarno = 5,991
izračunato

χ2 izračunato < χ2 tabelarno → Ho se prihvata

Zaključak:
Nema razlike u zastupljenosti pojedinih kategorija efekta leka između
muškaraca i žena.
3. Test nezavisnosti
 Primer
 Kod 700 pacijenata na terapiji statinima praćen je efekat leka. Ispitanici su
nakon toga podeljeni prema polu - uzorak je imao 250 muškaraca i 450
žena. Pre terapije i posle određenog vremena primene terapije određena je
koncentracija LDL-holesterola, a na osnovu promene u koncentraciji LDL-
holesterola ispitanici su podeljeni u tri kategorije: bez poboljšanja,
delimično poboljšanje i izraženo poboljšanje. Dobijeni su sledeći rezultati:

Muškarci: Žene:
bez poboljšanja – 54 bez poboljšanja – 87
delimično poboljšanje – 76 delimično poboljšanje – 178
izraženo poboljšanje - 120 izraženo poboljšanje - 185

Istraživač želi da ispita da li je efekat leka povezan sa polom.

Hipoteze
Ho: Efekat leka i pol su nezavisni.
HA: Efekat leka i pol nisu nezavisni (Efekat leka zavisi od pola).
χ2 = 5,869 χ2 tabelarno = 5,991
izračunato

χ2 izračunato < χ2 tabelarno → Ho se prihvata

Zaključak:
Efekat leka je nezavisan u odnosu na pol (Lek jednako
deluje kod muškaraca i kod žena).

You might also like