You are on page 1of 10

Neparametarske metode

Do sada prikazane metode za uporeivanje dve ili vie grupa podataka zasnivaju se na
pretpostavci da su podaci normalno raspodeljeni. Ove metode se uvek zasnivaju na teoriji
verovatnoe i uvek se u njima pojavljuje potreba za ocenjivanjem pojedinih parametara
(srednje vrednosti, standardne devijacije ili varijanse). Zato se ove metode oznaavaju kao
parametarske. Meutim, kada ne moe da se sa sigurnou utvrdi da je raspodela jedne grupe
podataka normalna, izraunavanje pojedinih parametara i primena para metarskih metoda
daju vrlo nepouzdane zakljuke. U tim sluajevima se primenjuju neparametarske metode,
koje se ne zasnivaju na pretpostavci da postoji bilo koja verovatnoa raspodele.
Neparametarskim metodama mogu da se porede kako dve, tako i vie grupa poda taka.
Ovde e biti objanjene metode koje se najee koriste.

Neparametarski t-test (Mann-Whitney U test)


Mann-Whitney U test je ekvivalentan parametarskom t-testu, jer se njime porede dve grupe
podataka, ali preko medijana. Nulta i alternativna hipoteza glase:
H0 : Me1 = Me2
HA : Me1 Me2
Princip poreenja grupa se sastoji u tome da se vrednosti u grupama urede po veliini, a
zatim obelee rednim brojevima posmatrajui obe grupe istovremeno. Ako se vrednosti u
grupama razlikuju, onda e se u jednoj grupi nalaziti vei, a u drugoj manji redni brojevi (jer
su u tom sluaju u jednoj grupi preteno vee, a u drugoj preteno manje vrednosti), pa se i
zbirovi rednih brojeva razlikuju. Suprotno ovome, ako se vrednosti u dve grupe ne razlikuju,
onda su redni brojevi ravnomerno rasporeeni, pa se u obe grupe nalaze i vei i manji redni
brojevi, odnosno sume rednih brojeva su priblino jednake. Iz ovoga se vidi da sami podaci u
grupama ne slue za poreenje, ve se dalje operie sa njihovim rednim brojevima, tanije
reeno sa sumama rednih brojeva u pojedinim grupama.
Izrazi kojima se uporeuju sume rednih brojeva zavise od broja podataka u grupama. Ovaj
test moe da se koristi i kada grupe sadre vrlo mali broj podataka (manje od 9), ali su
zakljuci koji se tom prilikom dobijaju nepouzdani, jer su izvedeni iz malog broja podataka.
Ovde e biti objanjena dva naina primene U-testa:
a) kada je N1 20 i 9 N2 20 (sa N1 se obeleava grupa sa manjim brojem, a sa N2 grupa
sa veim brojem podataka) i
b) kada je N1 9 i N2 20.

Mann-Whitney U-test za N1 20 i 9 N2 20
Izraz za izraunavanje U glasi:

U = N1N 2 +
odnosno

N1 (N1 + 1)

R1

Statistika u farmaciji

U = N1N 2 +

N 2 (N 2 + 1)

R2

gde je
R1 - suma rednih brojeva u grupi iji je ukupan broj podataka N1, a
R2 - suma rednih brojeva u grupi iji je ukupan broj podataka N2.
Odnos izmeu ove dve vrednosti je sledei:
U = N1N2 - U'
Ovaj izraz slui i za jednostavnije izraunavanje, tako da je umesto izraunavanja obe
vrednosti U i U' prema gore navedenim izrazima, dovoljno da se izrauna samo jedna, a druga
se izrauna iz navedenog odnosa.
Manja od dobijenih vrednosti U uporeuje se sa kritinom vrednou U iz tabele za eljeni
nivo verovatnoe i odgovarajui broj podataka i ako je manja od kritine vrednosti razlika
izmeu dve grupe je statistiki znaajna. Statistiki znaajna razlika pokazuje da posmatrane
grupe ne pripadaju istoj populaciji.
PRIMER 1.: Kod dve grupe dece razliite starosti sa dijagnozom astma, odreena je
vrednost IgE (rezultati su dati u IJ/ml). Pokazati da li ima znaajne razlike u sadraju IgE kod
dece do 5 godina (grupa 1) i dece od 6 do 10 godina (grupa 2). U grupi 1 broj poda taka je N1 =
11, a u grupi 2 N2 = 13.
grupa 1

r.br.(R1)

grupa 2

r.br.(R2)

192

55

230

202

250

5.5

290

250

5.5

305

300

310

10

450

13

334

11

720

18

446

12

930

19

452

14

1100

21

510

15

1165

22

584

16

1850

24

710

17

1000

20

1200

23

ukupno

R1=142

R2=158

Reenje: Rangiranje, odnosno obeleavanje vrednosti rednim brojevima izvodi se


posmatranjem obe grupe istovremeno. Najnia vrednost u obe grupe je 55 i ona dobija redni
broj 1, sledea je 192 i ona ima redni broj 2 itd. Vrednost 250 se pojavljuje dva puta i ona e u
oba sluaja imati redni broj 5,5, koji predstavlja srednju vrednost izmeu rednih brojeva 5 i 6.
U sluajevima kada se neke vrednosti pojavljuju vie puta, njihov redni broj se odreuje kao
srednja vrednost rednih brojeva koje one zauzimaju. U naem primeru vrednost 250 se
pojavila dva puta i zauzela redna mesta 5 i 6, tako da sledea vrednost po veliini, 290 nosi
redni broj 7. Numerisanje se tako izvodi do poslednje najvee vrednosti i ako nije napravljena
greka poslednja, najvea vrednost imae redni broj koji je jednak zbiru podataka u obe grupe
(u naem primeru je to 24).

S. Spasi: Predavanja 200/2010.

U = 11 13 +

11(11 + 1)
142 = 143 + 66 142 = 67
2

U' = 11 13 67 = 76
Kritina vrednost U za verovatnou p = 0,05 i broj podataka N1 = 11 i N2 = 13 iznosi 37, a
kako je izraunata vrednost U = 67, odnosno vea od kritine, znai da razlika izmeu ove dve
grupe dece nije statistiki znaajna.

Mann-Whitney U-test za N1 9 i N2 20
Kada se broj podataka u grupama poveava, raspodela vrednosti U se vrlo brzo pribliava
normalnoj raspodeli, tako da se znaajnost izraunate vrednosti U moe da oceni uz pomo
izraza:
NN
U 1 2
2
z=
N1 N 2 (N1 + N 2 + 1)
12
Vrednost z ima normalnu raspodelu sa srednjom vrednou nula i standardnom
devijacijom jedan, a znaajnost izraunate vrednosti z se uporeuje sa vrednostima iz tabele
normalne raspodele za eljeni nivo znaajnosti. Za verovatnou p = 0,05 kritina vrednost z iz
tabele za normalnu raspodelu iznosi 1,96, to znai da je razlika izmeu dve grupe statistiki
znaajna ako je izraunata vrednost z vea od ove.
Vrednost U se izraunava prema ranije navedenim izrazima, a u izraz za z moe da se
uvrsti i U i U'. Od toga da li e se uvrstiti U ili U' u izraz za z zavisi samo znak dobijenog
rezultata, ali ne i njegova apsolutna vrednost.
PRIMER 2.: Pokazati da li se znaajno razlikuju vrednosti ALT kod pacijenata sa cirozom
jetre (N1 = 19) i kod pacijenata sa hroninim hepatitom (N2 = 21).

ciroza:
hepatit:

410

300

200

180

150

95

110

120

130

18

20

25

30

28

32

48

74

84

95

790

720

520

420

435

450

470

390

38

45

75

380

340

310

200

190

180

50

48

76

95

Statistika u farmaciji

grupa 1
(ciroza)

r. br. (R2)

grupa 2
(hepatit)

r. br. (R1)

18

38

20

45

25

48

9.5

28

50

11

30

75

13

32

76

14

48

9.5

95

17

74

12

180

23.5

84

15

190

25

95

17

200

26.5

95

17

310

29

110

19

340

30

120

20

380

31

130

21

390

32

150

22

420

34

180

23.5

435

35

200

26.5

450

36

300

28

470

37

410

33

520

38

720

39

790

40

R1=284,5

R2=535,5

Reenje: Najnia vrednost u skupu je 18 i ona nosi redni broj 1, sledea je 20 sa rednim
brojem 2 i tako sve do vrednosti 48 koja se pojavljuje dva puta. Do vrednosti 48 zauzeto je 8
mesta, odnosno 8 rednih brojeva, tako da se vrednosti 48 rasporeuju na mesta 9 i 10 i nose
redni broj 9,5. Sledea vrednost je 50 sa rednim brojem 11 (9 i 10 su ve iskorieni) i skup se
dalje rangira do vrednosti 95 koja se pojavljuje tri puta (dva puta u grupi 1 i jedanput u grupi
2). Do vrednosti 95 rangirano je 15 vrednosti, tako da tri vrednosti 95 treba da zauzmu redna
mesta 16, 17 i 18. Njih emo obeleiti srednjom vrednou ova tri redna broja, a to je 17.
Sledea vrednost u skupu je 110 i ona nosi redni broj 19 (jer su 16, 17 i 18 iskorieni).
Rangiranje vrednosti u skupu nastavljamo do poslednje, najvee vrednosti 790 koja ima redni
broj 40, to odgovara
zbiru
19(19 +
1) podataka u obe grupe.
U = 19 21 +
284,5 = 399 + 190 284,5 = 304,5
2
19 21
304,5
304,5 199,5
105
2
z=
=
=
= 2,844
36
,922
19 21(19 + 21 + 1)
1363,25

12
Ako se u izraz za z uvrsti U' dobie se rezultat sa istom apsolutnom vrednou, ali
suprotnog znaka, to ne utie na tumaenje znaajnosti razlike.

S. Spasi: Predavanja 200/2010.

21(21 + 1)
535,5 = 399 + 231 535,5 = 94,5
2
19 21
94,5
94,5 199,5
105
2
=
=
= 2,844
36
,922
19 21(19 + 21 + 1)
1383,5
12

U' = 19 21 +

z=

Izraunata vrednost z je vea od kritine vrednosti 1,96, koja se dobija iz tabele normalne
raspodele za verovatnou p = 0,05, to govori da je razlika izmeu ove dve grupe statistiki
znaajna.
Prednost Mann-Whitney U testa u odnosu na Student t-test je u tome to na krajnji rezultat
ne utie rasipanje rezultata unutar grupe, to smo imali u ovom sluaju. Obe posmatrane
grupe imaju veliku standardnu devijaciju jer je razlika izmeu najnie i najvie vrednosti
velika, to bi se odrazilo na vrednost t, koja bi zbog toga bila manja od kritine vrednosti za
odgovarajui broj stepena slobode.

Zadaci za vebanje
1. Kod 15 mukaraca i 10 ena odreena je koncentracija apo A. Pokazati da li postoji
znaajna razlika u koncentraciji ovog proteina u odnosu na pol.
mukarci:
2,04

2,69

2,32

1,90

2,30

1,40

2,20

1,95

2,30

2,50

1,41

1,76

1,90

2,60

2,50

2,40

2,30

1,65

2,20

2,62

2,41

3,00

1,51

ene:
1,82

1,46

2. Kod 16 zdravih osoba i kod 15 osoba koje su bile u akutnom napadu infarkta miokarda
odreena je koncentracija arahidonske kiseline metodom tene hromatografije. Pokazati da li
izmeu dobijenih vrednosti postoji znaajna razlika, uzimajui u obzir nivo verovatnoe 0,05
(rezultati su izraeni u mol/L).
kontrolna grupa:
1,8

1,7

3,7

2,1

3,4

6,8

2,0

1,6

2,9

1,8

1,0

4,9

5,2

2,8

13,7

3,2

2,9

2,8

3,4

8,1

6,0

3,0

pacijenti u akutnom napadu infarkta miokarda:


12,4

2,1

1,4

2,2

8,7

7,4

5,2

4,9

2,5

3. Koncentracija beta-2-MG u serumu (mg/L) odreena je kod grupe zdravih osoba, kao i kod
osoba koje su izloene uticaju olova. Pokazati da li ima znaajne razlike u koncentraciji ovog
proteina kod ispitivanih grupa.
zdrave osobe:
1,27

1,9

1,37

1,2

2,02

2,04

1,2

1,25

1,30

1,27

1,2

2,08

1,24

Statistika u farmaciji

6
1,25

1,4

1,35

1,2

1,61

1,8

1,92

1,77

1,64

1,17

2,1

pacijenti eksponirani olovu


2,36

1,45

1,17

2,3

1,45

2,45

2,42

2,86

3,64

1,66

1,61

1,30

2,30

2,43

1,7

1,20

2,4

1,72

1,61

1,35

1,51

1,50

1,56

2,55

2,38

1,46

4. Kod akutnog virusnog hepatita odreena je koncentracija T4 (nmol/L) u akutnoj fazi bolesti i
potom u fazi oporavka. Pokazati da li je razlika izmeu ove dve grupe znaajna.
akutna faza:
193

135

148

160

167

193

184

181

156

123

175

172

163

147

125

112

175

149

167

82

135

139

84

141

141

206

141

141

112

46

faza oporavka:
139

136

136

135

96

87

116

144

84

111

111

145

130

112

123

111

96

154

162

84

122

129

116

116

5. Kod 26 mukaraca i 24 ene odreena je koncentracija apo B. Pokazati da li postoji


znaajna razlika u koncentraciji ovog proteina u odnosu na pol.
mukarci:
1,58

1,30

1,84

1,23

1,60

1,53

1,60

1,29

1,50

1,36

1,50

1,80

1,40

1,60

1,13

1,35

1,35

1,70

1,75

1,13

1,60

1,40

1,20

1,13

1,18

1,48

1,29

1,32

1,40

1,65

1,23

1,45

1,80

1,22

1,76

1,57

1,20

1,55

1,09

1,60

1,30

1,27

0,86

1,37

1,40

1,60

1,60

1,08

1,15

1,20

ene:

S. Spasi: Predavanja 200/2010.

Neparametarska korelacija
Postoji vie naina za izraavanje neparametarske korelacije, ali se najee primenjuje
Spearman-ova korelacija, posebno zbog toga to je jednostavna za izraunavanje. Kao i drugi
neparametarski testovi i Spearman-ova korelacija zasnovana je na rangiranju podataka u
ispitivanim grupama x i y. Nulta hipoteza koja se postavlja glasi:
H0: x i y su nezavisni
a alternativna hipoteza
HA: x i y su u pozitivnoj/negativnoj korelaciji.
Mera za korelaciju izraunatu ovom metodom je Spearman-ov koeficijent korelacije koji se
obeleava sa koji se izraunava prema izrazu:

= 1-

6 d2
N ( N2 - 1 )

Postupak izraunavanja ide tako da se vrednosti u grupi x obelee rednim brojevima od 1


do N, a zatim se posebno rangiraju vrednosti u grupi y. N odgovara broju parova x, y
vrednosti. Za svaki x, y par vrednosti izrauna se razlika d izmeu njihovih rednih brojeva,
dobijena razlika se kvadrira i na kraju nae suma dobijenih kvadrata, koja se uvrsti u gornji
izraz
za je. 4 < N < 30 dobijena vrednost uporeuje se sa tablinom vrednou za za
Ako
izabranu verovatnou i broj parova vrednosti N. Nulta hipoteza se prihvata ako je izraunata
vrednost manja od tabline, to znai da su dve posmatrane grupe podataka nezavisne,
odnosno meu njima ne postoji korelacija. Ako je izraunato sa pozitivnim predznakom
korelacija je upravna (kako rastu vrednosti u jednoj, tako rastu i vrednosti u drugoj grupi), a
ako je sa negativnim predznakom korelacija je obrnuta.
Ako je broj parova vrednosti vei od 30 znaajnost izraunate vrednosti odreuje se
preko standardne jedinice z:

z =

N-1

Nulta hipoteza se prihvata, odnosno posmatrane grupe su nezavisne (meu njima nema
korelacije) ako je izraunata vrednost manja od vrednosti z koja se nalazi u tablici standardne
normalne raspodele za izabranu verovatnou (za verovatnou 0,05 iz tablice je z = 1,96, a za
verovatnou 0,01 je z = 2,32). Ako je izraunata vrednost z vea od tabline, nulta hipoteza se
odbacuje i zakljuak je da izmeu posmatranih grupa postoji korelacija.
Kada je N > 10 znaajnost vrednosti moe da se odredi i pomou izraza:

t =

N - 2
1 - 2

Izraunata vrednost t uporeuje se sa tablinom za eljenu verovatnou i broj stepena


slobode = N-2 i ako je izraunato t vee od tablinog zaklju_ak je da se nulta hipoteza
odbacuje, odnosno izmeu posmatranih grupa postoji korelacija.
PRIMER 1.: Kod 10 pacijenata sa dijagnozom epilepsije odreena je koncentracija veeg
broja individualnih proteina plazme. Pokazati da li postoji korelacija izmeu koncentracija
transferina i alfa-1-antitripsina (vrednosti su date u g/L).
2

transferin

r.br. x

alfa-1-AT

r.br. y

2,57

2,57

-1

2,24

2,39

2,23

2,96

-4

16

Statistika u farmaciji

2,73

3,11

-3

2,22

2,30

-1

2,77

2,55

2,78

2,16

36

2,91

2,97

2,02

2,06

2,96

10

3,52

10

0
2

d = 69

= 1-

6 x 69
= 0,582
10 ( 100 - 1 )

Tablina vrednost za verovatnou 0,05 i broj parova 10 je = 0,5515, kako je naa


izraunata vrednost neto vea od ove zakljuak je da se nulta hipoteza odbacuje, odnosno
izmeu posmatranih grupa ima znaajne korelacije. Meutim ovaj zakljuak je na granici
znaajnosti i poeljno je da se proveri ako se = 0,582 uvrsti u izraz za t:

10 - 2
= 2,024
1 - 0,3387

t = 0,582

Tabli na vrednost t za verovatno u 0,05 i = 8 je 2,306, odnosno vea je od izraunate


vrednosti t, to znai da se nulta hipoteza prihvata i zakljuak je da su posmatrane grupe
nezavisne, odnosno meu njima nema korelacije. Ovaj zaklju ak je suprotan prethodnom, to
se deava kada je na granici znaajnosti, kao u ovom slu aju. Kada doemo u ovakvu
situaciju najbolje je ponoviti eksperimentalni postupak,
Kod Spearman-ovog testa neparametarske korelacije problem mogu da predstavljaju
vrednosti koje se ponavljaju i zbog toga nose iste redne brojeve. U takvim slu ajevima tabela
kriti nih vrednosti sa kojima se upore uju izra unate vrednosti nije odgovaraju a i
potrebno izvriti korekciju izraunate vrednosti . Pravilo je da se ovakva korekcija izvodi
samo ako je broj vrednosti koje se ponavljaju veliki, ali nekad i sa jednom ili dve vrednosti
koje se ponavljaju korigovano daje druga_iji zaklju ak. Korekcioni faktor za vrednosti koje
se ponavljaju
je
t3 - t
T=
12
gde je t broj vrednosti koje se ponavljaju za jedan isti redni broj. Kada se koristi
korekcioni faktor se izraunava prema izrazu:

x2 + y 2 - d2
x2 y2

U ovoj jedna ini su:


3

x2 = N

- N
- Tx
12

gde je Tx suma vrednosti T za razli ite redne brojeve koji se ponavljaju u x i


3

y2 = N

- N
- Ty
12

gde je Ty suma vrednosti T za razli ite redne brojeve koji se ponavljaju u y.


PRIMER 2.: Kod 15 pacijenata sa epilepsijom koji su due od 2 godine dobijali fenitoin
odreena je koncentracija prealbumina (PA, vrednosti su date u g/L). Pokazati da li postoji

S. Spasi: Predavanja 200/2010.

korelacija izme u koncentracije proteina i koncentracije leka u krvi (PHT, vrednosti su date u
mol/L).
Redni brojevi za svaku grupu i njihove razlike prikazane su u tabeli, a ako se d2 = 871,5
uvrsti u izraz za dobi e se:

= 1-

6 x 871,5
= 1 - 1,556 = - 0,556
15 ( 225 - 1 )

Tabli na vrednost za verovatno u 0,05 i N = 15 iznosi = 0,4429, a kako je izraunata


vrednost vea od ove zakljuak je da nulta hipoteza odbacuje, odnosno me u posmatranim
grupama postoji korelacija. Zbog negativnog predznaka u izraunatoj vrednosti korelacija je
obrnuta, odnosno kako raste koncentracija leka, tako se smanjuje koncentracija proteina.
Uo ava se da u ovom primeru ima vrednosti koje se ponavljaju, tako da moe da se
primeni korekcioni faktor T. U grupi x vrednosti imamo sledee grupe rednih brojeva koji se
ponavljaju: 1,5; 4; 6,5; 11,5 i 14,5. Od ovih pet grupa etiri grupe se odnose na po dve
vrednosti koje se ponavljaju, a jedna (grupa sa rednim brojem 4) na tri vrednosti koje se
ponavljaju. Prema tome, prvo izraunavamo Tx za grupe vrednosti koje se ponavljaju dva puta

Tx =

3
2 - 2 = 6 = 0,5
12
12

i za grupe vrednosti koje se ponavljaju tri puta

Tx =

33 - 3 24
=
=2
12
12

Iz ovih izraunavanja dobijamo da je T x = 4 (0,5) + 2 = 4 , zato to imamo etiri grupe


vrednosti koje se ponavljaju dva puta i jednu grupu vrednosti koja se ponavlja jedanput. Iz
ovoga sledi da
je:
153 - 15
x2 =
- 4 = 276
12
2

PA

r.br. x

PHT

r.br. y

0,34

13,2

0,44

14,5

5,6

13,5

182,25

0,38

10

19,6

0,44

14,5

8,0

11,5

132,25

0,36

41,2

13

-4

16

0,29

1,5

35,2

12

-10,5

110,25

0,42

13

20,0

8,5

4,5

20,25

0,31

20,0

8,5

-4,5

20,25

0,31

10,4

0,40

11,5

6,8

9,5

90,25

0,29

1,5

32,6

10,5

-9

81

0,40

11,5

13,6

5,5

30,25

0,31

32,6

10,5

-6,5

42,25

0,32

6,5

47,6

14

-7,5

56,25

0,32

6,5

62,8

15

-8,5

72,25
2

d = 871,5

Statistika u farmaciji

10

U grupi y imamo dve grupe vrednosti koje se ponavljaju dva puta i imaju redne brojeve 7,5
i 10,5, pa izra unavamo samo Ty za njih:

Ty =

3
2 - 2 = 6 = 0,5
12
12

Iz ovoga sledi da je

y2 =

T y = 2 (0,5) = 1

, odnosno

153 - 15
- 1 = 279
12

Iz tabele imamo da je d2 = 871,5, pa je:

276 + 279 - 871,5


2

276 x 279

- 316,5
= - 0,570
554,992

Ovako izraunata vrednost je neto vea od one koja je izraunata bez korekcionog
faktora T, ali je zaklju ak isti.

Zadaci za vebanje
1. Kod 20 trudnica odre ivana je koncentracija c-reaktivnog proteina tokom cele trudno e.
Pokazati da li postoji korelacija izme u lunarnog meseca trudnoe i koncentracije proteina
(prikazana koncentracija predstavlja srednju vrednost za ispitivanu populaciju).
mesec

10

CRP

2,08

2,51

2,63

2,39

2,42

2,45

3,13

4,19

2,63

2. Kod 12 studenata je prouavana zavisnost izmeu broja sati nedeljno provedenih u u enju
za vreme ispitnog roka i srednje ocene dobijene u istom roku. Pokazati da li izme u dobijenih
vrednosti postoji korelacija.
sati

24

17

20

41

52

23

48

17

15

29

25

30

ocen
a

9,6

6,0

6,7

9,6

9,7

9,1

9,8

6,5

6,3

9,3

8,4

9,0

3. Kod 20 trud-nica odre ivana je koncentracija alfa-1-kiselog glikoproteina tokom cele


trudnoe. Pokazati da li postoji korelacija izme u meseca trudno e i koncentracije proteina
(prikazana koncentracija predstavlja srednju vrednost za ispitivanu populaciju).
mesec

10

A-1-KGP

0,74

0,65

0,61

0,56

0,52

0,54

0,59

0,74

0,54

4. Kod 20 trudnica odre ivana je koncentracija prealbumina tokom cele trudnoe. Pokazati da
li postoji korelacija izmeu meseca trudno e i koncentracije proteina (prikazana koncentracija
predstavlja srednju vrednost za ispitivanu populaciju).
mesec

10

PA

0,33

0,31

0,29

0,32

0,30

0,34

0,33

0,38

0,30

You might also like