You are on page 1of 46

STATISTIKA U FARMACIJI

Analiza varijanse - ANOVA

2008/2009

S. Spasi

Testovi za dve i vie populacija


dve i vie
populacija
srednja
vrednost

broj
uzoraka

varijansa

n
F test

z-test
t-test
2008/2009

ANOVA

S. Spasi

F-test za odnos dve varijanse

Parametarski test

Testira razliku izmedju dve nezavisne populacione


varijanse

Pretpostavka za test:
obe populacije su normalno distribuirane

2008/2009

S. Spasi

F-test - postavljanje hipoteze

Hipoteze
H 0: 12 = 22

H 1: 12 22

Izraunava se

Sd12
Sd 22

, uslov

Sd12 Sd 22

Dve grupe stepena slobode


df1 = N1 - 1;
df2 = N2 - 1
Sledi F distribuciju
2008/2009

S. Spasi

F-test - kritine vrednosti

odbacuje se H0

odbacuje se H0

prihvata se H0

/2

1,0

Flevo

2008/2009

/2

Fdesno

S. Spasi

F-test - Reenje
Sd1 = 1,30 Sd2 = 1,16
H0: 12 = 22
H1: 12 22

0,025

0,05

0,025

df1 22 df2 24
2,00

1,30 2
1,16

1,25

H0 se prihvata, nema znaajne razlike izmedju Sd12 i Sd22


2008/2009

S. Spasi

F-test - Reenje

F0,05, 20, 24 = 2,00 2,05

Fizr = 1,25

Fizr < F0,05

H0 se prihvata, nema znaajne razlike izmedju Sd12 i Sd22


2008/2009

S. Spasi

Testovi za dve i vie populacija


Analiza varijanse (ANOVA)

Jednofaktorska
ANOVA

Dvofaktorska
ANOVA
Efekat
interakcija

F-test
TukeySnedecor
test

2008/2009

S. Spasi

Student t-test

Student t-test testiranje razlike izmeu srednjih vrednosti


2 grupe podataka
H0 : 1 = 2
H1 : 1 2
= 0,05 (nivo znaajnosti testa)
0,05 (5%) verovatnoa da se odbaci ispravna nulta
hipoteza
greka tip I odbacivanje ispravne nulte hipoteze
greka tip II prihvatanje neispravne nulte hipoteze

2008/2009

S. Spasi

Student t-test

Testiranje razlike izmeu srednjih vrednosti vie grupa


podataka
potrebno izvoenje t-testa vie puta

Koliko je potrebno t-testova?


3 grupe podataka: A, B i C 3 t-testa
poreenja: A:B, A:C i B:C
4 grupe podataka: A, B, C i D 6 t-testova
poreenja: A:B, A:C, A:D, B:C, B:D i C:D

2008/2009

S. Spasi

Istovremeno izvoenje vie t-testova

Kod izvoenja vie t-testova javlja se Familywise error


rate problem (FWER)
FWER verovatnoa da se neispravno odbaci
najmanje jedna nulta hipoteza u grupi poreenja
FWER = 1 (1 )k
nivo znaajnosti testa
k broj t-testova
Za 6 t-testova:
FWER = 1 (1 0,05)6 = 1 0,735 = 0,265 = 27%
27% verovatnoe da napravimo najmanje jednu greku
tip I

2008/2009

S. Spasi

ANOVA

Analiza varijanse omoguava istovremeno testiranje


razlika izmeu vie srednjih vrednosti

Ispituje se jedna ili vie nezavisnih varijabli faktora


uticaja na zavisnu varijablu
Jedan faktor uticaja jednofaktorska ANOVA
Vie faktora uticaja viefaktorska ANOVA (multipla

ANOVA MANOVA)

Svaki faktor uticaja ima vie kategorija (grupa)

2008/2009

S. Spasi

Jednofaktorska ANOVA - hipoteze

H0: 1 = 2 = 3
Sve populacione srednje vrednosti su jednake
Faktor uticaja nema efekta

H1: 1 2 3
H1: 1 = 2 3
H1: 1 2 = 3
H1: 1 = 3 2

H1: - nisu sve jednake

Najmanje 1 srednja vrednost je razliita


Postoji efekat faktora uticaja
2008/2009

S. Spasi

Jednofaktorska ANOVA
H 0 : 1 2 3
H1 : Nisu sve jednake

Sve srednje vrednosti su jednake:


Nulta hipoteza je ispravna
(nema efekta faktora uticaja)

1 2 3
2008/2009

S. Spasi

Jednofaktorska ANOVA
H 0 : 1 2 3
H1 : Nisu sve jednake
Najmanje jedna srednja vrednost je razliita:
Nulta hipoteza nije ispravna
(postoji efekat faktora uticaja)

ili

1 2 3

1 2 3
2008/2009

S. Spasi

Logika Analize varijanse

Varijacija (varijansa) izmeu grupa uporeuje se sa


varijacijom (varijansom) unutar grupa
Varijacija izmeu grupa je varijacija (razlika) izmeu
srednjih vrednosti koja je posledica uticaja uzorka i
uticaja faktora koji se ispituje (ako postoji)
Varijacija unutar grupa je varijacija koja je posledica
uticaja uzorka
Ukupna varijacija je zbir varijacije izmeu grupa i
varijacije unutar grupa

2008/2009

S. Spasi

Jednofaktorska ANOVA - osnovna ideja

Uporedjivanje dva tipa varijacije da bi se ocenila razlika


izmedju srednjih vrednosti

Baza za poredjenje je odnos varijansi

Zato ANOVA?
Test baziran na varijansama je osetljiviji nego test

baziran na srednjim vrednostima


ANOVA ima manji rizik za greku tip I
ANOVA ima manji rizik za greku tip II

2008/2009

S. Spasi

Jednofaktorska ANOVA
Pretpostavke za test

Eksperimentalne jedinice su sluajno odabrane


Populacije su normalno distribuirane
Homogenost varijansi - Populacije imaju jednake varijanse
Podaci su izraeni intervalnom ili skalom odnosa

2008/2009

S. Spasi

Varijansa

Sd 2

x
i

N 1

xi x
N 1
2008/2009

Varijansa

Suma kvadrata odstupanja od srednje


vrednosti (suma kvadrata, SK)

Broj stepena slobode

S. Spasi

Razdvajanje varijacije

Mere varijacije se dobijaju razdvajanjem ukupne varijacije

varijansa izmeu grupa

varijansa unutar grupa

ukupna varijansa
2008/2009

Vig

Vug

Vtot
S. Spasi

SK ig
m 1
SK ug
Nm

SK tot

N 1
2

Jednofaktorska ANOVA F test


H0: 1= 2 = = c
H1: najmanje jedna srednja vrednost je razliita

Vig
Vug

Stepeni slobode
df1 = m 1
(m = broj grupa)
df2 = N m
(N = ukupan broj podataka u svim grupama zajedno)

2008/2009

S. Spasi

Kritine vrednosti F

Ako su srednje vrednosti jednake,


F =Vig/Vug 1
Odbacuje se H0 samo za veliko F

odbacuje se H0

prihvata se H0

F, df1, df2
Uvek jednostrani test!
2008/2009

S. Spasi

Razdvajanje varijacije

Ukupna varijacija (suma kvadrata odstupanja od srednje


vrednosti) moe da se razdvoji u dva dela :

SKtot = SKig + SKug


SKtot = ukupna suma kvadrata
(ukupna varijacija)
SKig = suma kvadrata izmeu grupa
(varijacija izmeu grupa)
SKug = suma kvadrata unutar grupa
(varijacija unutar grupa)
2008/2009

S. Spasi

Ukupna varijacija

SK tot X1,1 X X 2,1 X Xni ,i X

grupa 1

2008/2009

grupa 2

S. Spasi

grupa 3

Varijacija izmedju grupa

SK ig n1 X1 X n2 X 2 X nc Xc X

x3
x2

x1

grupa 1

2008/2009

grupa 2

S. Spasi

grupa 3

Varijacija unutar grupa

SK ug X1,1 X1 X 2,1 X1 Xni ,i Xi

x3
x2

x1

grupa 1

2008/2009

grupa 2

S. Spasi

grupa 3

Faktori koji utiu na zakljuak

Razlika izmeu
srednjih vrednosti

+
Veliina uzorka

ANOVA

Varijacija unutar
grupa

2008/2009

S. Spasi

Razlika izmeu srednjih vrednosti

mala razlika izmeu grupa


Nulta hipoteza se lako dokazuje
2008/2009

velika razlika izmeu grupa


Nulta hipoteza se teko dokazuje
S. Spasi

Veliina uzorka

mali broj podataka u grupi


Nulta hipoteza se lako dokazuje
2008/2009

veliki broj podataka u grupi


Nulta hipoteza se teko dokazuje
S. Spasi

Varijacija unutar grupa

velika varijacija unutar grupa


Nulta hipoteza se lako dokazuje
2008/2009

mala varijacija unutar grupa


Nulta hipoteza se teko dokazuje
S. Spasi

ANOVA - izrazi za izraunavanje


x N x
V
N 1
2

suma kvadrata odstupanja od


srednje vrednosti - SK
broj stepena slobode - df

x
2
2
2
SK x N (x) x N

N
2

x
x 2 N

N2

2008/2009

x
x 2

S. Spasi

ANOVA - izrazi za izraunavanje

1.

x
C

2. SK tot x 2 C
3. SK ig

x1

n1

x 2

n2

x i
....
ni

4. SK ug SK tot SK ig

2008/2009

S. Spasi

ANOVA - sumarna tabela

2008/2009

Vig
Vug

kritina vrednost F za df1 = m-1 i df2 = N-m

S. Spasi

Jednofaktorska ANOVA- primer


Ispitivanje toksinog delovanja leka na tri tipa elija
Prikazano je vreme (u danima) posle koga je ostalo 50% elija

tip A
1,2
1,5
1,7
1,8
1,6
1,4
9,2

tip B
1,5
1,4
1,3
1,6
1,8
1,4
9,0

tip C
2,0
1,8
1,7
2,2
1,9
2,1
11,7

xsr

1,53

1,50

1,95

x2

14,34

13,66

22,99

vreme
(dani)

2008/2009

S. Spasi

Jednofaktorska ANOVA- primer


2,5

H0: A = B = C

H1: - nisu sve


jednake
df1 = 2 i df2 = 15

x
xB

xA

1,5
dani

= 0,05

xC

0,5

0
2008/2009

S. Spasi

B
grupe

ANOVA primer 1

(9,2 9,0 11,7) 2


894,01
1. C

49,667222
18
18
2. SK tot (14,34 13,66 22,99) C 50,99 C 1,322778

3. SK ig

9,2 2 9,0 2 11,7 2

C 50,421667 - C 0,754445
6
6
6

4. SK ug 1,322778 0,754445 0,568333

2008/2009

S. Spasi

ANOVA primer 1

0,3772
9,953
0,0379

F0,05 = 3,68 za df1 = 2 i df2 = 15


Nulta hipoteza se odbacuje, negde postoji
razlika izmedju srednjih vrednosti !
2008/2009

S. Spasi

3,68

ANOVA Tukey-Snedecor test

D Sx Q

n6

Sx

Q 3,67

Vug
n

Sx

1
N

m 1

n 2

0,03789
0,07947
6

D 0,07947 3,67 0,292

2008/2009

S. Spasi

ANOVA Tukey-Snedecor test

x A xB

x A xC

xB x C

f(x)

AB
2008/2009

3
S. Spasi

ANOVA Tukey-Snedecor test

2008/2009

S. Spasi

ANOVA primer 2

H0: A = B = C = D
H1: - nisu sve jednake
= 0,05
df1 = 3 i df2 = 23

grupa A

grupa B

grupa C

grupa D

2,51
2,51

2,49
2,50

2,50
2,49

2,52
2,52

2,52
2,52

2,53
2.50

2,48
2,48

2,53
2,51

2,50
2,53

2,50
2,52

2,47
2,48

2,52
2,53

2,52

2008/2009

2,52
2,52

n
xsr

7
2,516

6
2,507

6
2,483

8
2,521

x
x2

17,61
44,3023

15,04
37,7014

14,9
37,0022

20,17
50,8539

S. Spasi

ANOVA - primer
(17,61 15,04 14,90 20,17) 2
1. C
169,8518
27
2. SK tot ( 44,3023 37,7014 37,0022
50,8539 ) C 0,00801
17,612 15,04 2 14,9 2 20,17 2
3. SK ig

C 0,005474
7
6
6
8
4. SK ug 0,008 0,005474 0,002526

2008/2009

S. Spasi

ANOVA - primer

0,001825
F
16,591
0,00011
F0,05 = 3,03 za df1 = 3 i df2 = 23
Nulta hipoteza se odbacuje, negde postoji
razlika izmedju srednjih vrednosti !
2008/2009

S. Spasi

3.03

ANOVA - Tukey-Snedecor test

D Sx Q

n 6,716

Sx

1
n
N

m 1

Vug
n

n2

0,00011
Sx
0,00405
6,716

Q 3,926

D 0,00405 3,926 0,016

2008/2009

S. Spasi

ANOVA - Tukey-Snedecor test

f(x)

x A xB xD x C

A=B=D C
2008/2009

S. Spasi

ANOVA - Tukey-Snedecor test

2008/2009

S. Spasi

You might also like