Professional Documents
Culture Documents
Biometria2 Anova Egyfaktoros 2023
Biometria2 Anova Egyfaktoros 2023
(ANOVA)
módszercsalád
több csoport várható értékeinek összehasonlítására szolgál
akár több szempont (faktor) szerint → modellek
hipotézisvizsgálat (általában több nullhipotézis!)
próbastatisztika: F-próba (szórásnégyzetek hányadosa)
alapelve: a csoportok közötti eltérés és a csoporton belüli
véletlen ingadozás összehasonlítása
BIOMETRIA2_ANOVA_egyfaktoros 11
Egy faktor szerinti ANOVA
BIOMETRIA2_ANOVA_egyfaktoros 22
1. példa (veralv.sta)
Véralvadási idő (sec) négyféle diéta esetén
(Box-Hunter-Hunter: Statistics for Experimenters, J. Wiley, 1978, p. 165)
70
68
66
64
CTIME
62
60
58
56 Median
25%-75%
Non-Outlier Range
54
Outliers
A B C D
Extremes
DIET
BIOMETRIA2_ANOVA_egyfaktoros 44
Szemléltető ábra az ANOVA alapgondolatához
BIOMETRIA2_ANOVA_egyfaktoros 55
Jelölések
- csoportok száma: i 1r itt r=4
- csoporton belüli j 1 pi itt pl. p1=4
ismétlések száma:
- egyedi mérési adat: yij
pi
- csoportátlag:
y
j 1
ij
yi
pi r pi
y
i 1 j 1
ij
- összes mérés y r
átlaga: p
i 1
i
- csoporton belüli
2 2 2
szórásnégyzetek: 𝑠1 , 𝑠2 , … , 𝑠𝑟
66
csoportok: i 1r
ismétlések: j 1 pi
Az ANOVA alapelve
y ij yi
pi
Az i-edik csoporton belüli ingadozás 2
varianciájának becslése: j 1
ˆ i2 si2
(a csoport-átlagtól való eltérések) pi 1
y s p 1
2
y i 2 csoporton belüli
ij i i
(within groups),
y2 sR2
i j i
p i
i r p
i
i r maradék vagy
error szórásnégyzet
BIOMETRIA2_ANOVA_egyfaktoros 77
csoportok: i 1r
ismétlések: j 1 pi
Az ANOVA alapelve
ˆ 2y p * 2y ˆ 2y s 2A ps 2y i 1 s 2A i 1
r 1 r 1
csoportok közötti (between groups), általánosan
vagy az A faktor szórásnégyzete (ha pkonst)
BIOMETRIA2_ANOVA_egyfaktoros 88
csoportok: i 1r
ismétlések: j 1 pi
Az ANOVA alapelve
pi y i y
2
s A2 i 1 (csoportok közötti)
s A2 r 1
F0 2
y ij yi
2
sR
s R2
i j (csoporton belüli)
p
i
i r
BIOMETRIA2_ANOVA_egyfaktoros 9 99
Az ANOVA alapelve
s A2
F0 2 F egyoldali próba!
sR
f(F)
F F
BIOMETRIA2_ANOVA_egyfaktoros 10
ANOVA táblázat
Teljes
S 0 y ij y
2
p
i
i 1
i j
BIOMETRIA2_ANOVA_egyfaktoros 11 11
Kiegyensúlyozott terv: p1=p2=...=pr=p
S A p y i y s 2A
2
A hatása r-1 SA
(csoportok s 2
r 1
A
közötti)
i
sR2
S R y ij y i
2
Ismétlések r(p-1) S
(csoportokon s
2 R
r p 1
i j R
belüli)
S 0 y ij y
2
rp-1
Teljes i j
BIOMETRIA2_ANOVA_egyfaktoros 12 12
1. példa megoldása „papíron, kézzel” kiszámolva
σ 2 2 2
𝑖 𝑝𝑖 (𝑦𝑖∙ − 𝑦∙∙ ) 4 ∙ (61 − 64) + ⋯ + 8 ∙ (61 − 64)
𝑠𝐴2 = = = 76
𝑟−1 4−1
σ 2
2 𝑖 𝑠𝑖 (𝑝𝑖 − 1) 3,33 ∙ 3 + 8 ∙ 5 + 2,8 ∙ 5 + 6,86 ∙ 7
𝑠𝑅 = = = 5,60
σ𝑖 𝑝𝑖 − 𝑟 24 − 4
2
σ𝑝𝑗=1
1
𝑦1𝑗 − 𝑦1⋅
𝑠12 = =
𝑝1 − 1
(62 − 61)2 + ⋯ + (59 − 61)2
= = 3,33
4−1
𝑠𝐴2 76
𝐹0 = 2 = = 13,6
𝑠𝑅 5,6
𝐹𝑘𝑟𝑖𝑡 (𝜈𝐴 = 3, 𝜈𝑅 = 20) = 3,1
py y
2
Effective hypothesis decomposition
i i
SS Degr. of MS F p i 1
s A2
Effect Freedom r 1
Intercept 92521.41 1 92521.41 16521.68 0.000000
DIET 228.00 3 76.00 13.57 0.000047 between
Error 112.00 20 5.60
s p 1
2
i i
within s 2
i
p r
R
BIOMETRIA2_ANOVA_egyfaktoros 14 14
i
ANOVA modell
y ij Yi ij i ij
BIOMETRIA2_ANOVA_egyfaktoros 15 15
1. átlag-modell: y ij i ij
H 0 : 1 2 3 r
2. hatás-modell: y ij i ij i i felbontással
p
i
i i 0 sum to zero
r 0 set to zero
H 0 : i 0 , i 1,..., r
BIOMETRIA2_ANOVA_egyfaktoros 16 16
A modell paramétereinek becslése
yij ˆ ˆ i 2 min
r pi
Yˆi ˆ ˆ i
i j
2 yij ˆ ˆ i 0
r pi
i j
r pi r r
y ij ˆ pi piˆ i
sum to zero
i j i i =0
y ij py. i i
ˆ i j
i
y.. a várható érték becslése a főátlag
p i
i p i
i
BIOMETRIA2_ANOVA_egyfaktoros 17 17
A modell paramétereinek becslése
yij ˆ ˆ i 2 min
r pi
i j
2 yij ˆ ˆ i 0
pi
ˆ i j
pi
pi yi.
j
yij ˆpi piˆ i
BIOMETRIA2_ANOVA_egyfaktoros 18 18
1. példa eredménytáblázatai STATISTICA programmal / 2
Summary fülön: Coefficients → a modell paramétereinek becslése
Parameter Estimates (Veralv)
r
p
Sigma-restricted parameterization
Level of Column CTIME CTIME CTIME CTIME i i 0
Effect Effect Param. Std.Err t p i
Intercept 1 64.00000 0.497912 128.5367 0.000000 sum to zero
DIET A 2 -3.00000 0.973610 -3.0813 0.005889
DIET B 3 2.00000 0.845330 2.3659 0.028195 sigma-restricted
DIET C 4 4.00000 0.845330 4.7319 0.000128
4 0 set to zero
BIOMETRIA2_ANOVA_egyfaktoros
overparameterized
19 19
Konfidencia-intervallum az egyes csoportok várható értékére
Pontbecslés: Yˆi ̂ i y i
yi i 2 s2
Intervallumbecslés: t sy
i pi
s y i
szab. fok:
si2 egyes csoportokon belüli szórásnégyzet pi 1
s2 ?
s R2 egyesített szórásnégyzet (jobb becslés) p
i
i r
yi t 2 sR pi i yi t 2 sR pi
BIOMETRIA2_ANOVA_egyfaktoros 20 20
Konfidencia-intervallum számítása pl. az „A” diéta várható értékére:
BIOMETRIA2_ANOVA_egyfaktoros 21 21
1. példa eredménytáblázatai STATISTICA programmal / 3
70
68
66
CTIME
64
62
60
Ellenőrizni kell!
BIOMETRIA2_ANOVA_egyfaktoros 23 23
ANOVA feltételezéseinek ellenőrzése
1. Homoszkedaszticitás: e2 konst ?
a) Statisztikai próbákkal
Assumptions fülön: Homogeneity of variances ...
Bartlett-próba
Tests of Homogeneity of Variances (Veralv) érzékeny a
Effect: DIET
normális eloszlás
Hartley Cochran Bartlett df p
F-max C Chi-Sqr. feltételezésére
CTIME 2.857143 0.381125 1.667956 3 0.644081
1. Homoszkedaszticitás: e2 konst ?
b) Becsült értékek – reziduumok (Pred & resids) ábrával
6
5
4
3
2
1
0
-1
-2
Raw Residuals
-3
-4
-5
-6
-7
60 61 62 63 64 65 66 67 68 69
Predicted Values
BIOMETRIA2_ANOVA_egyfaktoros 25 25
A feltételezések ellenőrzése a reziduumok vizsgálatával
2.5 5
.99
2.0
.95
1.5 4
1.0
.75
0.5 3
.55
0.0
-0.5 .35
No. of obs. 2
-1.0 .15
Expected Normal Value
-1.5
.05 1
-2.0
.01
-2.5
0
-3.0 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
X <= Category Boundary
Residual
BIOMETRIA2_ANOVA_egyfaktoros 26 26
A feltételezések ellenőrzése a reziduumok vizsgálatával
-3
0
-4
-1
-5
-2
-6
-3
-7
-5 0 5 10 15 20 25 30 -4
ORDER -5
-6
-7
1 2
BIOMETRIA2_ANOVA_egyfaktoros LABOR 27 27
Többszörös összehasonlítások
Példák az összehasonlításokra:
70
68
66
1 4 2 3 1 4 2 3 64
CTIME
62
2 2 60
58
56 Median
25%-75%
Non-Outlier Range
54
Outliers
A B C D
Extremes
DIET
Ha az összehasonlítások függetlenek,
még nem jelenti azt, hogy a statisztikai próbák is függetlenek!
BIOMETRIA2_ANOVA_egyfaktoros 29 29
Nem független összehasonlítások esetén
k * Bonferroni-egyenlőtlenség
BIOMETRIA2_ANOVA_egyfaktoros 30 30
Hasonlítsuk össze a 2. és a 3. diétát!
H0 : 𝜇2 = 𝜇3
?
𝑦2⋅ − 𝑦3⋅ 1 1
𝑡0 = 𝑠𝑦22⋅ −𝑦3⋅ =𝑠 2
+
𝑠𝑦2⋅ −𝑦3⋅ 𝑝2 𝑝3
BIOMETRIA2_ANOVA_egyfaktoros 31 31
Módosított kétmintás t-próba:
LSD-próba (Least Significant Difference)
𝑦2⋅ − 𝑦3⋅ 66 − 68
𝑡0 = = = −1,464
1 1 1 1
𝑠𝑅 + 5,6 +
𝑝2 𝑝3 6 6
𝜈=20
𝑡0,05/2 = 2,086
Döntés?
BIOMETRIA2_ANOVA_egyfaktoros 32 32
Többszörös összehasonlítások a Statistica programban / 1
LSD test; variable CTIME (Veralv)
Probabilities for Post Hoc Tests
Post-hoc fülön: LSD teszt Error: Between MS = 5.6000, df = 20.000
DIET {1} {2} {3} {4}
Cell No. 61.000 66.000 68.000 61.000
Az összes párra elvégzi 1 A 0.003803 0.000181 1.000000
az összehasonlítást 2
3
B 0.003803
C 0.000181 0.158776
0.158776 0.000864
0.000023
4 D 1.000000 0.000864 0.000023
k *
Probabilities for Post Hoc Tests
Error: Between MS = 5.6000, df = 20.000
DIET {1} {2} {3} {4}
Cell No. 61.000 66.000 68.000 61.000
1 A 0.022815 0.001083 1.000000 k * 6 0,003803 0,022815
2 B 0.022815 0.952656 0.005182
3 C 0.001083 0.952656 0.000139
4 D 1.000000 0.005182 0.000139
BIOMETRIA2_ANOVA_egyfaktoros 33 33
Kontrasztok
Az összehasonlítások általánosítása:
c
i
ik 0 cik kontraszt-együtthatók
Pl. H 10 : 2 3 0
C 1 y 2 y 3 c11=0, c21=1, c31=-1, c41=0
BIOMETRIA2_ANOVA_egyfaktoros 34 34
Kontrasztokra vonatkozó hipotézisvizsgálat:
H 0k : E C k cik i 0
i
c ik yi
t0 i
sR ik pi
c 2
Függetlenek az összehasonlítások, ha
ortogonálisak a kontrasztok, ha minden kl-re c
i
c 0
ik il
BIOMETRIA2_ANOVA_egyfaktoros 35 35
Többszörös összehasonlítások a Statistica programban / 2
Planned comps fülön: Specify contrasts
BIOMETRIA2_ANOVA_egyfaktoros 36 36
Többszörös összehasonlítások a Statistica programban / 3
BIOMETRIA2_ANOVA_egyfaktoros 37 37
Kimutatható különbség és a próba ereje
BIOMETRIA2_ANOVA_egyfaktoros 38 38
1. Milyen valószínűséggel mutatható ki a csoportok között
egy adott különbség?
2. Mekkora különbség mutatható ki adott valószínűséggel?
Statistics>Power Analysis>Several Means, ANOVA 1-Way
1-Way ANOVA: Power Calculation
1-Way ANOVA (Fixed Effects)
1.0
Power vs. RMSSE (Alpha = 0.05, Groups = 4, N = 6) ← rögzítjük
.9
.8
.7 A kimutatandó
.6 különbséget
jellemző mérőszám:
Power
.5
.4
2
.3 i
RMSSE i
.2
.1
r 1 e2
0.0
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2
39 39
Root Mean Square Standardized Effect (RMSSE) 39 39
i
2
RMSSE i
r 1 e2
y ij i ij
RMSSE
32 32 02 02
18
1,035
4 1 5,6 3 5,6
De ha 1 = -1, 2 = 1, 3 = 4 = 0,
akkor RMSSE értéke már csak 0,345;
a próba ereje pedig már csak kb. 0,19.
BIOMETRIA2_ANOVA_egyfaktoros 40 40
Sample Size Calculation
ANOVA, 1-W ay Milyen ismétlés-
Fixed Effects
Value számmal tudunk
Number of Groups 4.0000 ← rögzítjük adott különbséget
RMSSE 1.0350
Noncentrality Parameter (Delta) 32.1368 kimutatni?
Type I Error Rate (Alpha) 0.0500
Power Goal 0.9000
Actual Power for Required N 0.9308
Required Sample Size (N) 6.0000
41 41
Kimutatható különbség számítása táblázattal
df numerator
df
denom.
1 2 3 4 5 6 10 20 50 (Több) rögzített
1
2
20.96
6.796
23.25
6.710
24.16
6.682
24.65
6.668
24.95
6.659
25.15
6.653
25.57
6.642
25.89
6.633
26.08
6.628
faktorokra
3 5.014 4.630 4.475 4.390 4.336 4.299 4.221 4.159 4.121
4 4.396 3.900 3.692 3.576 3.502 3.450 3.339 3.250 3.193
α = 0,05
5 4.092 3.538 3.301 3.166 3.079 3.018 2.886 2.777 2.707
6 3.913 3.324 3.068 2.921 2.825 2.757 2.609 2.486 2.405
7
8
3.795
3.712
3.183
3.084
2.914
2.805
2.759
2.643
2.656
2.535
2.583
2.458
2.423
2.288
2.287
2.142
2.197
2.044
β = 0,1
10 3.604 2.953 2.661 2.489 2.375 2.292 2.107 1.944 1.832
12 3.536 2.871 2.570 2.392 2.272 2.186 1.989 1.814 1.690
14
16
3.489
3.455
2.815
2.774
2.508
2.463
2.325
2.276
2.202
2.150
2.112
2.058
1.907
1.846
1.721
1.652
1.588
1.510
F-próba
18
20
3.429
3.409
2.743
2.718
2.428
2.401
2.239
2.210
2.111
2.080
2.017
1.984
1.800
1.762
1.598
1.554
1.449
1.399
számlálójának
22
24
3.393
3.380
2.698
2.682
2.379
2.361
2.186
2.166
2.054
2.033
1.957
1.935
1.732
1.707
1.519
1.489
1.357
1.322
és nevezőjének
26
28
3.368
3.359
2.669
2.657
2.346
2.333
2.150
2.136
2.016
2.001
1.917
1.901
1.686
1.667
1.464
1.442
1.292
1.265
szabadsági foka
30 3.351 2.647 2.322 2.124 1.988 1.888 1.652 1.423 1.242
40 3.322 2.613 2.283 2.082 1.944 1.841 1.597 1.355 1.159
60
80
3.295
3.281
2.580
2.563
2.246
2.227
2.042
2.022
1.900
1.878
1.794
1.772
1.542
1.515
1.287
1.252
1.070
1.022 hatás
C
EMS nevező
100 3.273 2.554 2.216 2.010 1.866 1.758 1.498 1.231 .9926
200 3.257 2.534 2.195 1.986 1.840 1.731 1.466 1.187 .9298
500 3.248 2.523 2.182 1.972 1.825 1.715 1.446 1.161 .8894
1000 3.245 2.519 2.178 1.967 1.820 1.709 1.439 1.152 .8754
3.242 2.515 2.173 1.962 1.815 1.704 1.433 1.143 .8610 42 42
hatás
A táblázatban C értékei vannak
EMS nevező
Φ (hatás) értelmezése: r
i
2
( A) i y ij i ij
r 1
EMS (nevező) = az F-próba nevezőjében szereplő
szórásnégyzet várható értéke
(egyfaktoros ANOVA-nál: 𝜎𝑒2 )
BIOMETRIA2_ANOVA_egyfaktoros 43 43
Számítsuk ki a kimutatható különbséget
a „véralvadás” példánkra:
- csoportok száma (i): 4
- ismétlések száma (j): 6
(most legyen kiegyensúlyozott terv)
- a számláló szabadsági foka: 4−1 = 3 𝑠𝐴2
𝐹0 = 2
- a nevezőé szabadsági foka: 4∙(6−1) = 20 𝑠𝑅
∆= 2,4 ∙ 𝜎𝑒