You are on page 1of 38

Tema 6.

ANOVA

BIOESTADÍSTICA
Grau de nutrició humana i dietètica
Universitat Rovira i Virgili

Meritxell Pallejà
meritxell.palleja@urv.cat
Esquema, quin test utilitzar?

Normalitat? Número de Dependència? TEST


grups

1 grup - T d’Student

Paramètrics
Independents T d’Student
2 grups
Tipus de tests Aparellades T d’Student

Independents U Mann-
Whitney
No 2 grups
paramètrics
Aparellades Wilcoxon
Com ho fem per comparar més de dos grups?

 ANOVA (Analysis Of VAriance). És al tècnica


utilitzada per comparar les mitjanes de dos o més
grups, en dades normals.

 El test NO paramètric per a comparar més de dos


grups és el Test de Kruskal-Wallis.
Esquema, quin test utilitzar?

Normalitat? Número de Dependència? TEST


grups

1 grup - T d’Student

Independents T d’Student
Paramètrics 2 grups
Aparellades T d’Student

> 2 grups Independents ANOVA


Tipus de tests

Independents U Mann-
Whitney
2 grups
No Aparellades Wilcoxon
paramètrics
> 2 grups Independents Kruskal-
Wallis
Requisits per utilitzar ANOVA

 Normalitat: és un test paramètric.


Les variable a estudiar ha de ser normal, però el
que és realment important és que els residus
s’aproximin a una distribució normal.
*residus=𝑥𝑖 − 𝑥ҧ
 Homogeneïtat de variàncies: Igualtat de variàncies
entre grups.
Requisits per utilitzar ANOVA
 Estructura de les dades:
 Variable depenent: És quantitativa. És la variable de la
que es volen comparar les mitjanes.
 Variable independent o factor: És qualitativa. És la
variable que indica a quin grup pertany l’observació.
Exemple:
Es vol mirar la relació que hi ha entre el pes i el tipus
d’oli de més consum en cada individu.
Variable depenent? Pes
Variable independent/ factor? Tipus d’oli
ANOVA d’un factor
ANOVA amb més d’un
ANOVA d’un factor
factor
 Una sola variable  Una sola variable
dependent i més d’un
dependent i un sol factor independent.
factor independent.  Més d’un criteri

 Un sol criteri d’agrupació.


 En aquest cas també
d’agrupació.
s’han de tenir en compte
les interaccions entre
factors i altres
Exemple amb més d’un factor: consideracions.
Es vol comparar la pèrdua de pes entre persones que segueixen 3 tipus
de dieta diferent, dels quals n’hi ha que fan molt esport, poc i gens.
Hipòtesis del ANOVA
 Si tenim k grups, siguin 𝜇1 , … , 𝜇𝑘 les mitjanes de la
variable per a cada grup. El contrast és:

𝐻0 : 𝜇1 = ⋯ = 𝜇𝑘

𝐻1 : Alguna igualtat no es compleix

Exemple
S’apliquen 3 tractaments diferents a una mostra de 5
persones per tractament. Volem saber si es pot deduir
que tots els tractaments obtenen la mateixa
puntuació.
Hipòtesis del ANOVA
Exemple
S’apliquen 3 tractaments diferents a una mostra de 5
persones per tractament. Volem saber si es pot deduir
que tots els tractaments obtenen la mateixa
puntuació.
 Tipus de variables?

Variable dependent: puntuació


Variable Independent (factor): tipus de tractament
 Hipòtesis?

𝐻𝑂 : 𝜇𝑡𝑟𝑎𝑐𝑡𝑎𝑚𝑒𝑛𝑡1 = 𝜇𝑡𝑟𝑎𝑐𝑡𝑎𝑚𝑒𝑛𝑡2 = 𝜇𝑡𝑟𝑎𝑐𝑡𝑎𝑚𝑒𝑛𝑡3



𝐻1 : Alguna igualtat no es compleix
ANOVA d’un factor
 Quan comparem més de dos grups la variabilitat
total es divideix en dos components:

 Unexplica la variabilitat que hi ha per les diferències


entre grups. Variància entre grups (between)
→Expressa l’efecte del factor

 L’altre
explica la variabilitat que hi ha dins de cada
grup. Variància intragrup (whithin)
→Expressa l’error d’estimació
ANOVA d’un factor

Entre grups > Entre grups <


Intragrups < Intragrups <

Entre grups > Entre grups <


Intragrups > Intragrups >
ANOVA d’un factor
Conceptes
 Suma de quadrats (SQ).

2
𝑆𝑄 = ෍ 𝑥𝑖 − 𝑥ҧ

2
𝑆𝑄 Per tant
𝑆 = 𝑆𝑄 = 𝑆 2 × 𝑔. 𝑙𝑙
𝑔. 𝑙𝑙
Com hem dit, en ANOVA hi ha 2 tipus de variàncies,
per tant també:
𝑆𝑄𝑏𝑒𝑡𝑤𝑒𝑒𝑛 i 𝑆𝑄𝑤𝑖𝑡ℎ𝑖𝑛
ANOVA d’un factor
 La suma de quadrats intragrups (𝑆𝑄𝑤𝑖𝑡ℎ𝑖𝑛 ) que
expressa l’error, es calcula:
𝑆𝑄𝑤𝑖𝑡ℎ𝑖𝑛 = ෍ 𝑆𝑖2 (𝑛𝑖 − 1)

 La suma de quadrats entre grups (𝑆𝑄𝑏𝑒𝑡𝑤𝑒𝑒𝑛 ) que


expressa l’efecte, es calcula:
2
𝑆𝑄𝑏𝑒𝑡𝑤𝑒𝑒𝑛 = ෍ 𝑛𝑖 𝑥ഥ𝑖 − 𝑥𝑡𝑜𝑡𝑎𝑙

𝑖 = 1, … . , 𝑘 on k és el número de grups
ANOVA d’un factor
Exemple:
Entre un grup de 15 persones obeses, es vol mirar si hi
ha relació entre el pes i el tipus d’oli de més consum
en cada individu. La desviació típica és 4 per a tots
els grups. Hipòtesis:
Pes en Pes en Pes en
consum oli consum oli consum 𝐻0 : 𝜇𝑜𝑙𝑖𝑣𝑎 = 𝜇𝑔.𝑠𝑜𝑙 = 𝜇𝑎𝑙𝑡𝑟𝑒𝑠
d’oliva de gira-sol altres olis ቊ
100 96 89
𝐻1 : Alguna = és ≠
98 94 87
98 94 87
Variable dependent= Pes
94 90 83 Variable factor= Tipus d’oli
90 86 79 més consumit
ANOVA d’un factor
Pes en Pes en Pes en
consum oli consum oli consum
d’oliva de gira-sol altres olis

100 96 89
98 94 87
98 94 87
94 90 83
90 86 79
𝑠𝑖 4 4 4

2 2 2
𝑆𝑄𝑤𝑖𝑡ℎ𝑖𝑛 = ෍ 𝑆𝑖2 (𝑛𝑖 − 1) = 4 × 5 − 1 + 4 × 5 − 1 + 4 ×
5 − 1 = 64 + 64 + 64 = 192
ANOVA d’un factor
Pes en Pes en Pes en
consum oli consum oli consum
σ𝑛𝑗=1 𝑥𝑗
𝑋1 =
d’oliva de gira-sol altres olis 𝑛
100 96 89 𝑋1 = 96
98 94 87
98 94 87 𝑋2 = 92
94 90 83
90 86 79 𝑋3 = 85
𝑠𝑖 4 4 4 96 + 92 + 85
𝑛𝑖 5 5 5 𝑋𝑇𝑜𝑡𝑎𝑙 = = 91
3
2
𝑆𝑄𝑏𝑒𝑡𝑤𝑒𝑒𝑛 = ෍ 𝑛𝑖 𝑥ഥ𝑖 − 𝑥𝑡𝑜𝑡𝑎𝑙 =
= 5 × 96 − 91 2 + 5 × 92 − 91 2 + 5 × 85 − 91 2

= 125 + 5 + 180 = 310


ANOVA d’un factor
 L’estadístic de contrast es distribueix com una F de
Snedecor i es calcula:
2
𝑆𝑏𝑒𝑡𝑤𝑒𝑒𝑛
𝐹= 2
𝑆𝑤𝑖𝑡ℎ𝑖𝑛
 La F teòrica té k-1, N-k graus de llibertat. És a dir:
𝐹𝑘−1,𝑁−𝑘 ~𝐹𝑒𝑥𝑝
 Això és perquè:
𝑔. 𝑙𝑙𝑏𝑒𝑡𝑤𝑒𝑒𝑛 = 𝑘 − 1
𝑔. 𝑙𝑙𝑤𝑖𝑡ℎ𝑖𝑛 = 𝑁 − 𝑘
ANOVA d’un factor
 F de Snedecor, té unes taules semblants a les de la
normal però amb una sola cua.
 Quan més gran sigui F, més evidència per rebutjar
la hipòtesis nul·la.
2
𝑆𝑏𝑒𝑡𝑤𝑒𝑒𝑛
𝐹= 2
𝑆𝑤𝑖𝑡ℎ𝑖𝑛
 Com que els dos termes que intervenen en el càlcul
de F són sempre >0, no hi ha opció de una cua o
dos.
 Sempre es mira 𝐻1 com una desigualtat
ANOVA d’un factor
En l’exemple tenim:
𝑆𝑄𝑤𝑖𝑡ℎ𝑖𝑛 =192
𝑆𝑄𝑏𝑒𝑡𝑤𝑒𝑒𝑛 =310
 Volem calcular F per poder fer el contrast:
2
𝑆𝑏𝑒𝑡𝑤𝑒𝑒𝑛 155
𝐹= 2 = = 9,7 Recordem:
𝑆𝑤𝑖𝑡ℎ𝑖𝑛 16 𝑆𝑄
2
𝑆 =
2 310 𝑔. 𝑙𝑙
𝑆𝑏𝑒𝑡𝑤𝑒𝑒𝑛 = = 155
3−1 𝑔. 𝑙𝑙𝑏𝑒𝑡𝑤𝑒𝑒𝑛 = 𝑘 − 1
2 192 𝑔. 𝑙𝑙𝑤𝑖𝑡ℎ𝑖𝑛 = 𝑁 − 𝑘
𝑆𝑤𝑖𝑡ℎ𝑖𝑛 = = 16
15 − 3
ANOVA d’un factor
Conclusions
Una sola cua!
 F=9,7
Rebutgem 𝐻0 → hi
 𝐹𝑘−1,𝑁−𝑘 = 𝐹2,12 = 0,052 ha diferències
significatives entre
els grups
ANOVA d’un factor
 Habitualment, tots aquests resultats s’expressen en
una taula
Graus de
Variàncies
Suma de quadrats (SQ) llibertat F
(𝒔𝟐 )
(g.ll)

𝑆𝑄𝑏𝑒𝑡𝑤𝑒𝑒𝑛 2
Entre grups 2 𝑆𝑏𝑒𝑡𝑤𝑒𝑒𝑛
෍ 𝑛𝑖 𝑥ഥ𝑖 − 𝑥𝑡𝑜𝑡𝑎𝑙 𝑘−1
(between) 𝑔. 𝑙𝑙𝑏𝑒𝑡𝑤𝑒𝑒𝑛 2
𝑆𝑤𝑖𝑡ℎ𝑖𝑛

Residual 𝑆𝑄𝑤𝑖𝑡ℎ𝑖𝑛
෍ 𝑆𝑖2 (𝑛𝑖 − 1) 𝑁−𝑘
(within) 𝑔. 𝑙𝑙𝑤𝑖𝑡ℎ𝑖𝑛

Total 𝑆𝑄𝑏𝑒𝑡𝑤𝑒𝑒𝑛 + 𝑆𝑄𝑤𝑖𝑡ℎ𝑖𝑛 𝑁−1


ANOVA d’un factor
 En l’exemple:

Graus de
Variàncies
Suma de quadrats (SQ) llibertat F
(𝒔𝟐 )
(g.ll)

Entre grups
310 2 155 9,7
(between)

Residual
192 12 16
(within)

Total 502 14
Hipòtesis del ANOVA
 Si tenim k grups, siguin 𝜇1 , … , 𝜇𝑘 les mitjanes de la
variable per a cada grup. El contrast és:

𝐻0 : 𝜇1 = ⋯ = 𝜇𝑘

𝐻1 : Alguna igualtat no es compleix

Si p-valor < 0.05 → El test és significatiu


→ Rebutgem 𝐻0

“ALGUNA IGUALTAT NO ES COMPLEIX”


En podem saber més...?
On es troben les diferències?
 Si el p-valor del ANOVA és < 0.05 sabem que com
a mínim dos grups són diferents entre ells
 Si el p-valor del ANOVA és > 0.05 NO CAL fer
cap més contrast. Sabem que no trobarem cap
diferència

 Per veure entre quins grups hi ha diferències hem


de contrastar dos a dos els diferents grups
Contrastos de ANOVA dos a dos
 A posteriori (o post hoc)
 Bonferroni,
Tukey
 Moltes comparacions
 Comparacions NO planificades
 Es comparen tots els grups entre ells (tot amb tot)
𝑘×(𝑘−1)
 Sik és el número de grups, es fan comparacions
2
Per comparar 3 grups:
1-2
3×2
1-3 →3 comparacions → =3
2
2-3
Requisits per utilitzar ANOVA

 Més de dos grups a comparar.


 Normalitat: ANOVA és un test paramètric, per tant,
les variable a estudiar ha de seguir una distribució
normal.
 Homogeneïtat de variàncies (homoscedasticitat):
Igualtat de variàncies entre grups.

Per poder utilitzar


ANOVA s’han de
complir TOTES
Normalitat
 El test de Shapiro-Wilk s’utilitza per contrastar si les
dades són normals.
Hipòtesis:
𝐻0 : Dades normals

𝐻1 : Dades no normals

No podem rebutjar 𝐻0 , assumim


 Si p-valor > 0.05 → que les dades són normals

Rebutgem 𝐻0 , les dades no són


 Si p-valor < 0.05 → normals
Homoscedasticitat
 El test de Bartlett s’utilitza per contrastar si les
variàncies entre els grups són iguals
(homoscedasticitat).
Hipòtesis:
𝐻0 : Variàncies iguals (homoscedasticitat)

𝐻1 : Alguna variància no és igual

No podem rebutjar 𝐻0 , assumim


 Si p-valor > 0.05 → que les són iguals entre grups
Rebutgem 𝐻0 , hi ha alguna
 Si p-valor < 0.05 → variància que no és igual
Esquema, quin test utilitzar?

Normalitat? Número de Dependència? TEST


grups

1 grup - T d’Student

Independents T d’Student
Paramètrics 2 grups
Aparellades T d’Student

> 2 grups Independents ANOVA


Tipus de tests

Independents U Mann-
Whitney
2 grups
No Aparellades Wilcoxon
paramètrics
> 2 grups Independents Kruskal-
Wallis
Test de Kruskal-Wallis
 Test NO paramètric per a mostres independents
 S’utilitza quan no tenim les condicions necessàries per utilitzar
ANOVA.

 Si tenim k grups, les hipòtesis del test de Kruskal-Wallis són:

𝐻0 : La var. dependent es distribueix igual en tots els grups



𝐻1 : Hi ha almenys un grup en que es distribueix diferent

→ Sovint quan comparem distribucions es diu que comparem


medianes.
ANOVA vs Kruskal-Wallis
ANOVA Kruskal-Wallis
 Té més potència  Té menys potència

estadística estadística
 Només es pot utilitzar  Es pot utilitzar sempre

sota certes condicions


 Es pot calcular només  Es necessari utilitzar
a partir de 𝑥,ҧ s, n totes les dades, NO es
(es construeix la taula) pot calcular només a
partir de 𝑥,ҧ s, n
Dades aparellades

 Si tenim més de dos grups i les dades NO són


independents (són aparellades) utilitzarem els
contrastos:
 ANOVA per a mesures repetides. Test paramètric
 Test de Friedman. Test NO paramètric
Esquema, quin test utilitzar?
Exercici
 Els membres d’un equip de ciclistes es divideixen
aleatòriament en 5 grups, cada grup entrenarà
amb un mètode diferent (M1,M2,..., M5).
Després d’estar entrenant durant dues setmanes es
mesuren el temps que tarden en recórrer el mateix
tram (en minuts). Es vol saber si hi ha diferències en
funció del mètode utilitzat.
Exercici
 Dades:
P-valor (Shapiro Wilk) = 0,527
P-valor (Bartlett)=0,216

M1
M2
M3
M4
M5
Exercici
 Tipus de variables
 Hipòtesis
 Test de contrast que utilitzarem
 Resultats
 Conclusió
ANOVA d’un factor
 Habitualment, tots aquests resultats s’expressen en
una taula
Graus de
Variàncies
Suma de quadrats (SQ) llibertat F
(𝒔𝟐 )
(g.ll)

𝑆𝑄𝑏𝑒𝑡𝑤𝑒𝑒𝑛 2
Entre grups 2 𝑆𝑏𝑒𝑡𝑤𝑒𝑒𝑛
෍ 𝑛𝑖 𝑥ഥ𝑖 − 𝑥𝑡𝑜𝑡𝑎𝑙 𝑘−1
(between) 𝑔. 𝑙𝑙𝑏𝑒𝑡𝑤𝑒𝑒𝑛 2
𝑆𝑤𝑖𝑡ℎ𝑖𝑛

Residual 𝑆𝑄𝑤𝑖𝑡ℎ𝑖𝑛
෍ 𝑆𝑖2 (𝑛𝑖 − 1) 𝑁−𝑘
(within) 𝑔. 𝑙𝑙𝑤𝑖𝑡ℎ𝑖𝑛

Total 𝑆𝑄𝑏𝑒𝑡𝑤𝑒𝑒𝑛 + 𝑆𝑄𝑤𝑖𝑡ℎ𝑖𝑛 𝑁−1


Exercici

You might also like