You are on page 1of 78

Analyse de la Variance

Partie 1
Mohammed El Haj Tirari
tirari@insea.ac.ma

INSEA
2013-2014

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Introduction
LAnalyse de la Variance (ANOVA) est une technique quon utilise
pour tudier leffet dune variable qualitative sur une variable
quantitative :
Variable dpendante : variable quantitative.
Variable indpendante : variable qualitative (avec plusieurs
catgories).
Par exemple : Impact du niveau dinstruction (variable qualitative
qualitative) sur le revenu (variable quantitative).
, On peut conclure quil existe une relation si les moyennes de
revenus des gens ne sont pas les mmes dans les diffrentes
catgories.
Chaque variable indpendante est appele un facteur et chaque
facteur peut avoir deux ou plusieurs niveaux ou traitements.
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Introduction
Lanalyse de variance peut tre vue comme une comparaison
multiple de moyennes. Dans tous les cas, la variable tudie est un
caractre quantitatif de type continu qui suit une loi normale.
, Une ANOVA teste si toutes les moyennes sont gales :
H0 : galit

contre

H1 : au moins une diffrence

On note que si H0 est rejete pour un seuil donn, lANOVA ne dit


pas o sont les diffrences.
LANOVA est utilise quand le nombre de niveaux est suprieur
deux.
Il existe diffrents types dANOVA qui se distinguent par le nombre
de facteurs tudis (un facteur, deux facteurs, deux facteurs avec
rptitions, etc) et la nature des modalits associes au facteur
(modle fixe, modle alatoire, modle mixte).
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Les diffrents types dANOVA


Type I : "effets fixes"
Pour ce type dANOVA, les traitements sont dtermins par le
chercheur.
Exemple : Ltude de leffet de diffrents types dalimentation
(Paille, Foin, Herbe) sur le rendement des vaches laitires :
3 traitements (types dalimentations) dtermins par le
chercheur.
la variable dpendante est la quantit de lait produites (Y ), et
le facteur (T ) est le type de lalimentation
Les modalits du facteur correspondent diffrentes valeurs prises
par une variable alatoire dont les valeurs sont fixes par
lexprimentateur.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Les diffrents types dANOVA


Type II : "effets alatoires"
Pour ce type dANOVA, les traitements ne sont pas sous le contrle
de lexprimentateur ou le chercheur.
Exemple : Ltude de leffet de la rgion dlevage (3 rgions
choisies alatoirement) sur le rendement des vaches laitires :
les 3 traitements (rgions dlevage) sont choisies
alatoirement par le chercheur.
la variable dpendante est la quantit de lait produites (Y ), et
le facteur (T ) est la rgion dlevage.
Les modalits du facteur correspondent diffrentes valeurs
observes pour une variable alatoire dont les valeurs ne sont pas
fixes par lexprimentateur.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Les diffrents types dANOVA


Type III : "effets mixtes"
Ce type dANOVA correspond au cas dANOVA plusieurs facteurs
o on dispose dau moins un facteur du Type I et au moins un du
Type II.
Exemple : Ltude de leffet de diffrents types dalimentation
(Paille, Foin, Herbe) et de leffet de la rgion dlevage (3 rgions
choisies alatoirement) sur le rendement des vaches laitires :
On dispose dun facteur fixe et dun facteur alatoire.
la variable dpendante est la quantit de lait produites (Y ), et
les facteurs sont T1 : le type dalimentation et T2 : la rgion
dlevage.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Analyse de la Variance un facteur

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Introduction

Lanalyse de variance un facteur ou ANOVA1 a pour objectif de


tester leffet dun facteur A sur une variable alatoire continue.
Ceci revient comparer les moyennes de plusieurs populations
normales et de mme variance partir dchantillons alatoires et
indpendants les uns des autres.
Chaque chantillon correspond une modalit du facteur A.
Le terme ANOVA indique que la comparaison multiple de moyennes
correspond en faite la comparaison de deux variances.
Pour cette premire partie, nous allons considrer dans un premier
temps le cas de lANOVA un facteur fixe.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Structure des donnes


Si le facteur A est compos de p modalits (on parle aussi de
traitements), Les donnes relatives une analyse de variance un
facteur sont structures dans un tableau du type suivant :

modalit 1
y11
..
.

...
...
..
.

Facteur A
modalit i
yi1
..
.

...
...
..
.

modalit p
yp1
..
.

y1j
..
.

...
..
.

yij
..
.

...
..
.

ypj
..
.

y1n1
y1

...
...

yini
yi

...
...

ypnp
yp

Leffectif dune modalit i est not ni . Les effectifs des modalits du


facteur ne sont pas forcment les mmes.
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Exemple de donnes

Un leveur souhaite acheter de nouvelles vaches pour sa production


laitire. Il possde trois races diffrentes de vaches et se pose donc la
question de savoir si la race est importante pour son choix. Il possde
comme informations la race de chacune de ses btes (cest la variable
explicative discrte ou facteur, qui peut prendre 3 valeurs diffrentes) et
leurs productions de lait journalires (cest la variable expliquer
continue, qui correspond au volume de lait en litre).

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Exemple de donnes
Dans cet exemple, lhypothse nulle revient considrer que toutes les
vaches produisent la mme quantit de lait journalire (au facteur
alatoire prs) quelle que soit la race. Lhypothse alternative revient
considrer quune des races produit significativement plus ou moins de
lait que les autres. Supposons que les productions sont :
La race des vaches
Race A Race B Race C
20,1
22,6
31,2
19,8
24,1
31,6
21,3
23,8
31,0
20,7
22,5
32,1
23,4
31,4
24,5
22,9

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Modle thorique

Le modle linaire correspondant une analyse de la variance un


facteur est donn par
yij = i + ij = + i + ij
o
yij est la valeur observe pour le sujet j du groupe i.
est la moyenne gnrale.
i est linfluence du traitement Ai sur le groupe i
(i = i ).
ij est lerreur ou les rsidus (selon les hypothses, ils sont
distribus de manire normale avec une moyenne = 0 et une
variance 2 ).

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Modle thorique

Dans le cas dune analyse de la variance effet alatoire, la variable


est issue dune loi suppose normale qui sajoute la valeur fixe. Le
modle linaire devient :
yij = + i + ij
avec i = +  et  = N (0, 2 )
Un modle bas sur des variables explicatives effets fixes et effets
alatoires est appel modle mixte.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Conditions dapplication dune ANOVA

Les hypothses relatives au modle danalyse de la variance sont


nombreuses.
Lanalyse des rsidus ij = yij i est particulirement utile pour
rpondre aux hypothses de normalit et dhomoscdasticit.
On note que dans le cas dun modle effet fixe, il est quivalent de
tester ces hypothses sur la variable yij .

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Conditions dapplication dune ANOVA

Hypothse 1 : lIndpendance
Lindpendance entre les diffrentes valeurs de la variable mesure yij est
une condition essentielle la ralisation de lanalyse de variance.
, Les p chantillons compars sont indpendants.
, Lensemble des n individus est rparti au hasard entre les p
modalits du facteur contrl A et les ni individus correspondant
une modalit Ai recoivent le mme traitement i.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Conditions dapplication dune ANOVA


Hypothse 2 : la Normalit
La variable quantitative tudie suit une loi normale dans les p
populations compares.
, La variable alatoire tudie Y dont yij est une reprsentation,
suit une loi normale N (i , ).
La normalit de la variable pourra tre teste laide du test de
Kolmogorov-Smirnov ou avec le test Khi-deux dajustement si les
effectifs sont suffisamment importants. Sinon le test non
paramtrique de Lilliefors permet de tester lajustement loi
normale lorsque les effectifs sont faibles.
Si la normalit de la variable nest pas vrifie, soit on peut
transformer cette dernire, soit avoir recours lquivalent non
paramtrique de lANOVA, le test de Kruskall-Wallis.
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Conditions dapplication dune ANOVA

Hypothse 3 : lHomoscdasticit
Les variances dans les p populations compares sont les mmes.
, Le facteur A agt seulement sur la moyenne de la variable Y et
ne change pas sa variance.
Plusieurs tests diffrents permettent de vrifier lgalit des
variances relatives aux p populations compares :
H0 : 1 = 2 = = i = = p =

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Conditions dapplication dune ANOVA


Hypothse 3 : lHomoscdasticit (suite)
Le test de Levne est le test le plus satisfaisant pour effectuer la
comparaison multiple de variances mais sa ralisation est assez
longue car il correspond une ANOVA1 sur les rsidus eij .
Le test de Bartlett est ddi la comparaison multiple de variances
avec un nombre de rptitions ni diffrent selon les modalits i du
facteur. Mais ce test est trs sensible lhypothse de normalit des
p populations (peu robuste).
Le test de Hartley est ddi la comparaison multiple de variances
avec un nombre de rptitions ni identiques selon les modalits i du
facteur. Mais ce test est trs sensible lhypothse de normalit des
p populations (peu robuste).
On note que si lhtrognti entre variances est trs importantes,
on peut avoir recours aux statistiques non paramtriques, test de
Kruskal-Wallis.
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Robustesse dune ANOVA

Hypothses
Normalit de Y
Homoscdasticit des
p distributions
Indpendance des
p distributions

Test
Test du 2
dajustement
Test de Levne
ou de Bartlett
Plan exprimental

Robustesse
Trs robuste si indpendance
et galit des variances
Trs robuste
lingalit des variances
Pas robuste

On note cependant que lanalyse de variance un facteur contrl est


relativement peu sensible lingalit des variances ainsi qu la non
normalit lorsque les chantillons compars sont de grandes tailles.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Modle de lanalyse de la variance


Sous lhypothse dhomognit des donnes, lANOVA un facteur
teste leffet dun facteur contrl A ayant p modalits sur les
moyennes dune variable quantitative Y .
Lhypothse nulle teste est la suivante : il ny a pas deffet du
facteur A et les p moyennes sont gales une mme moyenne
H0 : 1 = 2 = = i = = p =
Sous lhypothse H0 , on a alors
yij = + eij
avec eij sont des variables alatoires indpendantes suivant une
mme loi Normale N (0, 2 )
, Les rsidus eij correspondent aux fluctuations exprimentales
pour chaque valeur de la variable yij mesure : Sous
lhypothse eij N (0, 2 ), on montre que yij N (, 2 ).
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Modle de lanalyse de la variance


Sous lhypothse dhtrognit des donnes, lhypothse
alternative est la suivante : il y a un effet du facteur A et il existe
au moins deux moyennes significativement diffrentes.
H1 : il existe i 6= j
Sous lhypothse H1 , on a alors yij = i + eij = + ai + eij
avec eij sont des variables alatoires indpendantes suivant une
mme loi Normale N (0, 2 ) et ai est leffet de la modalit i du
facteur A sur la variable Y
, Sous lhypothse que eij N (0, 2 ), on peut montrer que
yij N ( + ai , 2 ). Ainsi il existe une diffrence entre les
moyennes de la variable selon les modalits du facteur
control.
, On note que tester lhypothse nulle "absence deffet sur
facteur A" revient tester H0 : les ai sont tous nuls.
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Equation fondamentale de lANOVA

Estimation des paramtres des modles


Sous H0 : yij = + eij
p

i
X
1 XX
yij avec n =
ni

b = y o y =
n i=1 j=1
i=1

Lensemble des donnes du tableau peuvent tre estimes partir


de la moyenne totale des yij laquelle sajoute la part dalatoire
dans les mesures eij .

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Equation fondamentale de lANOVA

Estimation des paramtres des modles (suite)


Sous H1 : yij = + ai + eij

b+b
ai = y i o y i =

ni
1 X
yij
ni j=1

Ainsi,
b
ai = y i y
et
ebij = yij
bb
ai = yij y i

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Equation fondamentale de lANOVA


Dcomposition de la variation totale
Lquation fondamentale sur laquelle se base lanalyse de variance est
p X
ni
X

p X
ni
X

(yij y) =

p
X

(yij y i ) +

i=1 j=1

i=1 j=1

{z

SCEtotale

ni (y i y)2

i=1

{z

SCEintra

{z

SCEinter

o
? SCEtotale : la somme des carts totaux ou la variation totale = ns2y
? SCEintra : la somme des carts rsiduelles ou la variation intra
(interne chaque modalit)
? SCEinter : la somme des carts lis aux effets du facteur A ou la
variation inter (entre modalits).
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Equation fondamentale de lANOVA

Dcomposition de la variation totale

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Equation fondamentale de lANOVA


Le rapport de corrlation
Le rapport de corrlation donne la part de la variabilit totale des
donnes explique par leffet du facteur A :
2 =

SCEinter
SCEtotale

? Cest un indice de liaison, pas ncessairement linaire entre les


variables tudies qui varie entre 0 et 1.
? Il mesure la qualit de lajustement des effets du facteur au travers
des moyennes.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Application de lquation fondamentale de lANOVA

? Lanalyse de variance un facteur teste leffet dun facteur


contrl A ayant p modalits sur les moyennes dune variable
quantitative Y .
? Le test dhypothse ralis est le suivant :

H0 : 1 = 2 = = i = = p =
H1 : il existe i 6= j
? Pour raliser ce test, on peut faire recours la loi de Fisher
(test de Fisher).

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Application de lquation fondamentale de lANOVA


? En effet, sous lhypothse de normalit nous avons
yij = i + eij

yij N (i , 2 )

? Ainsi, nous avons


yi =

ni
2
1 X
yij N (i , )
ni
ni
j=1

i
1 XX
2
y=
yij N (, )
n
n

i=1 j=1

avec
n=

p
X

ni et =

i=1
Mohammed El Haj Tiraritirari@insea.ac.ma

1X
ni i
n
i=1

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Application de lquation fondamentale de lANOVA


? Par consquent, sous lhypothse :
H0 : 1 = 2 = = i = = p =
nous avons
yij N (, 2 ) = zij =

y i N (,

yij
N (0, 1)

y
2
) = z i = ni i
N (0, 1)
ni

y N (,

y
2
) = z = n
N (0, 1)
n

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Application de lquation fondamentale de lANOVA


? En tenant compte du modle, la dcomposition de la variation
totale peut tre vue comme
p X
ni
X

(yij y)2 =

ni (y i y)2 +

i=1

i=1 j=1

p
X

{z

SCEtotale

p X
ni
X

(yij y i )2

i=1 j=1

{z

SCEf acteur

{z

SCEresidu

? Nous avons donc sous lhypothse H0 ,


" p
!
#
p
X
X
2
2
2
2
SCEf acteur =
ni (y i y) =
z i z 2 2p1
i=1

SCEresidu =

p X
ni
X

i=1

p
ni
X
X

2

zij
z 2i 2 2np
(yij y i )2 = 2

i=1 j=1

Mohammed El Haj Tiraritirari@insea.ac.ma

i=1

j=1

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Application de lquation fondamentale de lANOVA


? Ainsi, les variances relatives chaque terme sont
Variance totale :
2
Stotale
=

SCEtotale
n1

avec n =

p
X

ni

i=1

Variance due au facteur A : qui est un estimateur sans biais de


si H0 est vraie
Sf2acteur =

SCEf acteur
p1

Variance rsiduelle : qui est un estimateur sans biais de


quelque soit le modle
2
Sresidu
=

Mohammed El Haj Tiraritirari@insea.ac.ma

SCEresidu
np

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Application de lquation fondamentale de lANOVA


? La Loi de Fisher tant dfini comme le rapport de deux lois du 2
divise par leur degr de libert
, Sous lhypothse H0 ,

F =

Sf2acteur
=
2
Sresidu

Sf2 acteur
2
Sresidu

suit une loi de Fisher :

SCEf acteur
p1
SCEresidu
np

2p1
F (p 1, n p)
2np
S2

? En pratique, on obtient une valeur du rapport Sf2acteur quon


residu
compare une loi de Fisher F , en se donnant un risque .
, Si la valeur obtenue est trop grande, on en dduit que le
rapport ne suit vraisemblablement pas une loi de Fisher F et
que le facteur A a un effet.
On conclut donc une diffrence des moyennes.
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Table de lANOVA

La table dANOVA permet de rsumer les calculs ncessaires :


Source de
la variance
Inter-classes
Intra-classes
Total

Somme des
carrs des carts
SCEf acteur
SCEresidu
SCEtotal

Degr de
libert
DDLf
DDLr
DDLtotal

Mohammed El Haj Tiraritirari@insea.ac.ma

Variance
SCEf acteur
DDLf
SCEresidu
=
DDLr

2
Sf
=
2
Sr

F
F =

p-value
2
Sf
2
Sr

Analyse de la Variance Partie 1

PH0 (F > Fobs )

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Exemple illustratif dANOVA un facteur


Pour illustrer la mise en oeuvre de lANOVA, considrons lexemple de
lleveur qui souhaite acheter de nouvelles vaches pour sa production
laitire. Il possde trois races diffrentes de vaches et se pose donc la
question de savoir si la race est importante pour son choix. Il possde
comme informations la race de chacune de ses btes (cest la variable
explicative discrte ou facteur) et leurs productions de lait journalires
(cest la variable expliquer continue). Ces productions sont :
La race des vaches
Race A Race B Race C
20,1
22,6
31,2
19,8
24,1
31,6
21,3
23,8
31,0
20,7
22,5
32,1
23,4
31,4
24,5
22,9
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Exemple illustratif dANOVA un facteur


? Nous avons donc,
Race
A
B
C
Total

Taille
4
7
5
25,1875

Moyenne
20,475
23,4
31,46
32,1

Variance
0,4425
0,5933
0,1780
20,8012

? La table dANOVA est la suivante :


Source de
la variance
Inter-classes
Intra-classes
Total

Somme des
carrs des carts
307,918
5,6
313,518

Degr de
libert
2
13
15

Mohammed El Haj Tiraritirari@insea.ac.ma

Variance

p-value

153,959
0,431

357,44

< 0, 001

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS


? Pour illustrer la mise en oeuvre dune ANOVA avec SPSS, les
donnes utilises correspondent une tude ralise sur 48 enfants
et adolescents souffrant dun traumatisme suite un accident
domestique ou un accident de circulation.
? Lobjet de cette tude est de mesurer leffet du traitement
administr (4 types de traitement) sur la gurison du traumatisme
engendr par laccident.
? Le degr du traumatisme engendr par laccident est mesur en
posant 10 questions sur les enfants victimes dun accident o, pour
chaque question, ils doivent rpondre en suivant une chelle variant
de 0 5. Plus le total des rponses sur les dix rponses est grand,
plus le degr des troubles subis est important.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS

? Les informations observes sont les suivantes :


Genre : Genre de lenfant (1=fille, 2=garon).
Accident : Type daccident (1=accident de la circulation,
2=autre type daccident).
Traitement : Type de traitement (1=traitement1,
2=traitement2, 3=traitement3, 4=traitement4).
Age : Age de lenfant au moment du laccident.
Temps : Temps coul entre laccident et le dbut du
traitement (en mois).
SveritAvant : Sverit du traumatisme avant le traitement.
SveritAprs : Sverit du traumatisme aprs le traitement.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS


? Ainsi, afin de pouvoir mesurer leffet du traitement administr sur la
svrit, nous allons la variable :
Amlioration = SveritAvant - SveritAprs
? Le test de leffet du type du traitement administr peut tre ralis
avec une ANOVA un facteur effet fixe o "Amlioration" est la
variable dpendante et la variable "Traitement" est le facteur.
? On note que lors de la ralisation dune ANOVA, il faut toujours
vrifier au moins lhypothse de Normalit ainsi celle de
lHomoscdasticit pour la variable dpendante.
? Sous SPSS, la vrification de ces deux hypothses peut se faire en
choisissant :
Analyse| Statistiques descriptives|Explorer : Diagrammes

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS


Hypothse de Normalit : test de Kolmogorov Smirnov
? Le test de conformit de Kolmogorov Smirnov est parmi les tests les
plus utiliss pour tester la normalit des donnes.
? Ce test se base sur la statistique
D = sup | Fs (x) FT (x) |
x

qui reprsente le plus grand cart entre la frquence observe Fs (x)


et la frquence thorique FT (x) de la distribution Normale.
? La valeur observe de la statistique D est compare avec sa valeur
thorique (quon trouve dans la table statistique relative la
statistique D de Kolomogorov).
, On dcide que la distribution de la variable tudie ne suit pas
une loi normale quand la valeur observe de D est suprieure
sa valeur thorique.
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS


Hypothse de Normalit : test de Kolmogorov Smirnov

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS


Hypothse de Normalit : test de Kolmogorov Smirnov

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS


Hypothse de Normalit : test de Kolmogorov Smirnov

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS


Hypothse dHomoscdasticit : test de Levne
? Le test de Levne est parmi les tests les plus utiliss pour tester
lhomoscdasticit travers la comparaison des variances dans les p
chantillons relatives aux modalits du facteur A de lANOVA.
? Ce test consiste tester lhypothse
H0 : 12 = = i2 = = p2
contre lhypothse alternative H1 : il existe i2 6= j2
? Sous SPSS, ce test peut tre ralis travers la case
Dispersion/Niveau avec test de Levene
de la bote de dialogue obtenue partir de
Analyse| Statistiques descriptives|Explorer : Diagrammes

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS


Hypothse dHomoscdasticit : test de Levne

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS


Hypothse dHomoscdasticit : test de Levne

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS


Hypothse dHomoscdasticit : test de Levne

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mise en oeuvre dune ANOVA un facteur avec SPSS

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)

? Lanalyse de variance permet simplement de rpondre la question


de savoir sil y a des diffrences entre les moyennes, elle ne permet
pas de dterminer o ces diffrences se situent.
? Or, lobjectif du chercheur est moins de savoir sil existe des
diffrences significatives que didentifier quelles diffrences le sont
effectivement et dans quelle direction.
, Il est donc important de disposer dune procdure permettant
de dissocier les diffrences rellement significatives de celles qui
ne le sont pas.
? Cest pourquoi on effectue gnralement des comparaisons multiples
ou des contrastes lorsquun facteur a plus de trois niveaux.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)


? Les comparaisons multiples a posteriori consistent effectuer des
comparaisons entre tous les groupes de sujets correspondant un
facteur. Par exemple, dans le cas dun facteur trois valeurs, il y a
trois comparaisons qui sont faites.
? Toutefois, ces comparaisons sont effectues en contrlant le risque
deffectuer une erreur de premire espce = P (RH0 | H0 vrai),
cest--dire de dclarer que des moyennes sont diffrentes alors
quen fait elles ne sont pas.
? On note que lerreur tend augmenter avec le nombre de
comparaisons effectuer, si on garde le mme seuil pour chaque
comparaison.
, Effectivement, sil faut faire 3 comparaisons, on risque de se
"tromper" 3 fois, si on en fait 6, on risque de se "tromper" 6
fois. Si par exemple, on prend un seuil de 0.01 dans le premier
cas, lerreur risque dapprocher 0.03 dans le premier cas mais
0.06 dans le second.
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)


? Les tests de comparaisons multiples a posteriori est une
gnralisation k populations du test t de Student de comparaison
de moyennes de deux chantillons avec ajustement de lerreur.
? Pour maintenir lerreur de premire espce , les tests de
comparaisons mutiples a posteriori renforcent lexigence du seuil
choisi pour chaque comparaison en fonction du nombre de
comparaisons effectuer.
, Sil y en a 6, ils pourraient par exemple exiger un seuil de
0.05/6 alors que sil y en a deux, un seuil de 0.05/2 (ceci est le
cas particulier du test de Bonferroni).
, Par consquent, mesure que le nombre de comparaisons
augmente, ces tests exigeront une diffrence plus importante
entre deux conditions pour dclarer que celle-ci est
significative.
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)


? Il existe plusieurs tests de comparaisons multiples a posteriori. Deux
approches sont considres :
modifier le risque de premire espce pour que le risque total
(risque exprimental) demeure 0.05 : mthode de
Bonferroni.
adapter la statistique de test (plus conservateur) : mthode
HSD de Tukey.
? Parmi les tests de comparaison multiples a posteriori,
le plus conservateur est le test "Honestly Significant
Difference" (HSD) de Tukey : il contrle trs bien lerreur mais
risque de ne pas dtecter des diffrences significatives.
le plus tolrant est le "Least Significant Difference" (LSD) : ce
test risque de dtecter des diffrences qui nexistent pas.
le test de Student Newman Keuls (SNK) est un compromis
entre les deux prcdents.
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)


Exemple 1 : Test de Bonferroni
Objectif : Comparer deux deux toutes les moyennes possibles des p
classes.
1

Calculer le nombre de comparaisons : nc = p(p 1)/2

Erreur de premire espce globale : = 5% = 0, 05

Erreur pour chaque test : = 0, 05/nc

Hypothses : H0 :

Statistique de test : tobs =

contre

i = j
r

i 6= j

y i y j


1
1
n + nj

Sr2
6

H1 :

Rgle de dcision : Accepter H0 si | tobs |< tnp,10 /2

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)


Exemple 2 : Test de Student-Newman-Keuls
Objectif : Classer les traitements par classes qui sont significativement
diffrentes. La mthode est la suivante :
Etape 1 : Ordonner les moyennes et calculer toutes les diffrences
deux deux entre moyennes.
Etape 2 : Calculer pour r = 2 p les diffrences minimum
significatives Wr qui est une fonction de lcart y i y j avec
r = i j + 1.
Etape 3 : Dans le tableau des diffrences, rechercher toutes les
diffrences significatives en fonction de leur distance r.
Etape 4 : Classer les traitements par groupes significativement
diffrents.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)


Mise en oeuvre avec SPSS

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)


Mise en oeuvre avec SPSS

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)


Mise en oeuvre avec SPSS : Test de Bonferroni

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)


Mise en oeuvre avec SPSS : Test de SNK

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)


Mise en oeuvre avec SPSS : Test de Tukey

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)


Mise en oeuvre avec SPSS : Test LSD

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les comparaisons multiples a posteriori (ou post hoc tests)

Mise en oeuvre avec SPSS : Test de Dunnett

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mthode des contrastes

? Comme nous lavons vu, les tests de comparaisons multiples


effectuent TOUTES les comparaisons et maintiennent le risque
deffectuer une erreur de premire espce en dfinissant un seuil plus
exigeant pour chaque comparaison.
? Une autre faon de maintenir ce risque est tout simplement
deffectuer moins de comparaisons. Cest la solution offerte par les
contrastes.
? Lun des intrts des contrastes rside dans le fait quils permettent
soit de comparer deux moyennes entre elles, soit de comparer
plusieurs moyennes simultanment une autre.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mthode des contrastes


? Dans le cas dun facteur p valeurs, un contraste est dfini par
L=

p
X

ci i

i=1

avec

p
X

ci = 0

i=1

Exemples : L = 1 3 , L = 1 + 2 3 4
? Deux contrastes sont orthogonaux si le produit de leur coefficients
de contraste est nul.
, On peut construire p 1 contrastes orthogonaux pour un
facteur q valeurs.
? Les contrastes sont des mthodes quon qualifie da priori car ils
sont guids par des hypothses que lon a formules pralablement
ltude elle-mme. On les dfinit donc sans avoir observ les
moyennes et sur base uniquement de ses hypothses thoriques.
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mthode des contrastes


? Cest pour cela, on opte pour les comparaisons multiples lorsquon
na pas dhypothse(s) claire(s) quant aux diffrences que lon
compte observer ou lorsque la configuration des rsultats va
lencontre des hypothses.
? Lavantage des contrastes rside dans le fait quils sont plus
puissants que les comparaisons multiples : ils permettent donc plus
facilement de dtecter une diffrence.
? En revanche, ils prsentent le dsavantage dtre trs slectifs : on
ne peut effectuer que quelques contrastes alors que les comparaisons
multiples impliquent tous les groupes. En effectuant des contrastes,
on sinterdit donc de comparer certains groupes, bien que cela
puisse tre intressant.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mthode des contrastes


Test dhypothses sur un contraste
Soit un contraste

L = c1 1 + c2 2 + + cp p .

Lhypothse nulle :
H0 : L = c1 1 + c2 2 + + cp p = 0
contre lhypothse alternative
H1 : L 6= 0

Statistique de test : Lobs = c1 y 1 + c2 y 2 + + cp y p


Lobs
tobs = r 
Pp
Sr2
i=1

a2i
ni

tnp
 |{z}
sous H0

Rgle de dcision : Accepter H0 si | tobs |< tnp,1/2

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mthode des contrastes


Mise en oeuvre avec SPSS
? Pour illustrer la mise en oeuvre de la mthode des contrastes avec
SPSS, nous allons utiliser les donnes de ltude ralise sur 48
enfants souffrant dun traumatisme suite un accident.
? On se place dans le cas o le medecin qui traite ces 48 enfants veut
tester lutilisation de deux traitements la fois sur une mme
personne et se demande sur la diffrence entre leffet dutiliser les
traitements 1 et 2 et celui dutiliser les traitements 3 et 4.
, Pour cela, il peut faire recours lutilisation du contraste
L = 1 + 2 3 4 o le test dhypothses utilis est
H0 :

L = 1 + 2 3 4 = 0 contre H1 : L 6= 0

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mthode des contrastes


Mise en oeuvre avec SPSS

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Mthode des contrastes


Mise en oeuvre avec SPSS

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Analyse de la Variance un facteur


alatoire

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Modle thorique
Nous avons vu que dans le cas dune analyse de la variance un
facteur fixe, le modle linaire correspondant est donn par
yij = i + ij = + i + ij
o
yij est la valeur observe pour le sujet j du groupe i.
est la moyenne gnrale.
i est linfluence du traitement Ai sur le groupe i
(i = i ).
ij est lerreur ou les rsidus qui suit la loi N (0, 2 ).
Sous ce modle, nous avons
yij N (i , 2 )

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Modle thorique
Dans le cas dune analyse de la variance effet alatoire, les
modalits du facteur sont elles-mmes alatoires et le modle
linaire correspondant devient :
yij = + i + ij
avec
i N (0, 2 ) pour i = 1, . . . , p.
ij N (0, 2 ) pour i = 1, . . . , p et j = 1, . . . , ni .
i et ij sont indpendants pour i = 1, . . . , p et j = 1, . . . , ni .
Sous ce modle, nous avons
yij N (, 2 + 2 )
On dit alors que 2 et 2 sont les composantes de la variance. Une
partie de la variabilit de Y est explique par la variabilit entre les
traitements (2 ), lautre par la variabilit rsiduelle ( 2 ).
Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Test dhypothses
Dans lANOVA un facteur fixe, on considre lhypothse
H0 : 1 = 2 = = p
Cette hypothse na plus de sens dans le contexte dune ANOVA
un facteur alatoire puisque les modalits sont elles-mmes
alatoires.
On veut tester si le facteur influence la variabilit de Y . Le test
dhypothses scrit donc
H0 : 2 = 0

contre

H1 : 2 > 0

Bien que les deux scnarios soient trs diffrents lun de lautre, on
utilise la mme rgle de dcision dans les deux cas, cest dire :
On rejette H0 si F =

2
Sinter
=
2
Sintra

Mohammed El Haj Tiraritirari@insea.ac.ma

SCEinter
p1
SCEintra
np

> Fp1,np,1

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les statistiques et la rgle de dcision

En effet, nous avons


yij = + i + ij = yij N (, 2 + 2 )


ni
ni
1 X
2
1 X
2
yi =
yij = + i +
ij = y i N , +
ni j=1
ni j=1
ni
p

i
1X
1 XX
y = +
i +
ij = y N
n i=1
n i=1 j=1

Mohammed El Haj Tiraritirari@insea.ac.ma

p
X
2
n2i
,
+ 2
n
n2
i=1

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les statistiques et la rgle de dcision


Ainsi,

ni
1 X
yij y i = ij
ij
ni j=1

avec
ij N 0, 2

et



ni
1 X
2
ij N 0,
ni j=1
ni

Nous avons donc


SCEintra

2
ni
X
1
2
ij
(yij y i ) =
ij
ni j=1
i=1 j=1
i=1 j=1

p X
ni
X

p X
ni
X

= 2 2np

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Les statistiques et la rgle de dcision


De plus, sous lhypothse
H0 :

2 = 0

nous avons

yi N

2
,
ni


et

yN

2
,
n

Nous avons donc


SCEinter =

p
X

ni (y i y) = 2 2p1

i=1

Par consquent,
F =

Sf2acteur
=
2
Sresidu

SCEinter
p1
SCEintra
np

Mohammed El Haj Tiraritirari@insea.ac.ma

2p1
Fp1,np
2np

Analyse de la Variance Partie 1

Introduction
Analyse de la Variance un facteur

Anova un facteur fixe


Anova un facteur alatoire

Remarques

La dmarche pratique est donc la mme que dans lanalyse un


facteur effets fixes.

Cependant, les comparaisons multiples, lorsque lhypothse


alternative (H1 ) est accepte, nont plus de sens et ne doivent pas
tre effectues.

La normalit des rsidus ne peut plus tre teste.

En revanche, la normalit des Yij , quantits qui sont estimes


par yij y, peut tre teste.

Mohammed El Haj Tiraritirari@insea.ac.ma

Analyse de la Variance Partie 1