You are on page 1of 7

BASES THEORIQUES DE L’ANOVA

Le but de ce document est de permettre une manipulation du test Anova de Statistica en connaissant les principes du test et donc en utilisant de façon approprié les résultats. Ce document ne porte que sur l’Anova à mesures répétées. 1. Le principe de l’Analyse de la Variance (ANalysis Of VAriance – ANOVA) Un médecin peut connaître l’effet de 2 médicaments distincts sur une maladie. Il suit le protocole suivant : G1 : médicaments n°1 à 10 malades G2 : médicaments n°2 à 10 malades G3 : rien à 10 autres malades (groupe contrôle)

Il mesure une variable lui donnant une information sur l’état des patients. Pour connaître l’effet des 3 traitements il observe : a) les valeurs absolues de chaque groupe (ex : G1 a une valeur moyenne de 10, G2 une valeur moyenne de 12 et G3 une valeur moyenne de 9). b) Pour savoir si ces résultats sont dus au hasard ou au traitement, il regarde si la variabilité (variance) des valeurs entre les groupes est supérieure à celle au sein de chaque groupe. Cette comparaison des variances (inter-groupe et intra-groupe) est faite par le calcul du ‘F’ : F = Variance entre les groupes / Variance dans les groupes (1)

Plus la variance entre les groupes est supérieure à celle dans les groupes, plus l’effet du facteur testé (ici le médicament) à des chances de na pas être du au hasard. En bref, plus le F est élevé, plus il y a de chance que le facteur testé ait un effet statistiquement significatif. !! On peut conclure sur la significativité du résultat seulement en comparant le F calculé à un F théorique. En effet, il ne suffit pas de voir si le F calculé est important ou non, sa valeur ne peut être interprétée qu’en étant comparée à un F théorique. Ce F théorique dépend de la configuration expérimentale de l’étude (nombre de participants, d’essai, de conditions). Le F théorique dépend plus précisément, du nombre de degré de liberté (ddl) de la source du nominateur de Eq. (1) (i.e. ; la variance entre les groupes) et du nombre de ddl de la source du dénominateur de Eq. (1) (i.e. ; la variance dans les groupes).

Le F calculé (celui qui apparaît dans les tableaux de résultats de Statistica est en rouge si l’effet est statistiquement significatif). alpha=0. Si le F est en rouge. Statistica effectue la comparaison entre le F calculé et théorique. pour un nombre de ddl du nominateur donné et pour un nombre de ddl du dénominateur donné. De plus.01 ou 0. il y aura 95% de chance qu’il ne soit pas du au hasard) . .01 (si l’effet est significatif. il y aura 99% de chance qu’il ne soit pas du au hasard). a 2 valeurs possibles selon le niveau d’erreur alpha choisi : alpha=0. il nous indique la probabilité (p) associé à ce F calculé en considérant le F théorique. Statistica nous renseigne sur le F calculé à partir des données expérimentales. Nous pouvons en conclure un effet significatif de la variable.05 (si l’effet est significatif. Le logiciel compare de lui-même les valeurs du F calculé et du F théorique.Ce F théorique se lit dans la table de Fisher (Figure 1) : Figure 1: Table de Fisher Le F théorique. !! Dans Statistica ce F théorique n’est pas à lire dans cette table.05 le plus souvent). cela signifie que p est inférieur au seuil critique (0.

le facteur testé est d’autant plus significatif qu’il est responsable d’une quantité importante de variance des résultats. . D’après ce protocole. un autre un tiers une cure de 14 jours et le dernier un tiers une cure de 21 jours). durée de la cure (facteur B.2. le médecin posera 3 questions : effet d’interaction (A*B) . effet simple de B. Ainsi. un tiers du groupe subit une cure de 7 jours. Lecture des résultats a) Intensité de l’effet du facteur testé L’Anova mesure en ‘variance’. Si il y a une interaction. Le nouveau protocole de traitement peut se schématiser ainsi : médicaments (facteur A. effet simple de A . les effets de différents facteurs ne sont pas additifs (l’effet d’un facteur dépend de l’effet d’un autre facteur). Le médecin veut savoir si la durée de la cure est un facteur pouvant causer une différence dans les résultats de guérison. nombre : 3). la lecture des résultats se fait dans cet ordre (on observe les effets d’interaction avant les effets simples). nombre : 2) . Cette Intensité de l’effet se mesure par le R² (IE : ‘Intensity of Effect). Lorsqu’on teste plus d’un facteur. b) Effets d’interaction et effets simples Le médecin aurait également pu donner 2 médicaments différents sur 3 durées de cure différentes (dans chacun des 2 groupes de malades prenant un médicament.

01 *** : significativité avec p < 0.05 : erreur alpha .61). p<.10)=14. IE=57%).03.3. 14. F(1.05. !! les conventions d’écriture peuvent varier d’une discipline à l’autre.001 4. 1.03 : résultat du F calculé . IE=57% : Intensité de l’Effet b) Si l’effet du facteur testé est statistiquement non significatif : Le médicament n°2 n’influence pas la variable du traitement (Fs < 1. Rappels a) Mesures répétées / Mesures indépendantes Mesures répétées : Les mêmes sujets sont testés sur plusieurs conditions. Mesures indépendantes : Plusieurs groupes d’individus sont étudiés. . C’est surtout une notion de groupes distincts qui sont comparés.05 ** : significativité avec p < 0. l’effet d’un test Anova se note de la façon suivante : a) Si l’effet du facteur testé est statistiquement significatif : Le médicament n°1 influence la variable du traitement (F(1.10) : 1 & 10 correspondent aux ddl du nominateur et du dénominateur .61 : valeur du F calculé. p<. c) Les étoiles indiquant le niveau de significativité (pour les graphiques) : * : significativité avec p < 0. Conventions d’écriture Dans le corps d’un article.

86 b1 Cond 3 0.73 a3 b2 Cond 6 0.01 0.67 0.01512667 0.00871 0.49 0.768 Exemple de tableau Anova correspondant : Source A AS B BS AB ABS S Tot SC 0.05372 0. CM : variance (Carré Moyen) .38 0. Dll : degrés de liberté .76 1 M oy 0.48936667 0.64 0.43258 0.04 b1 Cond 5 0.14349333 0.638 0.48 b2 Cond 2 0.590 0.96 0.37 0.58 0.44 0.16 36.21 0.770 0.29601666 dll CM 2 8 1 4 2 8 4 29 F 0. par ex 5 si un participant à fait 5 essais) .0540725 0.01742 0. F : F de Fisher calculé . P : erreur alpha .03025333 0.68 1.61 0.b) Calcul de la variance La variance (CM ou ‘Carré Moyen’) est la somme des écarts à la moyenne normalisée par les effectifs.73 0.51 0.66 0.38 0.94 0.03229583 0.4 0.42 0. M : moyenne des n valeurs) N : nombre de participants c) Tableau de l’Anova Exemple de tableau de valeurs d’un protocole avec 2 facteurs (A & B) : facteur A facteur B S1 S2 S3 S4 S5 a1 b1 Cond 1 0.02 - SC : Somme Carrées (des écarts à la moyenne) .43 0.48936667 0.88 0.04469023 0.05 ns R² 0. CM = (Yn – M)² / N – 1 Yn : valeur (il y a n valeurs.61 0. R² : Intensité de l’effet .01343 0.663 0.12918333 1.01793667 0.86 0.84 p ns < 0.74 1.5 a2 b2 Cond 4 0.64 0.8 0.

71 1 710. facteur B : 2 modalités .00 229.27 0.81 3 0. Dans l’exemple ci-dessous.58 10 5.24) de la variance totale.86 10 56. Ici.3127 0.77 Le facteur B explique 77% de la variance totale. il peut être intéressant de calculer son intensité.2277 0.32 1.86 0.39 12. e) Calcul des ddl Le protocole : facteur A : 4 modalités . par exemple.Dans Statistica.000001 58. Il faut donc voir le R² comme une information complémentaire du F.58 30 3. le tableau Anova se présente de façon un peu différente : ANOVA SC ddl CM F p 12957.19 Source Ord Orig Erreur Facteur A Erreur Facteur B Erreur A*B Erreur Le R² n’est pas donné.000000 563.22 710.24 ( !! ne pas prendre en compte ‘Ord Orig’ et ‘Erreur de Ord Orig’) IE (B) = 0. un effet peut être statistiquement non significatif et expliquer pourtant une part non négligeable de la variance totale.71 SC totale = 915. le calcul de l’intensité de l’effet du facteur B : SC entre = 710. Mais dans d’autres cas.00 1 12957.60 30 1.96/915. . !! Même lorsque l’effet d’un facteur testé n’est pas statistiquement significatif. le facteur A n’est pas statistiquement significatif et il explique 1% (12. d) Calcul de l’intensité d’effet (IE ou R²) R² = SC entre les groupes / SC totale.96 3 4.876401 35.71 121.279392 96.7912 0.3419 0.

- nombre de participants S : 11 (N) Formules des calculs des ddl pour chaque SOURCE : A = A-1= 4-1=3 B = B-1=2-1=1 AB = (A-1)*(B*1)=4-1*2-1=3 AS = (A-1)*(S-1)=4-1*11-1=30 BS = (B-1)*(S-1)=2-1*11-1=10 ABS = (A-1)*(B-1)*(S-1)=4-1*2-1*11-1=30 S = N-1=11-1=10 Totale = somme de ttes les précédentes .