Validation Des Plans D'experiences

Validation du modèle par les plans d’expériences
Dédicace
A mes très chers parents.
A mes très chères sœurs.
Aucun mot ne pourra exprimer mes sentiments envers vous.
A toute ma famille.
A tous mes chers ami(e) s : avec tous mes souhaits de réussir,
Pour tout votre soutien et votre amitié je vous dis MERCI.
A tous ceux qui m’aiment

A tous ceux que j’aime
Je dédie ce travail…
Labaaj iliass
Labaaj iliass -1- Master AMTI2006/2008

Validation des modèles de plans d’expériences
Remerciements
C’est agréable de m’acquitter d’une dette de reconnaissance auprès de toutes les
personnes, dont l’intervention au cours de ce projet, a favorisé son aboutissement.
Ainsi, Je suis très reconnaissant à Monsieur S. KABBAJ, responsable du master
analyse mathématique et traitement d’information pour son soutien et ses
encouragements et de m’avoir accepté dans cette formation.
Sans omettre à présenter mes vifs remerciements à Monsieur Y.ELKETTANI,
Professeur à la Faculté des Sciences Kenitra , pour la confiance qu’il a eu en moi, le
soutien continu qu’il m’a prodigué et ses conseils pertinents tout au long de la
réalisation de ce travail.
Il m’est agréable d’exprimer ma profonde gratitude à Messieur Fabrice
Gouvelard ingénieur à la société stat soft, Laghzouli Med pour leur soutien et leur
aide.
Je suis très reconnaissant à ma famille et spécialement mes sœurs, pour leurs
soutiens et leurs encouragements.
Mes vifs remerciements vont également à Mr. EL AMRANI Mohammed Amine
pour son soutien et son encouragement, j’apprécie beaucoup son aide et j’aime bien lui
adresser mes sincères remerciements.
Labaaj iliass -2- Master AMTI:2006/2008

Hommage à tous les professeurs du master ANALYSE MATEMATIQUE ET
TRAITEMENT DE L’INFORMATION, qui ont affûté notre formation, j’espère que ce
travail leur donnera pleine satisfaction.
Je profite cette occasion pour remercier mes collègues du Master ANALYSE
MATEMATIQUE ET TRAITEMENT DE L’INFORMATION, qu’ils trouvent ici
l’expression de mes respectueuses considérations.
Que tous ceux et celles qui ont contribué de près ou de loin à l’accomplissement
de ce travail trouvent l’expression de mes remerciements les plus chaleureux.
Merci beaucoup pour tous.

Sommaire
LISTE DES ABRÉVIATIONS………………………..
……………………………………………………………….7
LISTE DES ABRÉVIATIONS.................................................................................4
LISTE DES FIGURES..........................................................................................5
RÉSUMÉ 6
I-POURQUOI FAIRE DES PLANS D’EXPÉRIENCES EN INDUSTRIE.........................39
CONCLUSION & PERSPECTIVES.......................................................................85
BIBLIOGRAPHIE..............................................................................................87
Liste des Abréviations
n = le nombre totale d’unités de l’expérience
r = le nombre totale de répétition
k = le nombre d’unités par bloc
b = le nombre de bloc
SAS = Statistical Analysis System
R = est la version gratuite de Splus
Splus = est la mise en oeuvre commerciale du langage S
SCT = somme carrée totale

SCR = somme carrée residuel
SCM = ou SMC somme carré du au modéle
Lof = lack of fit
R² = coefficient de corrélation
Ra² = coefficient de corrélation ajusté
ddl = degré de liberté
F = la valeur du tableau de Fisher
P = la probabilité
Liste des figures
Figure 1 : Boîte à moustache de la réponse Y1 (Biomasse)……………………………...73
Figure 2 : Boîte à moustache de la réponse Y2 (Activité enzymatique)………………...73
Figure 3 : Boîte à moustache de la réponse Y3 (Protéines)………………………….......73
Figure 4 : Boîte à moustache de la réponse Y4 (pH final)……………………………….74
Liste des tableaux

Tableau 1 : Les facteurs testés dans l’expérience …………………………………………….......66
Tableau 2 : Ligne génératrice des matrice de Plackett et Burman (1946)..................................68

Tableau 3 :La ligue génératrice ci-dessous sera donc a première ligne de notre tableau…......68
Tableau 4 :Mode de construction par permutation droit ….........................................................69
Tableau 5 : Exemple de matrice d'expérience pour 11 facteurs à 2 niveau…………..……….69
Tableau 6 : Plan d’expérimentation ( Plackett et Burman 1946) dupliqué et randomisé…..... 70
Tableau 7 : Résultats des expériences, Biomasse, Activité Enzymatique Protéines. pH final…72
Tableau 10: Résultat d'essai de la biomasse………………………………...……………………..75
Tableau 11: L'analyse de la variance de biomasse……………………………………………......76
Tableau 12: Manque d'ajustement (lack of fit) de biomasse……………………………………..77
Tableau 13: Résultat d'essai de l'activité enzymatique…………………………………...………78
Tableau 14: Analyse de la variance de la réponse Y2…………………………..………………...79
Tableau 15: Résultat d'essai de la réponse Y3……………………………………….....................80
Tableau 16:Analyse de la variance de la reponseY3 ……………………………………………..81
Tableau 17: Manque d'ajustement de la réponse Y3 ………………………………………...….82
Tableau 18: Résultat d'essai de la réponse Y4 ……………………………………………….......83
Tableau 19: Analyse de la variance de la réponse Y4 …………………………………………….84
Tableau 20: Manque d'ajustement de la réponse Y4 ……………………………………………..85
Résumé

La présente étude est réalisée dans le cadre du stage du Master Analyse

Mathématique et Traitement de l’Information de la Faculté des Sciences de
Kénitra. Elle a pour objet de présenter les plans d’expériences et plus
particulièrement les outils de validation de ces modèles.
Les plans d’expériences constituent une approche qui permet d’organiser

les expérimentations à effectuer de manière à pouvoir tirer les conclusions
statistiques sur le phénomène étudié avec une grande précision d’une part et à
partir d’un nombre réduit d’expériences d’autre part et donc avec un coût
moindre.
Ce mémoire expose dans le 1er chapitre la théorie mathématique qui est à la

base des plans d’expérience ainsi que des exemples des plans classiques.
Le deuxième chapitre est consacré aux plans fractionnaires rencontrés dans

l’industrie et le principe de leur construction.
Les outils de validation de modèles font l’objet du chapitre trois. Il s’agit

principalement du coefficient de détermination, de la méthode du manque
d’ajustement et de la transformation de Box – Cox pour stabiliser la variance.
Enfin le chapitre quatre traite une situation réelle développée dans un

laboratoire de biologie avec quinze facteurs qui sont susceptibles d’influencer
la variation de trois variables réponses. Les outils de validations de modèle
développés au chapitre trois ont permis de confirmer le modèle de Plackett et
Burmann ajusté à la situation traitée.
Introduction générale
Depuis une vingtaine d’année, les statistiques ont évalué dans différentes
directions, parmi lesquelles l’analyse des données et les plans d’expériences.

L’analyse de données permet de grands ensembles de données non structurés,

notamment quand les paramètres ne peuvent pas être suffisamment maîtrisés. Ces
méthodes d’analyse permettent d’interpréter des essais déjà réaliser et de décrire les
influences des paramètres mis en jeu, de manière quantitative. Par exemple, tel
paramètre sera fortement ou pas influent sur une réponse d’un système. Sous le
terme analyses de données, sont regroupées l’ensemble des méthodes permettant de
collectter, d’organiser, de résumer, de présenter et d’étudier des données de façon à
en tirer le maximum d’information.
La méthodologie des plans d’expériences permet une recherche expérimentale

planifiée appelée « plans d’expériences ». L’expérimentation ne peut pas etre
quelconque : il doit fournir l’information désirée. Cette démarche expérimentale va
aider l’expérimentateur à structurer sa recherche de manière différente, à
confronter et à valider ses propres hypothèses, à mieux comprendre les phénomènes
étudiés et à solutionner les problèmes. Le succès de cette méthodologie est en partie
lié aux besoins de compétitivité des entreprises mais aussi, à une envie de changer la
manière de faire expérimentations.
A cela, il faut ajouter les techniques d’aide à la formulation d’un problème qui
mettent en évidence l’importance des outils de validations de modèle.
• La première partie traite les différents plans d’expériences classiques. Dans cette
partie, après avoir montré l’intérêt des plans d’expériences par rapport à la méthode
classique des essais et des erreurs, nous décrivons les différentes méthodes du plans
d’expériences classiques.
• La deuxième partie traite les différents plans d’expériences du domaine

industriel.
• La troisième partie traite les différents outils de validation de modèle de

plan d’expérience et de découvrir de nouveaux outils comme par exemple la méthode
de la manque d’ajustement et la méthode de transformation de Box-Cox.
• La quatrième partie est consacrée au développement d’exemple associé

aux méthodes d’analyse de données et aux plans d’expériences.

Chap. I : Présentation des plans

d’expériences classiques
Chapitre I Présentation des plans

d’expériences classiques

I- Introductions
Depuis quelques années, on s’est aperçu que la qualité d’un produit (notion
essentielle dans le monde de l’industrie et dans le monde en général ! ! !) dépendait
principalement de la conception de ce produit ou plus précisément de la
connaissance parfaite de cette conception, plutôt que du produit fini lui-même. En
effet connaître sur le bout du pouce l’élaboration d’un produit permet de prévoir
son évolution au cours du temps en fonction des paramètres influents qu’ils soient
internes ou externes.
Or ces paramètres sont généralement nombreux et difficilement modélisables
par les méthodes classiques de la physique.
Le concepteur a donc besoin d’une méthode «expérimentale», «peu coûteuse en
expériences», qui lui permettra de mesurer et de connaître l’influence de tous les
paramètres et d’en déduire les plus influents. Un plan d’expérience représente
l’outil adéquat qui permettra de répondre à l’ensemble de ces questions.
Les plans d’expériences sont parmi les méthodes statistiques les plus demandées
dans la recherche scientifiques, Ils permettent d'organiser au mieux les essais qui
accompagnent une recherche scientifique et les études industrielles. Ils sont
applicables à un grand nombre de disciplines et à toutes les industries, à partir du
moment où l’on recherche le lien qui existe entre les variables et les réponses.
La compréhension de la méthode des plans d’expériences s’appuie sur deux
notions essentielles, celle d’espace expérimental et celle de modélisation
mathématique des grandeurs étudie.
Dans cette partie, nous allons présenter l’idée forte suivante : la statistique n’a
pas comme objet de « traiter des données » mais également de préparer leur recueil
pour améliorer leur qualité. D’importants gains sont possibles lors de cette étape.
Les méthodes que nous allons présenter s’appliquent à des expériences planifiées
dans lesquelles les principales variables explicatives sont contrôlées, plutôt qu’à des
situations ou les données sont recueillies « comme elles viennent », ce qui est le cas
par l’exemple, dans les enquêtes.
Les deux buts de la planification sont :
1- de permettre une interprétation claire en évitant les confusions.
2- De maximiser la précision de l’expérience.
Pour illustrer 1, prenons l’exemple de la scolarisation en maternelle. Des études

incontestables ont montré que les enfants scolarisés en maternelle ont de meilleurs
Labaaj iliass - 10 - Master AMTI:2006/2008

résultats dans la suite de leur scolarité que des enfants qui ne rejoignent l’école
qu’au primaire. Doit-on en déduire qu’il faut rendre la scolarisation en maternelle
obligatoire pour lutter contre l’échec scolaire ? Une réponse directe par
l’affirmative n’est pas possible. En effet, deux interprétations sont possible : (a) c’est
effectivement la scolarité en maternelle qui améliore les résultat ; (b) dans la France
actuelle, les élèves qui ne vont pas en maternelle sont une minorité qui correspond à
des groupes sociaux bien particuliers, ce qui peut expliquer la différence de réussite
scolaire par l’origine sociale.
Dans cet exemple, on pourra affiner l’analyse en contrôlant toutes les variables
indiquant la situation sociale, avec toujours le risque d’en oublier une. Mais il est
clair que sans cette information complémentaire, les données de départ sont sans
valeur pour répondre à la question. Une solution de type planification à ce problème
serait de définir un groupe d’enfants test et de les répartir « au hasard » en deux
groupes, l’un qui serait scolarisé en maternelle, l’autre non. Bien sûr, pour des
raisons éthiques, ceci est difficilement réalisable ; c’est ce que nous entendions
comme la différence entre une expérience de « labo » et l’utilisation de données
recueillies.
Pour illustrer 2, considérons le problème de la pesée de deux objets A et B avec

une balance sans biais qui donne chaque résultat avec une erreur centrée
indépendante et de variance σ². On suppose que la balance est capable également de
peser les deux objets ensembles.
1- On pèse A et B séparément : le coût de l’expérience est alors celui de deux pesées
et la précision (variance de l’erreur) obtenue sur les pesées de A et de B est σ².
2- On pèse A+B et A-B (on suppose que A est plus lourd que B et que grâce à une
balance de Roberval ou l’utilisation d’une double pesée, on peut peser A-B) ; le
coût de l’expérience est encore de deux pesées et sa précision est σ²/2. les poids
de A = 1/2[(A+B)+(A-B)] et B = ½[(A+B)-(A-B)] sont maintenant obtenus
comme moyennes de deux pesées.
(Source de ces exemples Jean-Marc Azaïs, Jean-Marc Bardet [7] p, 212)
Cet exemple illustre bien le fait que lorsque une certaine latitude est donnée dans
la préparation des expériences fournissant des données, des gains peut être
facilement obtenus.
II- Nécessité de la randomisation
Comme nous allons essayer de vous en convaincre, la randomisation est la seule

méthode qui évite les confusions (en fait elle en contrôle la probabilité), qui permet
de faire une expérience équitable (ce que l’on pourra prouver), et enfin qui permet
d’apprécier la précision des résultat.

Exemple : nous voulons comparer l’efficacité de deux médicaments A et B

contre la grippe sur 40 malades.
Expérience 1 : on administre le médicament A aux 20 premiers malades qui se

présentent. On note leur état d’amélioration, ensuite on administre le médicament B
aux 20 suivants et on note leurs états de santé. A la fin de l’expérience, on calcule les
moyennes des états de santé (supposés pouvoir être quantifiés) et on déclare comme
meilleur le médicament qui a la meilleure moyenne. Pour les raisons suivantes : cette
expérience est désastreuse : (1) durant la durée de l’expérience la maladie, la
température extérieure, la fatigue des personnes qui ont réalisé l’expérience ont pu
évoluer : l’expérience n’est plus équitable en raison de la confusion possible entre les
effets du temps et ceux des médicaments ; (2) certains participants à l’expérience,
malades ou médecins , qui connaissent parfaitement les médicaments administrés
peuvent fausser le résultat inconsciemment : c’est le fameux « effet placebo ».
Expérience 2 : au fur et à mesure qu’un patient arrive en consultation, on alterne

strictement A et B, le plan est donc ABABABABABABAB ;;;; Ce plan est
certainement meilleur que le précèdent mais il souffre encore de deux gros défauts :
(1) la systématicité rend impossible la fameuse méthode dite « double aveugle » , car
le médecin, et dans une certaine mesure, le malade, sauront toujours la nature du
produit administré ; (2) on ne dispose pas de méthode statistique valide pour choisir
entre les situations « A meilleur que B », »B meilleur que A » et « A et B
équivalents » ; il y a donc risque de confusion .
Expérience 3 : on pourrai construire une variante de l’expérience 2 dans laquelle

on essayerait de répartir au mieux les individus entre deux groupes en fonction de
l’âge, du poids, des antécédents. Ce plan, pourtant séduisant a exactement les même
inconvénient que le précèdent.
Expérience 4 : on tire au hasard et de façons équiprobable sans remise 20

personnes parmi les 40 malades et on leur administre le médicament A. Les autres
malades reçoivent le médicament B. Cette expérience (ou plan d’expérience) dite de
randomisation totale, possède de nombreuses qualités en regard des précédentes.
Afin de préciser et prouver ces propos, formalisons cette expérience.
En premier lieu, on imagine avoir administré les deux médicaments à chacun des
malades et on note Rik la réponse du malade k avec k=1……n (ici n= 40) au
médicament i avec i = 1…..t (ici t = 2 ; i = 1 pour le médicament A et i = 2 pour le
médicament B par exemple). On suppose que le modèle est aditif par rapport aux
deux effets malade, noté ai, et médicament, noté mi, soit :
Riℓ= mi + aℓ + εiℓ avec ℓ = 1……n

Avec εiℓ une erreur inconnue (nous verrons que cette erreur n’intervient pas sur
le traitement du modèle). Pour se débarrasser d’une indétermination, on pose la
condition Σ aℓ = 0. Précisons que la réponse Riℓ est purement conceptuelle et n’est
connue qu’en parie ( si elle était totalement connue, l’étude s’arretrait là).
Maintenant on note Yij la réponse du j-eme malade de l’ensemble des malades qui
ont reçu le traitement i, sachant que l’on a choisi « au hasard » les n/t (ici 20)

malades concernés par le traitement i parmi les n. Du modèle précédent, on déduit

que :
Yij = mi + bij + εij
Où l'on peut considérer que les bij (pour i = 1......t et j = 1.....n/t) sont tirés sans
remise dans l'ensemble des aℓ, l = 1...n. Si l'on procède par ordre lexicographique,
b11 sera tiré dans l'ensemble {a1..........an }, puis b12 sera tiré parmi l'ensemble {
a1..........an }\ { b11}, etc...Les réponses Yij sont donc les réponses effectivement réalisées
parmi toutes les Riℓ potentielles. Cette sélection est aléatoire et implique que les bij
sont des effets aléatoires.
En utilisant les propriétés d'un tirage uniforme sans remise et la condition Σ aℓ = 0,
on montre que les bij sont des variables aléatoires à valeurs dans {a1.............an } et
d'espérance nulle, de matrice de variance-covariance ( pour laquelle on a rangé le
vecteur (bij)ij en ordre lexicographique) définie par:
Var(bij ) = 1/n ai ² pour 1≤ i ≤ t et 1 ≤ j ≤ n/t.
Cov (bij, bi’j’) = -1/ n(n-1) ai ² pour ( i , j) ≠ ( i’ ,j’)
Pour traiter ce modèle, on effectue maintenant une analyse de la variance sur

les Yij
du facteur mi. Le peut alors s’écrire :
Yij = mi + b’ij pour 1≤ i ≤ t et 1 ≤ j ≤ n/t
où les b’ij sont des termes d’erreur(correspondants à la sommes des bij et des εij )
d’espérance nulle et de la matrice de variance-covariance presque essentiellement
diagonale ( les termes extra-diagonaux tous égaux à une constantes et petits par
rapport aux termes diagonaux quand n est grand).
Ceci sort un petit peu du cadre de l’analyse de la variance classique (où les
erreurs sont non corrélées), mais du fait que ces termes extra-diagonaux sont
constants, on peut tout de même en déduire que leur influence sur les comparaisons
entre traitement est nulle. L’analyse de la variance ainsi réalisée pourra, sans
confusion, permettre de savoir si les médicament (effet mi ) sont significativement
différents. De plus, on pourra mesurer facilement la précision du résultat obtenu
( P-value des tests de Student ou de Fisher par exemple).
Enfin l’expérience 4 permet le travailler en « double aveugle » (on suppose que le
titrage aléatoire des médicaments a été effectué par un intervenant extérieur). Ceci
garantit et prouve le caractère équitable de l’expérience.
III- Plans d’expériences classiques
Dans cette section nous allons présenter l’expérience randomisée classique. Pour
le plan en randomisation totale, la démonstration du lieu entre la randomisation et
le modèle a été donné ci-dessus. Dans les autres cas, nous admettrons les résultats.
Cependant les preuves assez délicates de ces résultats sont données après.

Dans la présentation nous utiliserons toujours les notations classiques suivantes :

L’expérience a pour but principal de comparer t traitement (dans l’exemple médical
précèdent, t = 2) et :
• n le nombre totale d’unités (ou de donnée) de l’expérience. Dans l’exemple

médical, n = 40 est le nombre total de malades ;
• r est le nombre de répétition de chaque traitement. Dans le cas équilibré
précèdent, r = n/t et en ce que concerne l’exemple médical, r = 20 est le
nombre de malades absorbant un des traitements ;
• b est le nombre de blocs. Dans l’exemple précèdent, la notation de bloc
n’est pas vraiment pertinente. Telle que l’expérience est décrite, un
correspondrait à l’ensemble des 40 malades et le nombre de bloc serait b =
1.
• k est le nombre d’unités par bloc. Dans l’exemple médical, avec b = 1, on a
k = 40 donnée par bloc.
1- Plan en randomisation totale
Ce type de plan est celui décrit par le plan d’expérience 4 précédente. Dans le cas
général, on a t traitements (le facteur traitement admet t modalités). n = r.t unités
expérimentales, et on ne considère qu’un bloc (b = 1) contenant les k = n unités
expérimentales. On tire au hasard (tirage équiprobable et sans remise) r unités
pour le première traitement, puis r pour le second, etc.… Les données sont
analysées par une analyse de la variance à 1 facteur, le facteur traitement.
Cependant, en dehors des expériences médicales, ce plan est peu utilisé. On
pourrait représenter le plan d’expérience (après randomisation) de l’expérience
médicale de l’exemple par le tableau suivant :
Unité (malade) Traitement ( médicament)

1 B
2 B
3 A
: B
: :
: :
40 A
(Source de ces données Jean-Marc Azaïs, Jean-Marc Bardet [7] p, 216)
1-1-Construction d’un plan en randomisation totale à l’aide des logiciels

informatique
Nous présentons maintenant un exemple traité par logiciel informatique, nous nous
permettons de travailler directement sur des données déjà construites. Nous rappelons
que celles-ci sont disponibles sur le site www.dunod.com.

Nous allons reprendre l’exemple précèdent et construire le plan en

randomisation totale correspondant à l’aide des logiciels.
1-1-1 Logiciel SAS

La solution suivant est relativement acrobatique. La procédure « proc » plan
n’est pas vraiment prévue pour ce cas. Nous considérons le cas de 20 unités et 4
traitements.
Ici la commande output prend le data a et randomise son facteur unit suivant la
randomisation définie par proc plan. Cette solution est à rapprocher de la
randomisation d’un plan en bloc incomplet. Voici un exemple de plan ainsi crée :
1-1-2 Logiciel R ou Splus
Voici le même type de création «manuelle » de même plan en randomisation

totale, par les logiciel R ou Splus :

• L’analyse d’un plan en randomisation totale
Voici maintenant les commandes SAS associées à ce plan.
2- Plan en bloc complets (Fisher, 1931) (
Ce plan suit les trois principes énoncés par R. Fisher en 1931 : répétition,
randomisation et control local. Dans le même cadre que le plan en randomisation
totale, on regroupe les n = r.t unités expérimentales en r = b blocs homogènes de
taille k = t.
Dans un exemple médical, les blocs peuvent, par exemple, correspondre au sexe
ou à l’âge, dans une expérience agronomique, cela peut être un ensemble de
parcelles contiguës, dans toute expérience de laboratoire, cela peut être les unités
traitées le même jour, par la même personne.
Le principe du plan est le suivant : dans chaque bloc, on alloue indépendamment
une unité à un traitement et ceci de façon aléatoire. Voyons un exemple pour
illustrer ce principe.
Exemple 1 :on veut comparer t médicament à l’aide de r.t rats de laboratoire. On

suppose, pour simplifier, qu’ils ont tous le même sexe. Plutôt que de faire un plan
en randomisation totale, on décide de les regrouper de manière objective bien
qu’un peu arbitraire. Par exemple, on peut les regrouper en poids : les t rats les
plus légers constituent le bloc 1, les t suivant le bloc 2, etc. Dans chaque bloc,
chaque traitement est administré au hasard à un rat exactement.
Dans l’exemple ci-dessus, les blocs sont constitués de manière arbitraire. Dans
certaines situations, la notation de bloc est plus naturelle.
Exemple 2 : on veut comparer plusieurs sels au point de vue de leur parfum. Plus
précisément les différents sels sont :
• Du sel ordinaire (sel 1) ;
• Du sel aromatisé aux herbes (sel 2) ;
• De la fleur de sel (sel 3) ;
• Du sel de Guérande (sel 4).
Il est conseillé par les vendeurs de sel « haut de gamme » (les deux derniers). On
réalise donc l’expérience suivante : le nombre de traitement est t = 4, on utilise r = 3
tomates qui vont constituer les blocs. De chaque tomate on extrait 4 tranches et on
jette les extrémités. On obtient 12 tranches qui constituent les unités de
l’expérience.
Il ne reste plus techniquement qu’à : (1) identifier les tranches par un système
d’encoches (ce n’est pas très appétissant de coller des étiquettes). (2) faire la
randomisation avec les contraintes que les 4 tranches issues d’une même tomate

reçoivent les 4 sels différents. (3) faire déguster à l’aveugle. Par exemple une
réalisation possible est suivante :
tomate Tranche 1 Tranche 2 Tranche 3 Tranche 4

1 sel 4 sel 1 sel 2 sel 3
. (Source de cet exemple Jean-Marc Azaïs, Jean-Marc Bardet [7] p, 218)
De manière générale pour être efficace le plan en bloc complet doit maximiser la
variabilité inter-blocs : en d’autre termes, il faut rendre l’ensemble des blocs le plus
homogène possible. Dans l’exemple sur les rats, on a intérêt à ce que les blocs soient
les plus homogènes possibles. Par exemple, si on connaît le pedigree des rats, on
pourra préférer au critère de poids des critères de parenté pour constituer les blocs.
Dans l’exemple des sels, il faut absolument que les 4 tranches issues de la même
tomate aient les mêmes caractéristiques qui peuvent varier par contre d’une tomate
à l’autre.
2.1 construction d’un plan en bloc complet à l’aide d’un logiciel
2-1-1 Logiciel SAS
Nous prenons l’exemple de 3 blocs et 4 traitements, qui suit une logique

relativement simple du proc plan :
Voici un exemple de plan ainsi crée :
2-1-2 Logiciel R et Splus
Voici le même type de création « manuelle » du même plan en blocs complets par
les logiciels R ou Splus :

• L’analyse d’un plan en bloc complet
Comme précédemment et pour les mêmes raisons, nous ne présentons que le

traitement en SAS :
3- Plan en bloc incomplet équilibré ou non
Exemple de plan équilibré : supposons que nous ayons 9 bières à comparer (le
facteur d’intérêt est le traitement) et 12 dégustateurs comme la bière est un produit
amer donc « long en bouche », il est clair que passé un certain nombre de produits,
un dégustateur est incapable de comparer ses sensations. On supposera donc qu’un
dégustateur ne peut comparer que 3 bières. Nous avons donc n = 36 unités réparties
en h = 12 blocs de taille k = 3 et on propose la répartition suivante :
Blocs Verre 1 Verre 2 Verre 3

Dégustateur 1 Bière 1 Bière 2 Bière 3
Cette répartition, qui pour l’instant n’a rien d’aléatoire, est équilibrée : chaque
traitement se trouve une fois et une seule exactement avec chaque autre traitement.

Plus généralement, un plan en blocs incomplets équilibré est un plan possèdent la

propriété d’équilibre de la répartition des unités par blocs (comme ci-dessus), c’est-
à-dire que tous les traitement sont appliqués au total le même nombre de fois et que
deux traitement se trouvent ensemble dans un bloc le même nombre de fois. On
peut donc décrire (partiellement) un plan en bloc incomplets équilibré par :
• Le nombre de traitement t (9 dans l’exemple) ;

• Le nombre de répétitions r (4 dans l’exemple) ;
• Le nombre de blocs b (12 dans l’exemple) ;
• La longueur d’un bloc k (3 dans l’exemple) ;
• L’indice de concurrence λ : le nombre de fois où deux traitement se trouvent
ensemble dans un bloc (1 dans l’exemple).
En comptant de deux manières différentes le nombre de parcelles et le nombre

de voisins, on obtient :
r.t = b.k et r(k-1) = λ(t-1)
Cependant, il n’existe pas des plans pour toutes tailles (nombres de traitements,
de blocs,….) et qui vérifient ces équations. On pourra consulter à ce sujet des table
de plans. Quand il existe un plan équilibré, on montre qu’il est optimal.
Malheureusement cela n’est pas toujours possible. En particulier, l’équilibre
demande souvent un nombre de répétitions élevées. Dans ce cas, il existe des
méthodes pour construire des plans conservant certaines propriétés, par exemple
l’équilibre partiel. De toutes les manières, les propriétés suivantes restent vraies que
le plan soit équilibré ou non :
1) Randomisation : la randomisation se fait en deux étapes qui sont :

• Le « mélange des blocs » : si on reprend l’exemple précèdent,
on affecte un numéro de dégustateur à un dégustateur réel au
hasard.
• Le « mélange de traitement en bloc » : toujours en reprenant
l’exemple, les trois bières devant être présentées à un
dégustateur le sont dans un ordre aléatoire.
2) Analyse : on montre que la randomisation valide un modèle possédant

des effets traitement fixes et des blocs aléatoires : c’est un modèle
mixte. Si on ne dispose pas des moyens de traiter un tel modèle, on
peut toutefois utiliser un modèle avec blocs et traitements fixes qui
correspond à une légère perte d’information.
Ainsi, dans l’exemple des bières, pourra-t-on se trouver avec le plan à bloc
incomplet équilibré suivant :
Blocs Verre 1 Verre 2 Verre 3



. (Source de cet exemple Jean-Marc Azaïs, Jean-Marc Bardet [7] p, 222)
Pour arriver à obtenir un plan avant randomisation comme celui de cet exemple,
il existe différentes méthodes classiques. Voyons donc les principaux types de plan à
blocs incomplet équilibrés ou non.
3-1 Les plans lattices
En première lieu, voici une méthode pour construire des plans qui sont, sous
certaines conditions, équilibré, et qui possèdent de toutes façons de bonnes
propriétés : ce sont les plus lattices. Cependant, avant d’aller plus avant, un rappel
d'algèbre est nécessaire.
Tout d’abord, on rappelle qu’un corps est un ensemble K, muni de deux lois +
et . dans lequel on peut toujours résoudre une équation du type ax+b = 0. Les
exemples classiques de corps sont : Q, corps des nombres rationnels, R corps des
nombres réels et C corps des nombres complexes.
Ici, ce sont plutôt les corps finis qui nous intéressent. On connaît un premier
exemple de corps fini Fp de cardinal p: dans le cas où p est un nombre premier,
alors Fp = Z/pZ, corps des entières modulo p. ce corps est unique à un
isomorphisme (application bijective respectant addition et multiplication) près. Plus
généralement, on a les propriétés suivantes:
Théorème 1 Soit k un corps fini.

le nombre d'éléments Card(K) = q, est une puissance d'un nombre
premier: q = pr.
Il existe toujours un corps de cardinal q = pr et concrètement il
n'en existe qu'un seul. Plus mathématiquement : deux corps finis de
même cardinal sont isomorphes.
Pour tout nombre premier p et tout entier r, le corps de cardinal q
= pr peut être décrit comme l'extension galoisienne de F p modulo un
polynôme irréductible de degré r.
Par exemple, pour q = 4 = 2², le polynôme X²+ X+1 est irréductible dans F 2, ce
qui veut dire qu'il n'a pas de racines. En effets 0² + 0 + 1 = 1 ≠ 0 et 1² + 1 + 1 ≠ 0. de
la même façon que pour la construction de C, on note x une racine « imaginaire »
de ce polynôme. Il est facile de voir que l'on obtient ainsi 4 élément de Fp(0,1,x,x+1).
Notons que pour tout corps fini Fp, 0 et 1 appartient à ce corps.

Nous allons utiliser cette notation pour définir un plan lattice.

Définition 1 : un ( r, p²) lattice est un plan pour p² traitements (avec p un nombre
premier ou une puissance d'un nombre premier) avec r répétition de p blocs
contenant chacun p unités (donc au total r.p blocs). Aux p² traitements sont associés
deux facteurs A et B à p niveaux, ces niveaux étant numérotés par des éléments du
corps du Galois Fp à p éléments. Un traitement est d’indice (i ,j) à valeur dans F p², i
est la valeur prise par le facteur A, j est la valeur prise par le facteur B. les
répétition sont indicées par Fp U {x}, les blocs dans chaque répétition sont indicées
par k € Fp :
• Lors de la répétition x, on affecte au bloc k € Fp les traitement (i ,j)
tel que j = k. on dit que l’on a confondu le facteur bloc avec le
facteur B.
• Lors de la répétition 0, on affect au le bloc k € F p les traitements (i,
j) tels que i = k. On dit que l’on a confondu le facteur bloc avec le
facteur A.
• Lors de la répétition 1, Fp\ {0}, on affecte au bloc k € Fp les
traitement (i ,j) tels que i+j = k. on dit que l’on a confondu le
facteur bloc A+ 1 .B.
On montre qu’un ((p+1).p²) lattice est un plan équilibré. Illustrons ceci par des
exemples.
• Exemples de plan lattice :
Un (3, 2²) lattice est un plan pour 4 traitements. Chaque traitement est indicé
arbitrairement par deux facteur A et B prenant chacun deux modalités numérotés
dans F2, corps de Galois à deux éléments c’est-à-dire Z/2Z.
Ces 4 traitements sont expérimentés sur 12 unités divisées en 3 répétitions de
deux blocs de taille deux.
Blocs Trait dans unité 1 Trait dans unité 2

Bloc 1 = répétition x. bloc 0 (0, 0) = 1 (1, 0) = 3
Bloc 2 = répétition x. bloc 1 (0, 1) = 2 (1, 1) = 4
Bloc 3 = répétition 0. bloc 0 (0, 0) = 1 (0, 1) = 2

De la même manière, un (5,4²) est un lattice comportant 16 traitements

différents, et 5 répétitions de 4 blocs, chaque bloc contenant 4 unités (ce qui fait 80
unités statistiques). On utilise le corps F4 = {0,1,x.1,1+x} pour construire un tel plan
(on a dans ce corps, par exemple, pour l’addition. 1+’1+x) = x, x+(1+x) = 1 ou
(1+x)+(1+x) = 0 et pour la multiplication, x.(1+x) = 1 ou (1+x)+(1+x) = x car
1+x+x² = 0. Voici quelques lignes du tableau avant randomisation.
Blocs Trait. Un.1 Trait. Un.2 Trait. Un.3 Trait. Un.4
Bloc 1 = répé x . bloc0 (0,0) (1,0) (x,0) (1+x.0)
: : : : :
: : : : :
Bloc 11= répé 1 . bloc x (0,x) (1,1+x) (x,0) (1+x.1)
: : : : :
: : : : :
Bloc 18= répé 1+x. bloc1 (0,x) (1,0) (x,1) (1+x,1+x)
: : : : :
: : : : :
. (Source de cette exemple Jean-Marc Azaïs, Jean-Marc Bardet [7] p, 224)
3-2 Les plans circulants :
Voici maintenant un autre type de plans incomplets équilibré, lorsque l’on

dispose de t(t - 1) unité par t traitement.
• Définition 2
Un plan circulant est un plan pour t traitement en t bloc de tailles (t – 1). Pour
construire les blocs, on élimine tour à tour chacun des traitements. Un plan
circulant est toujours équilibré, son indice de concurrence λ vaut t – 2.
Exemple de plan circulant :
Si on considère un plan circulant à 5 traitement (noté t1 …… t5 ), on a 5 blocs de

taille 4 dans lesquels on élimine tour à tour un des traitement. Par exemple :

Blocs Unité 1 Unité 2 Unité 3 Unité 4

Blocs 1 t2 t3 t4 t5
Blocs 2 t1 t3 t4 t5
Blocs 3 t1 t2 t4 t5
Blocs 4 t1 t2 t3 t5
Blocs 5 t1 t2 t3 t4
3-2-1 Construction d’un plan en blocs incomplets à l’aide d’un logiciel
De manière générale, il n’y a pas de solution informatique dans tous les cas. Une
solution consiste à construire un plan initial non randomisé a partir de méthodes
algébriques ou à partir de table de plans, que l’on randomise par la suite.
3-2-1-A Logiciel SAS
Encore une fois, la commande proc plan va être au fondement de la construction

(voir l’exemple suivant), on utilise également la commande output data =entree
out=sorte, qui permet de lire une table entrée contenant un plan, de le randomiser
(en utilisant proc plan) et de le sortir sur une table sortie. Considérons par exemple
un plan en 2 blocs de 3 sous blocs de 3 parcelles. Par exemple un plan lattice pour 9
traitements. La randomisation se fera par :
D’où le résultat suivant:

3-2-1-B Logiciel R et Splus
Voici le même type de création « manuelle » de même plan en blocs incomplets,

par les logiciel R et Splus.
Deux cas particuliers méritent notre attention : les plans circulants et les plans
lattices.
• Exemple de construction d’un plan circulant
Dans le premier cas (plan circulant), voici un exemple dans le quel on désire
appliquer 6 traitement à 5 parcelles :
• Logiciel SAS

Voici un résultat possible:
• Logiciel R et Splus
Voici à nouveau une épreuve permettant d’obtenir le même plan d’expérience
en R ou Splus.
• Analyse d’un plan en bloc incomplet
Dans les plans en blocs complets ou incomplets, les unités sont regroupées selon
une classification : les blocs. Dans certains autres cas, les unités peuvent être rangées
dans une structure en ligne et colonne ; ceci fera l’objet de la prochaine section.
3-3 Plans en lignes et colonnes
Cas équilibré : les carrés latins
• Définition

On appelle carré latin, un plan comprenant n² unités pour trois facteurs ayant le
même nombre n de niveaux, et tel que le nombre de répétition d’une paire de
niveaux pour deux facteurs est toujours de 1.
Exemple : on veut comparer 4 peinture carrés ayant 4 façades de même

expositions N, S, E, O. Le facteur d’intérêt est le facteur peinture, les facteurs
maison et orientation étant des facteurs à contrôler type bloc. Si on veut équilibrer
les relation du premier facteur (peinture) avec chacun des deux autres (maison et
orientation), on peut être amené (avant randomisation) à utiliser la répartition
suivante :
Orientation
Maison Nord Sud Est Ouest
1 Peinture 1 Peinture 2 Peinture 3 Peinture 4
On satisfera à l’exigence de randomisation en faisant dans l’ordre que l’on

voudra un « mélange des lignes » et « mélange des colonnes ». Cette randomisation
valide, sous les mêmes hypothèses d’additivité que pour le plan en randomisation
totale, une analyse de la variance à trois facteurs additifs. On pourra par exemple
obtenir, après mélange des lignes :(Source de cette exemple Jean-Marc Azaïs, Jean-
Marc Bardet [7] p, 228)
Orientation
Puis, après mélange des colonnes
Orientation
Remarquez que les propriétés combinatoires sont conservées.

La méthode de construction « en diagonale » fonctionne pour tout valeur de n. il existe
de nombreuses méthodes de construction. La plus classique est basée sur un groupe fini.
On construit la valeur des troisièmes facteurs comme la table d’addition de deux
permutations du groupe (noté additivement).

3-3-1Construction d’un carré latin à l’aide d’un logiciel
Les commandes SAS pour obtenir un tel plan sont :
Voici un résultat possible:

Notez que le bloc initial qui est particulier donne des propriétés d’équilibre des
voisinages en ligne. Si on ne le précise pas, il sera par défaut 1 2 3 4 5 6.
Voici la génération d’un carré latin (particulier) qui repend celle de la matrice
circulante précédente. Ce traitement est donc moins général que celui donné en SAS.

• Analyse d’un carré latin
Pour analyser un carré latin avec le logiciel SAS, on utilise à nouveau la

procédure proc glm.
Les plans en lignes et colonnes équilibrés ou non :
On peut s’intéresser à un plan dont les unités sont placées sur un réseau de ℓ
lignes et de c colonnes mais dont l’allocation des traitements n’a plus la belle
propriété du carré latin. On utilise encore la même randomisation, mais elle valide
maintenant une analyse avec un effet ligne et un effet colonne aléatoire.
• Logiciel SAS
3-4 Les plans split-plot (parcelle subdivisée) :
Exemple : Simplifions la présentation d’une expérience célèbre de Cochran et

Cox. On désire comparer 3 recette de gâteau au chocolat et 6 températures cuisson
180 ,190….230. on réalise l’expérience suivante : chaque jour ( pendant 4 jours) ; on
réalise 3 pâtes correspondant aux 3 recette. Chaque pâte est ensuite sub-divisée en 6
sous-parties cuites à chacune des températures différentes. Après cuisson, on mesure
le moelleux du gâteau en mesurant l’angle de rupture α d’une tranche. On a donc
pour expliquer cette variable quantitative trois facteurs : la température notée
recette) et le jour (facteur bloc). Ce qui est particulier à cet exemple est qu’il y a

deux type d’erreur attachée à la mesure de l’angle et l’autre à la confection d’une

pâte.
On a aura par exemple la planification suivante :
i On dresse d’abord un plan en blocs complets randomisé par le facteur recette,

par exemple :
Blocs (jours)
Bloc 1 Rec 2 Rec 1 Rec 3
ii Ensuite, chaque « grande parcelle » (ici les déférentes pâtes de gâteau), est
divisée en autant de « sous parcelle » qu’il y a de niveaux du second facteur
traitement : la température. ce dernier facteur est pris dans un ordre randomisé.
Une réalisation possible peut être :
Bloc (jours) Recette

T4 , T2,T1, T6, T5, T3 T4 , T5,T6, T2, T3, T1 T1 , T6,T2, T4, T5, T3
T1, T4,T2, T3, T5, T6 T4 , T5,T6, T2, T1, T3 T3 , T4,T1, T2, T6, T5
Plus généralement on a la définition suivante :

• Définition :
On appelle plan split-plot un plan pour deux facteurs traitements, le premier

traitement A, possédant t niveaux et le second, B,s niveaux. Pour le premier facteur,
on construire un plan en blocs complets « grand unité » est divisée en s sous unités
auxquelles sont affectées dans un ordre aléatoire les s valeurs du traitement B.
Si i,j,k sont respectivement les niveaux de A, B et bloc, le modèle auquel conduit

la randomisation est : Yijk = µ + ai + bj + (a+b)ij + block + Eik + εijk
Pour i= 1….t et j= 1…..s et k= 1 ……k
Avec E l’erreur associée aux « grandes unités » (dans l’exemple Y désigne la

mesure de l’angle α d’une tranche, A est le facteur température, B est le facteur
recette et le facteur bloc correspond à un jour).
Ce modèle peut s’analyser bien évidemment à l’aide d’un programme de modèle

mixte, mais il peut également s’analyser à partie des projections inter- et intra-
« grande unité ». la projection inter revient à travailler sur Yik, ce qui, avec des
contraintes classiques, donne
Yik = µ + ai + block + ε’ik avec ε’ik = Eik + εik

Les deux aléas peuvent être confondus, on retrouve ainsi le modèle du plan en
blocs complet. La projection intra- est théoriquement basée sur les Yijk - Yik. On
montre qu’elle est équivalente au modèle complet dans lequel effet E jk est supposé
fixe.
Ceci à condition de se limiter à l’estimation et aux tests sur le facteur B et sur

l’interaction A+B.
En conclusion on dit que le facteur A est totalement estimable inter-grande unité

et l’interaction A+B et le facteur B sont totalement estimable intra-grandes unités.
De manière générale, le plan split-plot donne une meilleure précision sur le

second facteur B et sur l’interaction A+B que sur le premier facteur. Le lecteur
pourra le vérifier facilement sur un exemple.
3-4-1 Construction, randomisation et analyse d’un plan split-plot
Voici les commandes permettant de construire un tel plan :

Voyons maintenant la génération du même plan avec les logiciels R et Splus
Voici maintenant en SAS les commandes à utiliser pour analyser un plan

split-plot :
IV – Plans randomisés par un groupe de permutation

1 Le modèle de la randomisation

Cette partie donne les bases théorique permettent de mieux comprendre

comment la randomisation permet de valider d’analyse des plans d’expériences
classiques.. Comme les situations rencontrées sont assez divisées. Nous allons nous
placer dans un cadre abstrait très générale qui les englobera toutes.
1 – 1 Présentation générale
Considérons une expérience qui comprend n unités expérimentales. On note Ω

l’ensemble de ces unités que l’on peut identifier à {1…….n}=Ω. On suppose que
cette expérience a pour but de comparer un ensemble T = {1…..t} de traitements
avec la contrainte que chaque unité ne peut recevoir qu’un seul traitement. On
considère un « plan initial » qui correspond à un premier placement des traitements
dans les unités, c’est-à-dire à une application de Ω dans T et qui peut se représenter
par une matrice binaire (avec uniquement des 0 et des 1) de taille (n,t), qui nous
noterons X.
• Exemple :
Considérons le cas de n=5 et t=3 et le plan initial 1,2,3,1,2, c’est-à-dire que l’unité
1 recoit le traitement 1, puis l’unité 2 le traitement 2….et enfin, l’unité 5 le
traitement 2. alors la matrice X est la suivante :
Avant de poursuivre, il nous faut revenir sur quelques notions algébriques qui
vont s’avérer utiles par la suite.
1 – 2 Quelques notions d’algèbre
On rappelle d’abord qu’un groupe est un ensemble dans lequel les éléments
vérifient des propriétés de stabilité, d’associativité d’existence d’un élément neutre
et d’un symétrique pour une certaine opération que l’on notera + (par exemple ,
Z/3Z avec l’opération +).
On note Sn le groupe des permutations de {1 …..n} (c’est-à-dire l’ensemble des

bijection de {1…..n} dans {1…..n} auquel on associe l’opération de composition
entre applications.
• Définition

Un groupe (G,.) inclus dans Sn est simplement transitif sur Ω si
Sn est évidemment un groupe simplement transitif sur Ω. Soit maintenant H un

sous-groupe simplement transitif de Sn. Par exemple, pour n = 3 peut être des 3
permutations :
Tout élément ξ de H est identifié à une matrice que l’on notera encore ξ et qui
effectue la permutation correspondante des coordonnées. Par exemple, à la
permutation ξ suivante de S5.
On associe la matrice
Définition
Pour H un sous-groupe de Sn simplement transitif sur Ω = {1…..n} l’orbite

double de la paire d’élément (i,j) € Ω² est l’ensemble :
Oij = {( ξ(i), ξ(j) ), ξ € H}
A l’orbite Oij, on associe la matrice M = ( mi',j')1 ≤ i', j' ≤n, (qui dépend elle aussi de
(i,j) mais nous l'omettrons pour simplifier les notations) telle que:
mi' , j' = 1(i' , j') € Oij

En reprenant l'exemple de H précédent, l'orbite de la paire (2,3) est:
O23 = { ( (2, 3).(3,1),(1,2) )}
Il est facile de voir que si M est la matrice d'une orbite. M' est également la
matrice d'une orbite (évidemment la même et alors M = M'). on définit alors l'orbite
symétrisée comme :
O = ½ ( M + M')
Propriété fondamentale
Nous utiliserons régulièrement le résultat suivant: dans groupe G les

« translations » sur un groupe sont des bijections? Soit g un « l »ment de groupe G
et soit T la translation définie par :
z€G → T(z)= g + z
Alors cette fonction est une bijection. Quand z parcourt G.g + z parcourt
également G.
1-3 Modèle
on suppose dans un modèle conceptuel (que l'on observe donc pas correctement,
qu'il existe une additivité entre un effet traitement et un effet unité. Si R ij est la
réponse conceptuelle du traitement i sur l'unité j, on pose:
Rij = τi + uj avec i € { 1......t} , j € { 1......n}
Où les τi sont les paramètres à estimer et les uj sont des variables aléatoire dont
on supposera simplement qu’elles ont un moment d'ordre 2. Pour se débarrasser
d'une indétermination dans la formule ci-dessus, on suppose de plus que :
En fait, on ne réalise pas l'allocation initiale X (matrice du plan d'expérience),

mais plutôt cette obtenue après une permutation aléatoire tirée dans H. plus

précisément si ξ choisie au « hasard » (c'est-à-dire suivant une loi uniforme) dans

H, on réalise l'allocation ξ.X. On observe donc:
Z = ξ . X. τ + u
et X et ξ des matrices de tailles respectives (n,t) et (n,n).
Remarque :
On peut éventuellement rajouter au modèle des erreurs de mesures

indépendantes. Cependant, le lecteur vérifiera qu'elles ne changent rien à l'étude
suivante.
• Proposition
Avec les notations introduites précédemment posons Y = ξ'.Z (où ξ' désgne la
transposée de la matrice ξ, c'est-à-dire la matrice de l'application réciproque de ξ).
On a alors :
Y = X . τ + ε où ε = ξ' . u
Ξ ( ε) = 0 et
où :
• O1..........Ok sont les orbites doubles symétrique de H opérant sur Ω ;
 y1...........yk sont des paramétrés réels inconnus.
• Démonstration
on étudie l'espérances et la variance de εi. Comme la permutation ξ est choisie

aléatoirement dans H, on a :
En utilisant la propriété de groupe de H, on montre que tout couple (i,j) de Ω².

# { ξ € H tel que ξ(i) = j} = │H│/n
Et donc
Ξ(εi ) = 1/n Ξ(ui ) = 0
Soit maintenant Σ = (σij)1≤i , j≤n = var (ε) la matrice de variance-covariance du

vecteur ε et soit s une permutation fixe de H. alors, pour tout (i,j) :
On donc pour tout (i ,j) € Ω², σs(i)s(j) = σij pour tout s € H. les valeurs de σij sont donc
constantes sur les orbites doubles de H ce qui implique le résultat car Σ est
symétrique.

Chap. II : Les plans d’expériences

du domaine industriel
Chapitre II : Les plans d’expériences

du domaine industriel

I- Pourquoi faire des plans d’expériences en industrie
L’expérimentation est un des moyens qui permettent d’acquérir ou

d’améliorer les connaissances, elles sont optimisées afin d'obtenir des
informations les plus fiables possibles en un minimum essais. Dans ce
paragraphe, nous allons nous intéresser aux méthodes d’expérimentation utilisées
dans les laboratoires. C'est au regard des limites des méthodes classiques que les
méthodes par les plans d’expériences ont été crées.
Le choix de la statistique et des plans d’expériences nous a permit
d’optimiser et d’organiser les essais afin obtenir un maximum de renseignements
avec un minimum d’expériences tout en assurant un meilleur degré de précision
sur les réponses enregistrés et calculées. Il existe de nombreux plans
d’expériences adaptés à tous les cas rencontrés par un expérimentateur. Parmi
tous ces plans, certains sont plus fréquemment utilisés que les autres. Nous
indiquerons les principes fondamentaux de cette science.
II- Principe de base
Supposons qu’un expérimentateur lance une étude, il s’intéresse à une grandeur

qu’il mesure à chaque essai. Cette grandeur est appelle la réponse, c’est la grandeur
d’intérêt. La valeur de cette grandeur dépend de plusieurs variables. Au lieu du
terme « variable » nous emploierons le mot « facteur ». On dit que la réponse
dépend de plusieurs facteurs.
La valeur donnée à un facteur pour réaliser un essai est appelée niveau. Lorsque
l’on étudie l’influence d’un facteur, en générale, on limite ces variations entre deux
bornes :
 borne inférieure est le niveau bas noté -1
 borne supérieure est le niveau haut noté +1

III-les plans factoriels

Un plan d’expériences consiste à mettre en œuvre une stratégie de travail dans le
but de réduire le nombre des essais tout en atteignant rapidement les réponses aux
questions posées. Dans le cas des plans factoriels, il faut déterminer les effets des
paramètres que l’expérimentateur juge influent sur le phénomène. Pour cela
plusieurs cas sont envisageables :
1 Les plans factoriels complets :
Les plans factoriels complets ont été étudiés par Yates et Hunter. Ils sont notés
k
2 (2 puissance k essais) avec 2 le nombre de niveaux (il existe aussi des plans avec 3
niveaux, voire davantage) et k le nombre de facteurs.
Les plans complets permettent de quantifier l'influence de facteurs sur une

caractéristique. Cependant le nombre d'essais peut vite devenir trop important
lorsque le nombre de facteurs augmente. Pour 6 facteurs, le nombre d'essais s'élève
à 64. Ainsi il peut être intéressant d'essayer de quantifier l'influence en faisant
moins d'essais. C'est l'objet du plan réduit (plans fractionnaires).
2 Les plans réduits : (fractionnaires)
Les plans réduits (plans fractionnaires) ont pour objectif d'obtenir les effets de
plusieurs facteurs en faisant un minimum d'essais. Les plans réduits sont notés 2 n-
p
. On va ainsi chercher l'effet de n facteurs en faisant n-p essais. Pour cela il existe
deux démarches :
1. A partir du plan complet et enlever des lignes (des essais). La stratégie

généralement adoptée est de garder uniquement les essais qui donnent le même signe à
l'interaction la plus élevée.
2. Partir du plan réduit et rajouter des colonnes pour prendre en compte les
nouveaux facteurs. Pour cela, il faut avoir une stratégie de rajout de colonnes. Box &
Hunter proposent que les colonnes ajoutées soient des combinaisons linéaires des
colonnes existantes.
(Nous renvoyons pour les détails à des ouvrages plus théoriques comme Jean-
Marc Azaïs, Jean-Marc Bardet [7] p, 256, F. PICAUD [4] p 52)
2-1 Remarque :

Plus les interactions entre les facteurs sont faibles, plus les contrastes du plan
réduit seront proches des effets du plan complet.
IV Autres plans à deux niveaux
Les plans factoriels complets et fractionnaires sont basés sur des modèles
mathématiques du premier degré. Ils couvrent la plupart des besoins des
expérimentateurs lors d’une étude de dégrossissage. Ce sont eux qui seront
employés dans la majorité des cas.
D’autres plans à deux niveaux et basés sur un modèle mathématique degré

ont été mis au point pour répondre à des situations particulières. Nous
examinons les plans koshal, plans de Rechtschaffner, plans de Plackett et
Burmann, plans de Taguchi, plans sursaturés…
1 Plans de Koshal
Les plans de Koshal sont des plans qui permettent de déterminer

uniquement les effets principaux des facteurs, on ne peut pas évaluer les
interactions. Le modèle mathématique est :
ces plans, peu connus, sont trés pratiques pour degrossirun probléme. Ils
offrent l'avantage de donner directement l'effet des facteurs. Ils forment le
debut d'un plan factoriel qu'il est toujours loisible de compléter pour obtenir un
plans complet ou fractionnaire.
2 Plans de Rechtschaffner
les plans de Rechtschaffner sont des plans factoriels fractionnaires

simplifiés qui permettent de determiner les effets des facteurs et les interactions

d'ordre deux. Toutes les autres interactions sont supposées nulles avant
méme l'experimentation. Le modéle mathematique adopte au départ de l'etude
est donc :
3 Plans de Plackett et Burmann
La méthode du plan d’experience de Plackett et Buramann utilise des

matrices pour fixer les valeurs des differents facteurs au cours des
experimentations. Ces valeurs sont choisies de telle sort que la variance des
résultats (le calcul des effets ) soit minimale. Pour cela ; les seuils de plusieurs
facteurs sont changés à chaque experience. Cela permet de :
 Diminuer le nombre d’essais.
 D’étudier un grand nombre de facteurs.
 D’obtenir une meilleur précision.
 d'obtenir un modèle expérimental du phénomène (vrai uniquement à

l'intérieur des bornes du domaine étudié).
3-1 Remarque : la matrice de Hadamard (1)
Une matrice de Hadamard, est une matrice carrée dont les coefficients sont
tous 1 ou -1 et dont les lignes sont toutes orthogonales entre elles. Le nom retenu
pour ces matrices rend hommage au mathématicien français Jacques Hadamard,
même si les premiers exemples systématiques sont dus à James Joseph Sylvester.
Pour une matrice H carré d’ordre n, la propriété d’orthogonalité des colonnes

peut également s’écrire sous la forme :
Où In est la matrice identité d’ordre n
Exemple

• Propriété :
Une matrice réelle M d’ordre n, dont les éléments sont bornés

atteint l’égalité dans l’inégalité de Hardamard :
Si et seulement si c’est une matrice de Hardamard.
Certaines opérations élémentaires transforment une matrice de Hadamard en

une autre : permutation de lignes ou de colonnes, multiplication d'une ligne ou d'une
colonne par -1.
La transposée d'une matrice de Hadamard est encore une matrice de Hadamard.
3.1.1 Construction de Sylvester (3)
Les premiers exemples de matrices de Hadamard sont dus au mathématicien

James Joseph Sylvester
La construction est basée sur la propriété suivante. Si H une matrice de

Hadamard d'ordre n, alors la matrice
est une matrice de Hadamard d'ordre 2n
En appliquant cette construction de façon récursive, o, construit la suite des

matrices de Walsh ou de Sylvester.

Puis (en utilisant la notation du produit de Kronecker)
Les matrices construites par la méthode de Sylvester ont certaines propriétés

intéressantes. Ce sont des matrices symétriques de trace nulle. Les éléments de la
première colonne et de la première ligne sont tous positifs. Dans chaque autre ligne
ou colonne, la moitié des éléments est positive. Ces matrices sont étroitement liées
aux fonctions de Walsh,
3.1.2 Ordre d'une matrice de Hadamard
L'ordre d'une matrice de Hadamard est nécessairement 1, 2 ou un multiple de 4.
La construction de Sylvester montre qu'il existe des matrices de Hadamard d'ordre

2k pour tout entier naturel k.
Les matrices de Hadamard d'ordres 12 et 20 ont été construites par Hadamard.

Raymond Paley démontra plus tard comment construire une matrice de Hadamard
d'ordre q+1 lorsque q est une puissance d'un nombre premier congrue à 3 modulo 4.
Il a également construit des matrices d'ordre 2*(q+1) avec q, puissance d'un nombre
premier congrue à 1 modulo 4. Sa méthode utilise les corps finis. D'autres méthodes
pour la construction de matrices de Hadamard sont maintenant connues.
3-1-3 Conjecture de Hadamard
La question ouverte la plus importante à propos des matrices de Hadamard est celle
de leur existence. D'après la conjecture de Hadamard.
Une matrice de Hadamard d'ordre 4k existe pour tout entier positif k.

(Nous ne détaillerons cette partie plus complexe et renvoyons à des ouvrages plus
théoriques comme le site
V LA THEORIE DE PERMUTATION : plans fractionnaires [1]
On considère p facteur à deux niveaux, que l’on notera -1 et +1 sans perte de

généralité. On appelle traitement une combinaison (i1……ip) de ces facteurs.

L’ensemble des traitements est de cardinal n=2p et correspond au plan factoriel

complet. Soit E l'espace des réponses aux divers traitements. On a ainsi :
E = { f , f : { -1, +1}p → R } ↔ R2p
{isomorphe}
on vérifiera aisément que ces deux ensemble sont des espaces vectoriels en
bijection). Pour deux fonctions f et g de E, on définira la norme ║f║ et le produit
scalaire <f,g> à partir de la norme et du produit scalaire euclidien de l'écriture
dans R2p. Par exemple, pour p = 2 et pour f telle que f(1,1) = 3,2. f(1,-1) = -14,72,
f(-1,1) = -2 et f(-1, -1) = π, on a : ║f║² = (3,2)² + (14,72)² + (-2)² + π². On ce place
dans le cas où le nombre total (n = 2p) des expériences à réaliser pour obtenir un
plan factoriel complet est trop important pour que le plan puisse être mis en place
(par exemple pour des raisons de coût de chaque expérience). On ne va effectuer
qu'une partie, une fraction de ce plan, ce qui conduira à la mise en place d'un plan
factoriel fractionnaire.
En premier lieu, nous allons définir proprement les interactions multiples et

les effets principaux. Dans E il existe des éléments particuliers : les fonctions
coordonnées.
On définit la k-iéme fonction coordonnée, notée Ak pour k = 1.......p, par:
Ak(i1........ip) = ik ; (i1........ip) € {-1, 1}p
(cela définit clairement une fonction de E ). On obtient facilement la propriété

suivante :

( dans le cas où i ≠ j, on vérifie qu'il y a n/4 p-uplets de {-1 , +1} p tels que Ai.Aj
= (1,1), puis n/4 p-uplets de {-1,+1}p tels que Ai.Aj = (1, -1), puis n/4 tel que Ai.Aj =
(-1,1) et enfin n/4 tels que Ai.Aj =(-1,-1) : le produit scalaire vaut bien 0).
Soit B {1........p}. on définit la fonction AB, fonction appartenant également à

E et telle que pour x € {-1,1}p.
AB(x) = ∏ Ai(x) = A1ε1(x)..........Apεp(x) où εk = 1 lorsque k € B et εk = 0 sinon.
Par convention, la fonction A01 est la fonction constante égale à 1, telle que
quelque soit x appartient à Rp. On a la proposition suivante :
1 Proposition
Quand B varie dans l'ensemble des parties de {1.......p}, les AB forment une
base orthogonale de E de norme :
2 Démonstration
Soit B dans {1.......p} il est clair que AB vu comme un élément de Rn à toutes

ses composantes qui valent ±1 et donc le carré de sa norme vaut n. D'autre part,
soit B' dans {1......p} distinct de B. Alors, il existe un élément j € {1.......p} qui
appartient à l'un de ces deux ensembles et pas à l'autre. Quitte à renuméroter les
facteurs, on peut toujours supposer que j = p. on peut écrire que :
AB(x) = A1ε1(x)..............Apεp(x)
Posons maintenant
AB'(x) = A1ε'1(x)..............Apε'p(x)
on a alors εp + ε'p = 1 et

= 0
Soit B un sous-ensemble des fonctions de {1........p}. On définit maintenant le

sous-espace vectoriel de E suivant :
• VB l'ensemble des fonctions de {-1,1}p dans R ne dépendant pas des

seuls coordonnées présentes dans B. Si B = {k1.......km}, une fonction f de VB
s'écrit f(x) = c(xk1........xkm}
• WB est le sous-espace vectoriel de VB orthogonal à tous les sous-espace VB D

dans B . D # B
Par exemple, si p = 2:
• E = { f : {-1 , 1}² → R } donc f € E est telle qu'il existe (a,b,c,d) € R 4 tel que
f(1,1) = a f(-1,1) = b f(1,-1) = c f(-1,-1) = d
• une fonction de V{1} est telle qu'il existe a € R² vérifiant :
f(1,1) = f(1,-1) = a et f(-1,1) = f(-1,-1) = b.
• une fonction W{1} est telle qu'il existe a € R vérifiant :
f(1,1) = f(1,-1) = a et f(-1,1) = f(-1,-1) = -a
On a alors les propriétés suivantes quand à ces sous-espaces vectoriels de E :
3Proposition
Soit B un sous-ensemble de {1.......p} alors :
i. dim (VB) = 2│B│ où │B│ est le cardinal de B ;
ii. si D est dans B alors AD € VB;
iii. l'ensemble { AD avec D dans B } engendre VB;
iv. AB € WB et AB engendre WB qui est donc de dimension 1.

4 Démonstration
Les proposition i et ii découlent de l'écriture même d'une fonction de VB . La

proposition iii découle de i et ii et de l'orthogonalité des AD où D dans B. enfin,
comme on a AB € VB et pour D strictement inclus dans B. AB et AD sont
orthogonales alors AB € WB. Puisque AB et les AD forment une base de VD. AB
engendre bien WB.
• Définition
l'espace WB sera appelé espace de l'interaction entre les facteurs de l'ensemble

B en adoptant les conventions suivantes : si B ne contient qu'un facteur, l'espace
correspondant, que l'on appellera interaction d'ordre 1, est l'espace associe à
l'effet principal de ce facteur. WB est l'espace de la « moyenne générale » considéré
comme une interaction d'ordre 0.
• Définition
La vraie réponse f (a priori non connue) au traitement est un élément de E qui

se décompose sur la base des générateurs AB. Nous appellerons valeur de l’effet de
AB (ou valeur d’un effet principal ou d’une interaction entre les facteurs de B),
notée c(AB) ; le coefficient de cette décomposition et on a :
5 Construction du plan fractionnaire à l’aide des logiciel
Supposons que nous voulions construire un plan pour 5 facteurs : A , B , C , D

et E de résolution V avec 16 unité et la clef E = A . B.C.D. la mise en pratique est
la suivante :
5.1 Logiciel Splus

La génération d’un tel plan fractionnaire avec le logiciel Splus peut être
obtenu directement par la commande :
Le clef ici est A.B.C.D.E, puisque A.B.C.D.E = 1. le résultat est une matrice à
16 lignes, qui correspondent aux unité, et 5 colonnes qui correspondent aux
facteurs. En rajoutant dans la commande l’option randomize.rows = T, on
randomise les lignes (ce qui revient à faire une permutation des unités) et on
obtient alors (ici les différents niveaux de a sont notés a1 et a2 et non -1 et 1) :
Notons que cette commande menuFacDesign est extrêmement puissante

puisque l’on peut également choisir une fraction quelconque du plan, et des
variables avec plus de deux niveaux.
5.2 Logiciel R
La génération d’un tel plan fractionnaire avec le logiciel R peut être obtenue
par la suite de commandes suivantes, après avoir fait appel au module AlgDesign.

Notons que la commande gen.factorial permet la construction d’un plan

complet. Les deux dernières commandes permettent la randomisation des
colonnes du plan d’expériences
Logiciel SAS
La procédure proc plan permet de construire des plan. La construction de

plan pour facteurs à 3 niveaux, l’étude exhaustivement confusions est possible en
utilisant la procédure proc factex du modèle spéciales SAS.

Chap. III : Les outils de validation

de modèle

Chapitre III : Les outils de validation

de modèle
I. Objectif
L’analyse statistique représente une aide à l’interprétation des résultats. Dans le

cas présent, l’analyse statistique permet d’identifier les effets probablement «
significatifs » ou « actifs » des facteurs. L’analyse statistique fait appel à la mise en
œuvre de tests statistiques, procédures bien définies qui permettent de traduire, à
partir d’une probabilité, la pertinence d’un modèle et le caractère significatif des
effets moyens qu’il permet d’identifier. Les procédures de construction des tests
statistiques renvoient à des hypothèses et nécessitent la connaissance de la
variabilité naturelle des résultats d’essai, rarement disponible dans une méthode.
En effet, le manque de temps et d’argent concernant une méthode ne permet pas
souvent les possibilités de répétition d’expériences. Puisque nous avons dupliqué les
expériences, nous pouvons donc mettre en œuvre de façon efficace des tests
statistiques, ce qui nous facilite l’interprétation. Ces constats ont suscité depuis
longtemps le développement de nombreuses méthodes autorisant une approche
d’analyse statistique.
II. Modèle et données :
Supposons qu’on a un modèle mathématique additif avec k variables :

Y = β0 + β1X1 + β2X2 + …. + βkXk + ε ε~ N(0, σ²)
K variables explicative X i numéro d’essai i=1……….n
En écriture matricielle le vecteur de paramètre β = (β 0 , β1……………... βk)' vecteur

(p x 1) et la matrice de variable X est :

III- Principe de moindres carrés
La méthode des moindres carrés, indépendamment élaborée par Legendre en 1805

et Gauss en 1809, permet de comparer des données expérimentales, généralement
entachées d’erreurs de mesure à un modèle mathématique censé décrire ces
données.
Les paramètres βj sont solution de :
On obtient le système d’équations linéaire à résoudre : ( X' X ) β = X' Y
La solution est :
où est une matrice p x n de valeurs fixes.
L’équation de prédiction est :

1- Propriétés des estimateurs :
 combinaison linéaire des yi.
 Sans biais c’est-à-dire
 ils sont à variance minimale
2- L’écart type :
L’écart type (ou déviation standard ou écart quadratique moyen) est un

critère de dispersion. Il mesure l'écart à la moyenne observée et correspond à la
moyenne quadratique des écarts entre les valeurs observées et la moyenne de ces
valeurs observées. Il se note avec la lettre de l'alphabet grec, σ (sigma minuscule),
ou parfois Δ (Delta majuscule).
L’écart type peut être calculé en utilisant la formule suivante
3- Propretés des estimateurs :
On définit
Résidus
Somme de carrés résiduels SCR =
Carré résiduel moyen MSR = SCR/(n-k-1)
Estimation
IV- Décomposition de la variabilité :

1- Analyse de la variance

On définit :
est la somme carrés totale
est la somme carrés de module
est la somme carrés résiduels

2- Équation fondamentale
Somme de carrés (SS) : SCT = SCR + SCM
Variabilité : totale = résiduels + module
Degré de liberté (ddl) : n-1 = k + (n-k-1)
3- Tableau d’analyse de la variance
4- Coefficient de détermination R²:

Si on cherche à savoir si le modèle explique bien l’ensemble des résultats on
doit calculer le coefficient R² :
Le coefficient R² est appelé coefficient de détermination. Plus R² est grand,

meilleur est la réponse du modèle (les réponses calculées seront fortement
corrélées les réponses expérimentales). Cependant, Si le nombre d’expériences est
égal au nombre d’inconnues du système, le coefficient sera toujours égal a 1.
C’est pour éviter cela que le coefficient de détermination ajusté (Ra²) a été
introduit.

5- Coefficient de détermination ajusté Ra²
Le coefficient de détermination ajusté tient compte du nombre de variables. En

effet, le principal défaut du R² est de croître avec le nombre de variables
explicatives. Or, on sait qu’un excès de variables produit des modèles peu robustes.
C’est pourquoi on s’intéresse davantage à cet indicateur qu’au R². Mais ce n’est pas
un véritable « carré » et il peut même être négatif.
5-1- Remarque : [3]
 Ajouter une variable explicative additionnelle dans un modèle fait

toujours augmenter SCM, donc fait augmenter R² ; l’augmentation n’est pas toujours
importante et significative.
 Ra²est préférable R² pour comparer des modèles avec des nombres
différents de variables.
5-2 Test d’hypothèse de R² [6]
Tester l'hypothèse qu’il y a une relation linéaire entre les 2 variables aléatoires X
et Y.
L’hypothèse est :
H0 : corr(x, y )= 0
contre
H1 : corr(x, y) ≠ 0
Avec
Si nous disposons d'un échantillon aléatoire simple d'effectif n prélevé dans la

population, on peut montrer que, si H0 est vraie, alors on a :

Où tn-2 représente une variable de Student à n-2 degré de liberté.

Cette distribution a permis de calculer les quantiles Rn-2,α de R, que nous
présentons dans la table numérotée de Student pour diverses valeurs de n-2et du
risque de première espèce α (l'ordre p du quantile est égale à 1- α/2). On montre que
la règle de décision du test est suivante
On rejet H0 si │R│> Rn-2,α

On accepte H0 si │R│≤ Rn-2,α
(Source de cette partie Jean-Jacques Droesbeke [6] p 139)
V Test global :
On va tester H0 : contre H1 : non H0

(ou moins un β ≠0)
Sous H0 MSM ~ χ²(k) et donc f = MSM/MSR ~ F(k,n-k-1).
Donc on rejette H0 au seuil α si f >
VI- Analyse de plan d’expérience
1 modèle
Soit le modèle
avec i=1.2.3... n le nombre d’observation

j=1.2.3…..k le nombre de traitement

yi : réponse observée à l’essai (traitement i )

βj : coefficients du modèle (à estimer)
xij: constantes connues ( ± 1)
2 Propriétés
la matrice X est orthogonale et on a les contraintes suivantes :
r données (répétitions) essai i : yi1 , yi 2 ,…, yi r
3 Estimation β moindres carrés
Modèle ajusté
4 Estimation de l’erreur expérimentale σ
= ∑ Si²/n estimation direct (erreur pure) applicable seulement si n>1
Si n=1 plan sans répétition
L’estimation de σ est indirecte et basée sur la somme des carrée résiduels(s’il

reste des degré de liberté)après l’ajustement du modèle.
5 Analyse de la variance

SCT = ΣΣ (yik – y) ² : variabilité totale
SCM = n ∑ ( - )² : variabilité expliquée modèle (inter)
SCintra = ∑∑ (yik - i )² : intra variabilité = n
SCT = SCM + SCintra : décomposition de la variabilité.
SCM = 16n Σ ² : décomposition orthogonale des effets.
6 Test pour le manque d’ajustement (lack of fit)
Lack of Fit (manque d’ajustement) : représente l’erreur qui est liée aux
termes qui ne sont pas présents dans le modèle. Cette erreur ne doit pas être
significative pour considérer que notre plan d’expérience est valide.
On a décomposé SCR en 2 parties:
SCR = SCintra + SClof
SCintra = calculée avec les répétitions (erreur pure)
SCR = SCT - SCM
SClof = SCR - SCintra
6-1 Exemple [5]
Soit le jeu de donnée suivant :

Obs Y1 x1 x2 Obs Y1 x1 x2
1 8.74 2 1
2 7.10 2 0 3 9.85 2 0
4 12.1 5 1
6 14.1 5 0 5 13.1 5 1
7 18.6 8 1
9 16.9 8 0 8 15.0 8 1
Les données 2 et 3, 4 et 5 et 7 et 8 ont les mêmes combinaisons de valeurs pour

leurs variables exogènes. Un test de manque d’ajustement est donc possible.
Supposons que le jeu de données compte m combinaisons distinctes des valeurs

des variables exogènes. Soit ni, le nombre d’observations de la i eme combinaison de

variables exogènes, i = 1, . . . ,m. Soit Yij la j éme observation de la variable

endogène pour la i éme combinaison de variables exogènes, j = 1, . . . , ni.
Soit i = Σ yij / ni, la valeur moyenne de la variable endogène pour la i eme

combinaison de la variable exogène.
On a m = 6 combinaisons de valeurs différentes pour (x1i,x2i){(2, 0),(2, 1), (5, 0),

(5, 1), (8, 0), (8, 1)}. On n1=2 observations avec (x1i,x2i) = (2, 0), n2 = 1 observations
avec (x1i,x2i) = (2,1), et ainsi de suite jusqu’à n6 = 2 observations avec (x1i,x2i) =
(8,1). Finalement 1=8.475 2=8.74…… 6=16.8.
La variabilité dans les Yi peut maintenant être estimer à partir des données
ayant les meme combinaison pour les variables exogène :
Quand un modèle de régression est donné, alors la somme des carrées résiduels
est décomposée en somme des carrés provenant de deux sources :
Si le modèle de régression est bon alors l’erreur pur résiduels explique une
partie très important de la somme carrées et la somme due au manque d’ajustement
(lack of fit) devrait être de faible valeur.
Si on prend le modèle on obtient :
Résiduel ddl SS MS Fvalue Pr>F

Lack of fit 1 0.322672 0.322672 0.16 0.7055
Pure erreur 6 12.314733 2.052456
Total erreur 7 12.637406 1.805344
Il ne semble pas y avoir de problème de manque d’ajustement de notre exemple.

Bien entendu, avec le très petit nombre de données observé, très peu d’hypothèse
peuvent être rejetées !! (Source de des données G. Daigle p 46)
7 vérification a posteriori d’un modèle statistique :
Les hypothèses de bases du modèle sont :

 La distribution de Y est normal ;

 La variance est constante ;

 L’indépendances des observations .
Si les hypothèses de base ne sont pas valider on peut faire une transformation
de Box-cox Y λ ;
8 Transformation de Box-Cox Y λ pour stabilisé la variance [8]et (2)
Rappel
La transformée de Box-Cox est la transformation non linéaire de loin la plus
rencontrée en statistique et en économétrie. Elle est définie comme :
Transformation de Box-Cox pour des valeurs divers de λ.
où l’argument x doit être positif, D’aprés la règle de l’Hôpital, log x est la limite
de (xλ – 1)/λ quand λ→0. λ s’étend généralement d’une valeur inférieure à 0 `a une
valeur supérieure à 1. Il peut être montré que B(x,λ’) ≥ B(x,λ’’) pour λ’ ≥ λ’’.
Ainsi la valeur de courbure de la transformée de Box-Cox augmente quand λ
s’éloigne de 1 dans l’une ou l’autre direction du graphe.(2)
(Source de cette partie Russell Davidson et James MacKinnon [11] p 36-54)
Nouvelle variable Y' (transformation de puissance)

Y' = Yλ -2<λ <2
8-1 méthode pour obtenir λ (graphique):
Groupe de données ( i , si )

Graphique de log(si ) vs log( ) pente p λ =1-p
P λ Y'
3 -2 1/Y²
2 -1 1/Y
1,5 -0,5 Y-0,5
1 0 log(Y)
0,5 0,5 Y0,5
0 1 Y
-1 2 Y2
8-1-1 exemple : [2]
Groupe S

A 22,13 33,22
B 50,37 52,29
C 121,21 127,15
D 180,41 222,14
P=0,90 arrondi p=1 λ =1-p=0

alors Y' = log(Y)
Chapitre IV EXEMPLE DE
VALIDATION DES
MODELES DE PLANS
D'EXPERIENCES DE
PLACKETT ET
BURMANN

Chapitre IV EXEMPLE DE VALIDATION

DE MODELE PAR LES PLANS
D'EXPERIENCES DE
PLACKETT ET BURMANN
I – BUT:
Le but visé dans notre étude est l’optimisation (maximisation) de la production
des enzymes amylolytiques, la production de la biomasse et des protéines et réguler
le pH final. Pour cela, nous avons choisi de tester un certain nombre de variables
physiques et des produits synthétiques chimiques et biologiques.
1- variables d'entrées : [7]
Les éléments d’entrer sont choisis après une série d’expériences antérieures
suivant la méthode traditionnelle, en testant une multitude de paramètres, physiques
(température, agitation, pH), chimiques et biologiques, ce qui nous a permit de
garder ceux dont l’effet nous a paru prometteur et/ou rapporté en bibliographie
comme prometteur.
Les éléments (facteurs) mis en essais sont rapportés dans le tableau
Tableau 1 : Les facteurs testés dans l’expérience
Nombre de facteurs Les facteurs

1 pH
2 Amidon

3 Saccharose
4 NH4cl
5 (NH4)2HPO4
6 NH4NO3
7 CH4N2O
8 (NH4)2SO4
9 Extrait de levure
10 peptone
11 CaCl2
12 MnCl2
13 FeCl2
14 ZnCl2
15 MgCl2
2 variables de sortie :
Les sorties peuvent être définis en quatre réponses : Biomasse, Activité

enzymatique, Protéines et pH finale, ces réponses reflètent le comportement de la
souche de Candida sp vis-à-vis des constituants du milieu.
2-1 Biomasse :
La biomasse permet de quantifier la croissance de la levure, elle est mesurée

par densité optique à 600nm.
2-2 Activité enzymatique :
L’activité enzymatique (amylolytiques) est le paramètre le plus important dans

notre expérience, ce paramètre permet de définir la production des enzymes
amylolytiques dans le milieu.
La détermination de l’activité amylolytique est réalisée par dosage des glucides
réducteurs par la méthode de SOMOGYI (1952) et NELSON (1944). Le dosage des
sucres réducteurs est déterminé par spectrophotomètre à λ 540, la concentration
en glucides réducteurs est déterminée par une courbe étalon préparée
extemparament à partir d’une solution mère de glucose de 0.6g/L.
2-3 Protéines :
Les protéines constituent le troisième paramètre de sortie, elles sont dosées par
la méthode de Bradford (Bradford, 1976), la concentration finale est donnée en mg

de protéines par litre de milieu (mg/l). Elles permettent de donner une estimation
sur les amylases produites parmi l’ensemble des protéines présentes dans le milieu
en fin de fermentation.
2-4 pH finale :
Le pH final est un paramètre clé, la mesure du pH permet de déterminer

l’évolution et le comportement de tous les autres paramètres de sortie en fonction
du pH initial et final.
Il est à noter que le rôle du pH dans la stabilité des enzymes est très important,
ainsi, Il permet de définir les marges de pH dans lesquelles les enzymes produits
sont stables et actives.
(Nous renvoyons pour les détails à des ouvrages plus biologique comme
Bradford, M [3] 72:248-254)
II- Plan d’expérience de Placket et Burmann
On veut savoir quels sont les facteurs influent, on considère alors un modèle
additif et ce fait nous avons choisi d’appliquer la matrice de Plackett et Burman
(1946), qui est une des matrices d’Hadamard, avec un nombre d’expériences
multiple de 2 ou de 4.
La matrice d'expérience est construite comme suit :
•Expérience est sur une ligne : d’où N lignes,
• Chaque facteur du plan est dans une colonne : d’où K colonnes.
1 Principe de construction d’un plan de Plackett et Burmann

La construction d’un plan de Plackett et Burmann est basée sur la duplication
de lignes ou de colonnes contenant une alternance particulière de signes négatifs et
positifs par simple permutation circulaire. Cette construction s’effectue en 3 étapes
que nous allons expliquer ci-dessous :
1-1 Étape I
Tout d’abord il faut repérer la ligne génératrice figurant dans le tableau, pour
lequel le nombre N de traitements à réaliser, est immédiatement supérieur ou égal
au nombre p d’inconnues à estimer. Dans le cas présent, nous retiendrons la ligne
correspondant à N =16 puisque nous avons P égal à 15. Le nombre N est parfois
appelé nombre d’Hadamard.

Tableau2 Ligne génératrice des matrice de Plackett et Burman (1946)
1-2 Étape II
A présent il faut transposer cette ligne dans la première ligne ou colonne d'une
matrice de rang N-1 puis recopier cette première colonne par permutation
circulaire Il existe quatre permutations possibles : permutation par la gauche,
permutation par la droite, permutation par le bas ou permutation par le haut.
Tableau3 La ligue génératrice ci-dessous sera donc a première ligne de notre tableau
Ensuite faut permuter le dernier signe de la ligne et le reporter sur la dernière

colonne de la ligne suivante.
1-3 Étape III
Enfin il faut compléter la matrice (Tableau 3) par une ligne exhaustivement
remplie de signes négatifs. Cette ligne représente le réglage de référence.
Tableau4 Mode de construction par permutation droit
Tableau5 Exemple de matrice d'expérience pour 11 facteurs à 2 niveau

(Source de cette partie Plackett, R. L. and J. P. Burman [10] 33:

305-325)
2 Randomisation :
La randomisation consiste à tirer des expériences du plans au hasard, l’ordre des

essais dans la matrice n’est pas respecté pour supprimer l’influence des facteurs
perturbateurs non identifiés ( généralement dû aux incertitudes des pesés,
matériels, utilisateurs, comportement etc…) ces résidus peuvent être corrélés avec
l’ordre des essais.
Tableau 6 : Plan d’expérimentation ( Plackett et Burman 1946) dupliqué et randomisé.

N°Exp Ran pH Amido Saccharos NH4cl (NH4)2HP NH4NO3 CH4N2O (NH4)2SO4 extrait Peptone Cacl2 Mn
d n e O4 levure
g/l g/l g/l g/l g/l g/l g/l g/l g/l g/l g
1 26 7 6 2 0,81 0 0,61 0 1 3 0 0 0,
2 5 7 6 2 0,81 0 0,61 0 1 3 0 0 0,
3 12 5 6 2 0,81 1 0 0,45 0 3 3 0 0
4 16 5 6 2 0,81 1 0 0,45 0 3 3 0 0
5 10 5 5 2 0,81 1 0,61 0 1 0 3 0,1 0
6 25 5 5 2 0,81 1 0,61 0 1 0 3 0,1 0
7 23 5 5 0 0,81 1 0,61 0,45 0 3 0 0,1 0,
8 29 5 5 0 0,81 1 0,61 0,45 0 3 0 0,1 0,
9 14 7 5 0 0 1 0,61 0,45 1 0 3 0 0,
10 2 7 5 0 0 1 0,61 0,45 1 0 3 0 0,
11 31 5 6 0 0 0 0,61 0,45 1 3 0 0,1 0
12 7 5 6 0 0 0 0,61 0,45 1 3 0 0,1 0

13 32 5 5 2 0 0 0 0,45 1 3 3 0 0,
14 3 5 5 2 0 0 0 0,45 1 3 3 0 0,
15 20 7 5 0 0,81 0 0 0 1 3 3 0,1 0
16 24 7 5 0 0,81 0 0 0 1 3 3 0,1 0
17 17 7 6 0 0 1 0 0 0 3 3 0,1 0,
18 28 7 6 0 0 1 0 0 0 3 3 0,1 0,
19 18 5 6 2 0 0 0,61 0 0 0 3 0,1 0,
20 30 5 6 2 0 0 0,61 0 0 0 3 0,1 0,
21 27 7 5 2 0,81 0 0 0,45 0 0 0 0,1 0,
22 9 7 5 2 0,81 0 0 0,45 0 0 0 0,1 0,
23 13 5 6 0 0,81 1 0 0 1 0 0 0 0,
24 15 5 6 0 0,81 1 0 0 1 0 0 0 0,
25 21 7 5 2 0 1 0,61 0 0 3 0 0 0
26 4 7 5 2 0 1 0,61 0 0 3 0 0 0
27 1 7 6 0 0,81 0 0,61 0,45 0 0 3 0 0
28 8 7 6 0 0,81 0 0,61 0,45 0 0 3 0 0
29 22 7 6 2 0 1 0 0,45 1 0 0 0,1 0
30 11 7 6 2 0 1 0 0,45 1 0 0 0,1 0
31 6 5 5 0 0 0 0 0 0 0 0 0 0
32 19 5 5 0 0 0 0 0 0 0 0 0 0
Afin de calculer les résidus, les incertitudes et déterminer les erreurs du modèle
et les paramètres non maîtrisables, nous avons dupliqué le plan d’expériences deux
fois. Tableau.
La matrice d’expériences obtenue après le rajout de la dernière ligne du tableau,
possède des propriétés d’orthogonalité, elle garantit une estimation des effets
moyens avec une incertitude optimale. L’estimation des effets moyens des facteurs
s’effectue en comparant la moyenne des réponses observées pour chacun des
niveaux des facteurs. Pour que cette comparaison soit la plus précis possible et
équitable, On introduire le même nombre d’observations pour chacune des
moyennes avec un nombre d’observations assez élevées. C'est pour cette raison que

l’on retrouve le même nombre de signes positifs que négatifs dans chaque colonne
du tableau précédent.
Par ailleurs, chaque fois qu’un facteur change de niveau dans une colonne
l’ensemble des autres facteurs apparaît d’un même nombre de fois avec un signe
positif et qu’avec un signe négatif dans les autres colonnes, de ce fait l’étude est
réalisée avec le même degré d’intérêt et d’une façon équitable.
III- Analyse globale des résultats des essais:
Les résultats d'essais pour chacune des réponses après une culture de 72
heures, (Biomasse, Activité enzymatiques, Protéines et pH final) sont reportés
dans le tableau suivant :

Tableau 7 : Résultats des expériences, Biomasse, Activité Enzymatique

Protéines. pH final.
N°Exp Biomasse. Activité Enzymatique Protéines. pH final.

1 6.7760 2483.770 0.742 7.280
2 6.8250 2459.580 0.715 7.260
3 8.9460 2609.550 1.610 7.210
4 8.9320 2610.570 1.594 7.200
5 3.4700 304.690 1.047 6.990
6 3.5560 325.790 1.043 7.000
7 6.2650 1445.100 1.175 7.260
8 6.1250 1478.970 1.183 7.270
9 1.6150 1487.030 0.564 7.130
10 1.6650 1528.970 0.575 7.130
11 8.1130 1737.030 1.777 7.220
12 8.1810 1754.770 1.745 7.190
13 6.7200 1275.750 0.889 7.640
14 6.5590 1259.630 0.879 7.500
15 4.5850 782.230 1.208 8.550
16 4.6970 749.970 1.196 8.430
17 8.4560 1582.190 2.156 7.710
18 8.7010 1598.330 2.270 7.710
19 8.6590 66.130 0.459 4.280
20 8.6660 62.900 0.440 4.810
21 2.9820 138.700 0.811 5.430
22 2.9050 132.250 0.787 5.900
23 7.7400 624.170 0.303 6.250
24 8.5590 635.460 0.293 6.100
25 8.4910 1566.060 0.874 7.460
26 8.6940 1566.700 0.831 7.460
27 6.0060 2625.700 0.765 6.760
28 6.2200 2651.510 0.773 6.800
29 6.5940 1249.950 0.757 7.120
30 6.3140 1219.300 0.773 7.110
31 0.6260 0.000 0.076 5.750
32 0.6090 0.000 0.069 5.870
(Source de ces données LAGZOULI Mohamed [8])

Pour chacune des réponses observées, il faut tout d’abord vérifier que les
variations sont significatives. En utilisant le Box plot (Boite à moustache) Nous
pouvons observer rapidement sur les figures 1 à 4, l’étendue des réponses.
A partir du Box plot nous pouvons déjà faire quelques observations:
Figure : Boîte à moustache de la réponse Y1 (Biomasse)
Figure : Boîte à moustache de la réponse Y2 (Activité enzymatique)

Figure : Boîte à moustache de la réponse Y3 (Protéines)
Figure : Boîte à moustache de la réponse Y4 (pH final)
La médiane (trait vert en pointillé) et la moyenne (flèche verte) sont

bien séparées ce qui traduit que les résultats des essais de toutes les
réponses ne sont pas homogènes et pas symétriques par rapport à la valeur
moyenne, Il y a plus d’expériences dont la valeur est soit uniforme et soit
supérieures à la moyenne par ailleurs, nous constatons un certain nombre
d’observation très éloigné de la moyenne sans pour autant être aberrant,
car ils ne dépassent pas les extrémités des lignes.
Cette étude est détaillée dans la thèse en microbiologique de
Mr lagzouli. Nous avons repris les graphiques de Tuckey (boit à
moustache) que nous avons jugés très illustratifs des variables par contre
nous avons développé davantage ici la validation de modèle.

IV – LA VALIDATION DE MODELE
1- résultat d'essai pour la réponse Y1 (Biomasse)
Tableau 8 : résultat d'essai de la biomasse
yi Si
j i
1 6.8005 0.0245
0=6.0391 1 =7.0059
2 8.939 0.007
1=-0.3187 2 =6.5895
3 3.513 0.043
2=1.6914 3 =3.3075
4 6.195 0.07
3=0.5289 4=5.9895
5 1.64 0.025
4=-0.1273 5=2.6123
6 8.147 0.034
5=0.4686 6=7.9415
7 6.6395 0.0805
6=0.1688 7=6.8445
8 4.641 0.056
7=-0.1553 8=4.4357
9 8.5785 0.12415
8=-0.2911 9=8.3733
10 8.6625 0.0035
9=1.2775 10 =8.4571
11 2.9435 0.0385
10 =0.0517 11 =2.7381
12 8.1495 0.4095
11 =-0.1027 12 =8.3549
13 8.5925 0.1015
12 =0.162 13 =8.7979
14 6.113 0.07
13 =0.4253 14 =6.3203

15 6.454 0.14
14 =0.5454 15=6.2485
16 0.6175 0.0085
15 =0.8917 16=0.8229
= 0.0305475 = 6.0391
Tableau 11 : l'analyse de la variance de biomasse

SOURCE SOMME Carré moyen
CARRE df F P
Ph 3.25023008 1 3.25023008 106.399217 0.000000

Amidon 91.54668672 1 91.54668672 2996.863466 0.000000
Saccharose 8.95152672 1 8.95152672 293.0363113 0.000000
NH4Cl 0.5185693 1 0.5185693 16.97583436 0.000000
(NH4)2HPO4 7.0267507 1 7.0267507 230.02703 0.000807
NH4NO3 0.9118 1 0.9118 29.84859645 0.000000
CH4N2O 0.771778 1 0.771778 25.26484982 0.000052
(NH4)2SO4 2.7116547 1 2.7116547 88.7684655 0.000124
Extrait levure 52.2242 1 52.2242 1709.606351 0.000000
Pepton 0.08553248 1 0.08553248 2.799983 0.000000
CaCl2 0.3375 1 0.3375 11.0483673 0.114351
MnCl2 0.839808 1 0.839808 27.4918733 0.004283
FeCl2 5.78816 1 5.78816 189.4806449 0.000081
ZnCl2 9.518757 1 9.518757 311.6051068 0.000000
MgCl2 25.44412 1 25.44412 832.9362468 0.000000
Résiduelle 0.48876 16 0.0305475 ****** ******
Total 209.58056 31 ****** ****** ******
On remarque que le facteur CaCl2 n’est pas significatif (c’est-à-dire que sa

probabilité est supérieure à 0.05) donc on doit l’enlever du modèle et recalculer les
résidus.
Règle :

En générale. Si l’interaction AB est significative on gardera le facteur B s’il n’est

pas significatif.
Puisque, on travail avec le plan de Plackett et Burmann (manque d’interaction)

alors on doit enlever les facteurs qui ont pas significatifs du modèle et recalculer les
résidus.
Tableau 12 : Manque d'ajustement (lack of fit) de biomasse

CARRE df F P
Ph 3.25023008 1 3.25023008 106.399217 0.000000

Amidon 91.54668672 1 91.54668672 2996.863466 0.000000
Saccharose 8.95152672 1 8.95152672 293.0363113 0.000000
NH4Cl 0.5185693 1 0.5185693 16.97583436 0.000000
(NH4)2HPO4 7.0267507 1 7.0267507 230.02703 0.000457
NH4NO3 0.9118 1 0.9118 29.84859645 0.000960
CH4N2O 0.771778 1 0.771778 25.26484982 0.000001
(NH4)2SO4 2.7116547 1 2.7116547 88.7684655 0.000000
Extrait levure 52.2242 1 52.2242 1709.606351 0.203115
Pepton 0.08553248 1 0.08553248 2.799983 0.000666
MnCl2 0.839808 1 0.839808 27.4918733 0.000000
FeCl2 5.78816 1 5.78816 189.4806449 0.000000
ZnCl2 9.518757 1 9.518757 311.6051068 0.000000
MgCl2 25.44412 1 25.44412 832.9362468 0.000000
Lack of fit 0.338 1 0.338 11.0483673 0.114351
Résiduelle 0.48876 16 0.0305475 ****** ******
Total 210.415 31 ****** ****** ******

Dans notre exemple il ne semble pas y avoir un problème de manque

d’ajustement pour la réponse Y1 puisque la probabilité de manque d’ajustement
n’est pas significative.
2- résultat d'essai pour la réponse Y2 (Activité enzymatique)
Tableau 13 : résultat d'essai de l'activité enzymatique
yi Si
j i
1 2471.675 146.28
0=1250.398 1=1232.765
2 2610.06 0.2601
1=1238.492 2=1208.879
3 315.24 111.3025
2=372.783 3=876.098
4 1462.035 286.794225
3=-42.191 4=675.897
5 1508 439.7409
4=128.227 5=65.908
6 1745.9 78.6769
5=114.153 6=1007.321
7 1267.69 64.9636
6=221.145 7=321.876
8 766.1 260.1769
7=324.9 8=546.768
9 1590.26 65.1249
8=8.018 9=344.897
10 64.515 2.608225
9=434.614 10 =676.231
11 135.475 10.400625
10 =94.66 11 =125.932
12 629.815 31.866025
11=-336.13 12 =224.987
13 1566.38 0.1024
12 =-109.21 13 =102.576

14 2638.605 166.539025
13 =-122.11 14 =344.278
15 1234.625 234.855625
14 =-14.228 15 =1217.467
16 0.000 0.000
15 =-46.678 16 =3.098
= 237.46 = 1250.398
Tableau 14 : Analyse de la variance de la réponse Y2

CARRE df F P
Ph 1820109.89 1 1820109.89 7664.91 0.000000

Amidon 4446949.28 1 4446949.28 18727.15 0.000000
Saccharose 56962.5754 1 56962.5754 239.88 0.000000
NH4Cl 526149.233 1 526149.233 2215.74 0.000000
(NH4)2HPO4 416989.04 1 416989.04 1756.04 0.000000
NH4NO3 1564963.55 1 1564963.55 6590.43 0.000000
CH4N2O 3377920.32 1 3377920.32 14225.21 0.000000
(NH4)2SO4 2057.226368 1 2057.226368 8.66 0.009543
Extrait levure 6044458.53 1 6044458.53 25454.64 0.000000
Pepton 286736.5 1 286736.5 1207.51 0.000000
CaCl2 3615468.06 1 3615468.06 15225.59 0.000000
MnCl2 381693.32 1 381693.32 1607.40 0.000000
FeCl2 477209.79 1 477209.79 2009.64 0.000000
ZnCl2 6477.9515 1 6477.9515 27.28 0.000084
MgCl2 69722.74 1 69722.74 293.62 0.000000
Résiduelle 3799.38 16 237.46 ******* *******
23097667.38
Total 31 ***** ****** *******

Tous les facteurs sont significatifs alors notre modèle est bon.
3- résultat d'essai pour la réponse Y3 (protéine)
Tableau 15 : Résultat d'essai de la réponse Y3
yi Si
j i
1 0.7285 0.00018225
0=0.949 1=0.912
2 1.602 0.000064
1=0.038 2=0.045
3 1.045 0.000004
2=0.124 3=0.129
4 1.179 0.000016
3=-0.059 4=0.007
5 0.5695 0.00003025
4=0.003 5=0.123
6 1.761 0.000256
5=0.116 6=0.991
7 0.884 0.000025
6=-0.03 7=1.125
8 1.202 0.000036
7=0.092 8=1.238
9 2.213 0.00249
8=-0.043 9=1.112
10 0.4495 0.00009025
9=0.353 10 =0.845
11 0.799 0.000144
10 =0.142 11 =0.754
12 0.298 0.000025
11 =0.227 12 =0.323

13 0.8525 0.00046225
12=-0.059 13=0.126
14 0.769 0.000016
13=-0.008 14=0.943
15 0.7715 0.00000225
14=0.128 15=0.345
16 0.0725 0.00001225
15=-0.149 16=0.564
= 0.00058125 = 0.949
Tableau 16 :Analyse de la variance de la reponseY3

CARRE df F P
Ph 0.046208 1 0.046208 79.497 0.000000

Amidon 0.49203 1 0.49203 846.503 0.000000
Saccharose 0.111392 1 0.111392 191.642 0.000000
NH4Cl 0.00288 1 0.00288 4,9548 0.428928
(NH4)2HPO4 0.43059 1 0.43059 740.800 0.000000
NH4NO3 0.0288 1 0.0288 49.548 0.000000
CH4N2O 0.270848 1 0.270848 465.975 0.000000
(NH4)2SO4 0.05917 1 0.05917 101.797 0.000000
Extrait levure 3.987488 1 3.987488 6860.194 0.000000
Pepton 0.645248 1 0.645248 1110.104 0.000000
CaCl2 1.648928 1 1.648928 2830.534 0.000000
MnCl2 0.111392 1 0.111392 191.642 0.000000
FeCl2 0.002048 1 0.002048 3.523 0.092166
ZnCl2 0.524288 1 0.524288 902.001 0.000000
MgCl2 0.710432 1 0.710432 1222.248 0.000000
Résiduelle 0.0093 16 0.00058125 ******* *******
Total 9.10652 31 ******** ******* *******

On remarque que les facteurs NH4Cl et FeCl2 ne sont pas significatifs (c’est-à-
dire que leur probabilité est supérieure à 0.05) donc on doit les enlever du modèle et
recalculer les résidus.
Tableau 17 : Manque d'ajustement de la réponse Y3

CARRE df F P
Ph 0.046208 1 0.046208 21.003 0.000000

Amidon 0.49203 1 0.49203 223.65 0.000000
Saccharose 0.111392 1 0.111392 50.632 0.000000
(NH4)2HPO4 0.43059 1 0.43059 195.722 0.000000
NH4NO3 0.0288 1 0.0288 13.091 0.000000
CH4N2O 0.270848 1 0.270848 123.112 0.000000
(NH4)2SO4 0.05917 1 0.05917 26.895 0.000000
Extrait levure 3.987488 1 3.987488 1812.494 0.000000
Pepton 0.645248 1 0.645248 293.294 0.000000
CaCl2 1.648928 1 1.648928 749.512 0.000000
MnCl2 0.111392 1 0.111392 50.632 0.000000
ZnCl2 0.524288 1 0.524288 238.312 0.000000
MgCl2 0.710432 1 0.710432 322.923 0.000000
Lack of fit 0,004928 2 0,002464 4,239139 0.134573
Résiduelle 0.0093 16 0.00058125 ******* *******
Total 9.10652 31 ******** ******* *******

Puisque le Lack of fit n’est pas significatif alors il ne semble pas y avoir un problème de
manque d’ajustement pour notre réponse Y3
4- Résultat d'essai pour la réponse Y4 (pH finale)
Tableau 18 : Résultat d'essai de la réponse Y4
yi Si
j i
1 7.27 0.0001
0=6.899 1 =8.978
2 7.205 0.000025
1=0.303 2 =6.786
3 6.995 0.000025
2=-0.149 3 =6.897
4 7.265 0.000025
3=-0.171 4 =2.098
5 7.13 0.00
4=0.081 5 =0.897
6 7.195 0.000025
5=0.233 6 =8.908
7 7.57 0.0049
6=-0.068 7 =8.876
8 8.49 0.0039
7=0.093 8 =7.453
9 7.71 0.00
8=0.344 9 =6.786
10 4.545 0.070215
9=0.622 10 =4.672
11 5.665 0.05225
10=0.154 11 =6.897

12 6.175 0.005625
11=-0..026 12 =6.453
13 6.78 0.00
12=-0.233 13 =3.564
14 6.96 0.0004
13=-0.165 14 =3.453
15 7.115 0.000025
14=0.046 15 =6.889
16 5.81 0.0036
15=0.026 16 =6.213
= 0.018 = 6.899
Tableau 19 : Analyse de la variance de la réponse Y4

CARRE df F P
Ph 2.937888 1 2.937888 163.216 0.000000

Amidon 0.710432 1 0.710432 39.468 0.000013
Saccharose 0.935719 1 0.935719 51.984 0.000002
NH4Cl 0.209952 1 0.209952 11.664 0.003772
(NH4)2HPO4 1.737248 1 1.737248 96.513 0.000000
NH4NO3 0.147968 1 0.147968 8.220 0.011898
CH4N2O 0.276768 1 0.276768 15.376 0.001397
(NH4)2SO4 3.786752 1 3.786752 210.384 0.000000
Extrait levure 12.380288 1 12.380288 687.793 0.000000
Pepton 0.758912 1 0.758912 42.161 0.000000
CaCl2 0.021632 1 0.021632 1.201 0.304985
MnCl2 1.737248 1 1.737248 96.513 0.000000
FeCl2 0.8712 1 0.8712 48.400 0.000004
ZnCl2 0.067712 1 0.067712 0.265 0.076156
MgCl2 0.021632 1 0.021632 1.201 0.294734
Résiduelle 0.288 16 0.018 ******* *******

Total 26.889 31 ******** ******* *******
On remarque que les facteurs CaCl2, ZnCl2 et MgCl2 ne sont pas significatifs (c’est-à-
dire que leur probabilité est supérieure à 0.05) donc on doit les enlever du modèle et
recalculer les résidus
Tableau 20 : Manque d'ajustement de la réponse Y4
SOURCE SOMME Carré

CARRE df moyen F P
Ph 2.937888 1 2.937888 163.216 0.000000

Amidon 0.710432 1 0.710432 39.468 0.000013
Saccharose 0.935719 1 0.935719 51.984 0.000002
NH4Cl 0.209952 1 0.209952 11.664 0.003772
(NH4)2HPO4 1.737248 1 1.737248 96.513 0.000000
NH4NO3 0.147968 1 0.147968 8.220 0.011898
CH4N2O 0.276768 1 0.276768 15.376 0.001397
(NH4)2SO4 3.786752 1 3.786752 210.384 0.000000
Extrait levure 12.380288 1 12.380288 687.793 0.000000
Pepton 0.758912 1 0.758912 42.161 0.000000
MnCl2 1.737248 1 1.737248 96.513 0.000000
FeCl2 0.8712 1 0.8712 48.400 0.000004
Lack of fit 0.110 3 0.0366 2.033333 0.147510
Résiduelle 0.288 16 0.018 ******* *******
Total 26.889 31 ******** ******* *******

Puisque le Lack of fit n’est pas significatif alors il ne semble pas y avoir un
problème de manque d’ajustement pour notre réponse Y4
On conclue alors que les outils que nous avons traiter est bien valider notre
exemple.
Conclusion & perspectives
L’objectif de ce travail était de présenter, de comprendre et d’utiliser un

ensemble de méthodes et de modes de raisonnement destinés à tout
expérimentateur désirant faire de la planification expérimentale et / ou de
l’analyse des données dans le but d’optimiser l’efficacité de sa recherche
expérimentale. Il existe des méthodes pertinentes et judicieuses adaptées à
chaque problématique.
Les différentes méthodes utilisées et sont résumées sur la figure ci-dessous :

En conclusion, nous avons développé et appliqué les méthodes qui nous
semblaient les plus appropriées à cette exemple étudié. Les plans d’expériences et les
outils de validation de modèle pouvant être utilisés pour traiter un probléme sont
nombreux et il est nécessaire de les adapter à chaque problématique. Les

perspectives sur ce travail seront d’approfondir la connaissance de ces méthodes

mais de découvrir et d’appliquer de nouveaux outils comme par exemple la méthode
de la manque d’ajustement et la méthode de transformation de Box-Cox.
Méthodologie
du plans
d’expériences
La validation de
modèle de plan
d’expérience
Validation des
modèles de
plans
d’expériences
Les outils de
validation de
modèle

Bibliographie
[1] : Bernard CLÉMENT, « Planification et analyse d’expériences Design and Analysis of
Experiments (DOE) avec STATISTICA », école de polytechnique MONTREAL Département
de mathématiques et de génie industriel, MTH-6301 - automne 2007
[2] : Bernard CLÉMENT, « Méthodes statistiques en ingénierie », école de polytechnique

MONTREAL. Département de mathématiques et de génie industriel, MTH-2301 - automne
2007
[3] : Bradford, M.. 1976. A rapid and sensitive method for the quantification of
microgram quantities of protein utiling the principle of protein-Dye binding. Anal.
Biochem., 72:248-254
[4] : F. PICAUD, « METHODOLOGIE EXPERIMENTALE LES PLANS

D’EXPERIENCES » Année 2000/2001
[5] : G. Daigle, « Analyse des résidus et test pour manque d’ajustement » Ed technip,
Automne 2007
[6] : Jean-Jacques Droesbeke, , « éléments de statistique »Ed Ellipses Marketing

le chapitre 10 2003 ,

[7] Jean-Marc Azaïs, Jean-Marc Bardet. «Le modèle linéaire par l'exemple:
régression, analyse de la variance et plans d'expériences illustrés avec R, SAS et Splus » , Ed
DUNO, 2005
[8] : LAGZOULI Mohamed, « Le criblage des facteurs qui influent sur la croissance et la
production de la glucoamylase chez Candida Sp par les plans d’expériences de Plackett et
Burman » thèse de doctorat en biologie, université Ibn Tofail, 2007
[9] :Nelson, N., 1944. A photometric adaptation of the Somogy method for the
determination of glucose. J. Biol. Chem., 153. 375-380
[10] :Plackett, R. L. and J. P. Burman. 1944. The design of optimum multifactorial
24 experiments.Ed Biometrika 33: 305-325
[11] : Russell Davidson et James MacKinnon, « Estimation et Inférence en Économétrie »

« Transformation de la Variable Dépendante », Ed economica, 2003
Webographie
(1) : Matrice de Hadamard - Wikipédia.htm

(2) : http://russell.vcharite.univ-mrs.fr/EIE/
(3) : http://www.ecp6.jussieu.fr/seminaire/resumes/0102/020124.html

Répertoire
A
Aveugle : Dans le domaine médical, le malade ne connaît pas la modalité du traitement qui
lui est administré. (En France la réglementation oblige à un consentement libre et éclairé du
patient à participer à l’essai)
Biomasse : l est la quantité totale de matière (masse) de toutes les espèces vivantes présentes
dans un milieu naturel donné.
Coefficients de corrélation : mesure l’intensité du lien linéaire entre x et y. La

valeur du coefficient de corrélation est comprise entre –1 et 1.

Criblage : plan d’expériences qui aide à dégager le poids des facteurs principaux
Diagonalisation : opération mathématique qui permet de trouver les

vecteurs propres et les valeurs propres d’une matrice.
Double aveugle : Dans le domaine médical, ni le médecin, ni le patient ne connaissent

la modalité du traitement qui est administré
Effet placebo : Dans le domaine médical, l’évaluation d’un traitement se

fait par rapport à une substance inactive appelée placebo
Essais : expériences
Facteurs : variables de prédiction qui sont l’objet de l’étude et pour

lesquelles on cherche à quantifier leur influence sur la réponse.
combinaison
Interactions : des facteurs n’agissant pas de façon
indépendante.
Matrice d'expériences : matrice sans dimension qui permet après un recodage

d’obtenir un plan d’expérimentation à réaliser.
Orthogonalité : dans une matrice d’expériences, chaque niveau d’un

facteur A est associé le même nombre de fois à chaque niveau d’un
facteur B (par exemple, le niveau –1 du facteur A est associé 2 fois avec le
niveau –1 et 2 fois avec le niveau 1 du facteur B).

Randomisation : consiste à tirer au hasard l’ordre des essais pour

supprimer l’influence des facteurs perturbateurs non identifiés pouvant
être corrélés avec l’ordre des essais.
Réponse : d’un système (variable de sortie), critère numérique ou

qualitatif dont le rôle est de
traduire l’atteinte de l’objectif.

Validation Des Plans D'experiences

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Validation Des Plans D'experiences

Uploaded by

Copyright:

Available Formats

Validation du modèle par les plans d’expériences

A tous mes chers ami(e) s : avec tous mes souhaits de réussir,

Pour tout votre soutien et votre amitié je vous dis MERCI.

A tous ceux qui m’aiment

Labaaj iliass -1- Master AMTI2006/2008

personnes, dont l’intervention au cours de ce projet, a favorisé son aboutissement.

Ainsi, Je suis très reconnaissant à Monsieur S. KABBAJ, responsable du master

analyse mathématique et traitement d’information pour son soutien et ses

encouragements et de m’avoir accepté dans cette formation.

Sans omettre à présenter mes vifs remerciements à Monsieur Y.ELKETTANI,

Professeur à la Faculté des Sciences Kenitra , pour la confiance qu’il a eu en moi, le

Il m’est agréable d’exprimer ma profonde gratitude à Messieur Fabrice

Je suis très reconnaissant à ma famille et spécialement mes sœurs, pour leurs

soutiens et leurs encouragements.

Mes vifs remerciements vont également à Mr. EL AMRANI Mohammed Amine

adresser mes sincères remerciements.

Labaaj iliass -2- Master AMTI:2006/2008

Hommage à tous les professeurs du master ANALYSE MATEMATIQUE ET

TRAITEMENT DE L’INFORMATION, qui ont affûté notre formation, j’espère que ce

travail leur donnera pleine satisfaction.

Je profite cette occasion pour remercier mes collègues du Master ANALYSE

MATEMATIQUE ET TRAITEMENT DE L’INFORMATION, qu’ils trouvent ici

l’expression de mes respectueuses considérations.

de ce travail trouvent l’expression de mes remerciements les plus chaleureux.

Merci beaucoup pour tous.

Labaaj iliass -3- Master AMTI:2006/2008

Liste des Abréviations

n = le nombre totale d’unités de l’expérience

r = le nombre totale de répétition

k = le nombre d’unités par bloc

SAS = Statistical Analysis System

R = est la version gratuite de Splus

Splus = est la mise en oeuvre commerciale du langage S

SCT = somme carrée totale

Labaaj iliass -4- Master AMTI:2006/2008

SCR = somme carrée residuel

SCM = ou SMC somme carré du au modéle

Lof = lack of fit

Ra² = coefficient de corrélation ajusté

ddl = degré de liberté

F = la valeur du tableau de Fisher

Liste des figures

Figure 1 : Boîte à moustache de la réponse Y1 (Biomasse)……………………………...73

Figure 2 : Boîte à moustache de la réponse Y2 (Activité enzymatique)………………...73

Figure 3 : Boîte à moustache de la réponse Y3 (Protéines)………………………….......73

Figure 4 : Boîte à moustache de la réponse Y4 (pH final)……………………………….74

Liste des tableaux

Tableau 2 : Ligne génératrice des matrice de Plackett et Burman (1946)..................................68

Labaaj iliass -5- Master AMTI:2006/2008

Tableau 4 :Mode de construction par permutation droit ….........................................................69

Tableau 5 : Exemple de matrice d'expérience pour 11 facteurs à 2 niveau…………..……….69

Tableau 6 : Plan d’expérimentation ( Plackett et Burman 1946) dupliqué et randomisé…..... 70

Tableau 7 : Résultats des expériences, Biomasse, Activité Enzymatique Protéines. pH final…72

Tableau 10: Résultat d'essai de la biomasse………………………………...……………………..75

Tableau 11: L'analyse de la variance de biomasse……………………………………………......76

Tableau 12: Manque d'ajustement (lack of fit) de biomasse……………………………………..77

Tableau 13: Résultat d'essai de l'activité enzymatique…………………………………...………78

Tableau 14: Analyse de la variance de la réponse Y2…………………………..………………...79

Tableau 15: Résultat d'essai de la réponse Y3……………………………………….....................80

Tableau 16:Analyse de la variance de la reponseY3 ……………………………………………..81

Tableau 17: Manque d'ajustement de la réponse Y3 ………………………………………...….82

Tableau 18: Résultat d'essai de la réponse Y4 ……………………………………………….......83

Tableau 19: Analyse de la variance de la réponse Y4 …………………………………………….84