Professional Documents
Culture Documents
Dédicace
A mes très chers parents.
A mes très chères sœurs.
Aucun mot ne pourra exprimer mes sentiments envers vous.
A toute ma famille.
Je dédie ce travail…
Labaaj iliass
Remerciements
C’est agréable de m’acquitter d’une dette de reconnaissance auprès de toutes les
soutien continu qu’il m’a prodigué et ses conseils pertinents tout au long de la
réalisation de ce travail.
Gouvelard ingénieur à la société stat soft, Laghzouli Med pour leur soutien et leur
aide.
pour son soutien et son encouragement, j’apprécie beaucoup son aide et j’aime bien lui
Que tous ceux et celles qui ont contribué de près ou de loin à l’accomplissement
Sommaire
LISTE DES ABRÉVIATIONS………………………..
……………………………………………………………….7
LISTE DES ABRÉVIATIONS.................................................................................4
LISTE DES FIGURES..........................................................................................5
RÉSUMÉ 6
I-POURQUOI FAIRE DES PLANS D’EXPÉRIENCES EN INDUSTRIE.........................39
CONCLUSION & PERSPECTIVES.......................................................................85
BIBLIOGRAPHIE..............................................................................................87
b = le nombre de bloc
R² = coefficient de corrélation
P = la probabilité
Tableau 3 :La ligue génératrice ci-dessous sera donc a première ligne de notre tableau…......68
Résumé
Introduction générale
Depuis une vingtaine d’année, les statistiques ont évalué dans différentes
directions, parmi lesquelles l’analyse des données et les plans d’expériences.
A cela, il faut ajouter les techniques d’aide à la formulation d’un problème qui
mettent en évidence l’importance des outils de validations de modèle.
• La première partie traite les différents plans d’expériences classiques. Dans cette
partie, après avoir montré l’intérêt des plans d’expériences par rapport à la méthode
classique des essais et des erreurs, nous décrivons les différentes méthodes du plans
d’expériences classiques.
I- Introductions
Depuis quelques années, on s’est aperçu que la qualité d’un produit (notion
essentielle dans le monde de l’industrie et dans le monde en général ! ! !) dépendait
principalement de la conception de ce produit ou plus précisément de la
connaissance parfaite de cette conception, plutôt que du produit fini lui-même. En
effet connaître sur le bout du pouce l’élaboration d’un produit permet de prévoir
son évolution au cours du temps en fonction des paramètres influents qu’ils soient
internes ou externes.
Or ces paramètres sont généralement nombreux et difficilement modélisables
par les méthodes classiques de la physique.
Le concepteur a donc besoin d’une méthode «expérimentale», «peu coûteuse en
expériences», qui lui permettra de mesurer et de connaître l’influence de tous les
paramètres et d’en déduire les plus influents. Un plan d’expérience représente
l’outil adéquat qui permettra de répondre à l’ensemble de ces questions.
Les plans d’expériences sont parmi les méthodes statistiques les plus demandées
dans la recherche scientifiques, Ils permettent d'organiser au mieux les essais qui
accompagnent une recherche scientifique et les études industrielles. Ils sont
applicables à un grand nombre de disciplines et à toutes les industries, à partir du
moment où l’on recherche le lien qui existe entre les variables et les réponses.
La compréhension de la méthode des plans d’expériences s’appuie sur deux
notions essentielles, celle d’espace expérimental et celle de modélisation
mathématique des grandeurs étudie.
Dans cette partie, nous allons présenter l’idée forte suivante : la statistique n’a
pas comme objet de « traiter des données » mais également de préparer leur recueil
pour améliorer leur qualité. D’importants gains sont possibles lors de cette étape.
Les méthodes que nous allons présenter s’appliquent à des expériences planifiées
dans lesquelles les principales variables explicatives sont contrôlées, plutôt qu’à des
situations ou les données sont recueillies « comme elles viennent », ce qui est le cas
par l’exemple, dans les enquêtes.
Les deux buts de la planification sont :
1- de permettre une interprétation claire en évitant les confusions.
2- De maximiser la précision de l’expérience.
résultats dans la suite de leur scolarité que des enfants qui ne rejoignent l’école
qu’au primaire. Doit-on en déduire qu’il faut rendre la scolarisation en maternelle
obligatoire pour lutter contre l’échec scolaire ? Une réponse directe par
l’affirmative n’est pas possible. En effet, deux interprétations sont possible : (a) c’est
effectivement la scolarité en maternelle qui améliore les résultat ; (b) dans la France
actuelle, les élèves qui ne vont pas en maternelle sont une minorité qui correspond à
des groupes sociaux bien particuliers, ce qui peut expliquer la différence de réussite
scolaire par l’origine sociale.
Dans cet exemple, on pourra affiner l’analyse en contrôlant toutes les variables
indiquant la situation sociale, avec toujours le risque d’en oublier une. Mais il est
clair que sans cette information complémentaire, les données de départ sont sans
valeur pour répondre à la question. Une solution de type planification à ce problème
serait de définir un groupe d’enfants test et de les répartir « au hasard » en deux
groupes, l’un qui serait scolarisé en maternelle, l’autre non. Bien sûr, pour des
raisons éthiques, ceci est difficilement réalisable ; c’est ce que nous entendions
comme la différence entre une expérience de « labo » et l’utilisation de données
recueillies.
Cet exemple illustre bien le fait que lorsque une certaine latitude est donnée dans
la préparation des expériences fournissant des données, des gains peut être
facilement obtenus.
En premier lieu, on imagine avoir administré les deux médicaments à chacun des
malades et on note Rik la réponse du malade k avec k=1……n (ici n= 40) au
médicament i avec i = 1…..t (ici t = 2 ; i = 1 pour le médicament A et i = 2 pour le
médicament B par exemple). On suppose que le modèle est aditif par rapport aux
deux effets malade, noté ai, et médicament, noté mi, soit :
Où l'on peut considérer que les bij (pour i = 1......t et j = 1.....n/t) sont tirés sans
remise dans l'ensemble des aℓ, l = 1...n. Si l'on procède par ordre lexicographique,
b11 sera tiré dans l'ensemble {a1..........an }, puis b12 sera tiré parmi l'ensemble {
a1..........an }\ { b11}, etc...Les réponses Yij sont donc les réponses effectivement réalisées
parmi toutes les Riℓ potentielles. Cette sélection est aléatoire et implique que les bij
sont des effets aléatoires.
En utilisant les propriétés d'un tirage uniforme sans remise et la condition Σ aℓ = 0,
on montre que les bij sont des variables aléatoires à valeurs dans {a1.............an } et
d'espérance nulle, de matrice de variance-covariance ( pour laquelle on a rangé le
vecteur (bij)ij en ordre lexicographique) définie par:
Ceci sort un petit peu du cadre de l’analyse de la variance classique (où les
erreurs sont non corrélées), mais du fait que ces termes extra-diagonaux sont
constants, on peut tout de même en déduire que leur influence sur les comparaisons
entre traitement est nulle. L’analyse de la variance ainsi réalisée pourra, sans
confusion, permettre de savoir si les médicament (effet mi ) sont significativement
différents. De plus, on pourra mesurer facilement la précision du résultat obtenu
( P-value des tests de Student ou de Fisher par exemple).
Enfin l’expérience 4 permet le travailler en « double aveugle » (on suppose que le
titrage aléatoire des médicaments a été effectué par un intervenant extérieur). Ceci
garantit et prouve le caractère équitable de l’expérience.
Dans cette section nous allons présenter l’expérience randomisée classique. Pour
le plan en randomisation totale, la démonstration du lieu entre la randomisation et
le modèle a été donné ci-dessus. Dans les autres cas, nous admettrons les résultats.
Cependant les preuves assez délicates de ces résultats sont données après.
Ce type de plan est celui décrit par le plan d’expérience 4 précédente. Dans le cas
général, on a t traitements (le facteur traitement admet t modalités). n = r.t unités
expérimentales, et on ne considère qu’un bloc (b = 1) contenant les k = n unités
expérimentales. On tire au hasard (tirage équiprobable et sans remise) r unités
pour le première traitement, puis r pour le second, etc.… Les données sont
analysées par une analyse de la variance à 1 facteur, le facteur traitement.
Cependant, en dehors des expériences médicales, ce plan est peu utilisé. On
pourrait représenter le plan d’expérience (après randomisation) de l’expérience
médicale de l’exemple par le tableau suivant :
Nous présentons maintenant un exemple traité par logiciel informatique, nous nous
permettons de travailler directement sur des données déjà construites. Nous rappelons
que celles-ci sont disponibles sur le site www.dunod.com.
Ici la commande output prend le data a et randomise son facteur unit suivant la
randomisation définie par proc plan. Cette solution est à rapprocher de la
randomisation d’un plan en bloc incomplet. Voici un exemple de plan ainsi crée :
Ce plan suit les trois principes énoncés par R. Fisher en 1931 : répétition,
randomisation et control local. Dans le même cadre que le plan en randomisation
totale, on regroupe les n = r.t unités expérimentales en r = b blocs homogènes de
taille k = t.
Dans un exemple médical, les blocs peuvent, par exemple, correspondre au sexe
ou à l’âge, dans une expérience agronomique, cela peut être un ensemble de
parcelles contiguës, dans toute expérience de laboratoire, cela peut être les unités
traitées le même jour, par la même personne.
Le principe du plan est le suivant : dans chaque bloc, on alloue indépendamment
une unité à un traitement et ceci de façon aléatoire. Voyons un exemple pour
illustrer ce principe.
Dans l’exemple ci-dessus, les blocs sont constitués de manière arbitraire. Dans
certaines situations, la notation de bloc est plus naturelle.
Exemple 2 : on veut comparer plusieurs sels au point de vue de leur parfum. Plus
précisément les différents sels sont :
• Du sel ordinaire (sel 1) ;
• Du sel aromatisé aux herbes (sel 2) ;
• De la fleur de sel (sel 3) ;
• Du sel de Guérande (sel 4).
Il est conseillé par les vendeurs de sel « haut de gamme » (les deux derniers). On
réalise donc l’expérience suivante : le nombre de traitement est t = 4, on utilise r = 3
tomates qui vont constituer les blocs. De chaque tomate on extrait 4 tranches et on
jette les extrémités. On obtient 12 tranches qui constituent les unités de
l’expérience.
Il ne reste plus techniquement qu’à : (1) identifier les tranches par un système
d’encoches (ce n’est pas très appétissant de coller des étiquettes). (2) faire la
randomisation avec les contraintes que les 4 tranches issues d’une même tomate
reçoivent les 4 sels différents. (3) faire déguster à l’aveugle. Par exemple une
réalisation possible est suivante :
De manière générale pour être efficace le plan en bloc complet doit maximiser la
variabilité inter-blocs : en d’autre termes, il faut rendre l’ensemble des blocs le plus
homogène possible. Dans l’exemple sur les rats, on a intérêt à ce que les blocs soient
les plus homogènes possibles. Par exemple, si on connaît le pedigree des rats, on
pourra préférer au critère de poids des critères de parenté pour constituer les blocs.
Dans l’exemple des sels, il faut absolument que les 4 tranches issues de la même
tomate aient les mêmes caractéristiques qui peuvent varier par contre d’une tomate
à l’autre.
2.1 construction d’un plan en bloc complet à l’aide d’un logiciel
Voici le même type de création « manuelle » du même plan en blocs complets par
les logiciels R ou Splus :
Exemple de plan équilibré : supposons que nous ayons 9 bières à comparer (le
facteur d’intérêt est le traitement) et 12 dégustateurs comme la bière est un produit
amer donc « long en bouche », il est clair que passé un certain nombre de produits,
un dégustateur est incapable de comparer ses sensations. On supposera donc qu’un
dégustateur ne peut comparer que 3 bières. Nous avons donc n = 36 unités réparties
en h = 12 blocs de taille k = 3 et on propose la répartition suivante :
Cette répartition, qui pour l’instant n’a rien d’aléatoire, est équilibrée : chaque
traitement se trouve une fois et une seule exactement avec chaque autre traitement.
Cependant, il n’existe pas des plans pour toutes tailles (nombres de traitements,
de blocs,….) et qui vérifient ces équations. On pourra consulter à ce sujet des table
de plans. Quand il existe un plan équilibré, on montre qu’il est optimal.
Malheureusement cela n’est pas toujours possible. En particulier, l’équilibre
demande souvent un nombre de répétitions élevées. Dans ce cas, il existe des
méthodes pour construire des plans conservant certaines propriétés, par exemple
l’équilibre partiel. De toutes les manières, les propriétés suivantes restent vraies que
le plan soit équilibré ou non :
Pour arriver à obtenir un plan avant randomisation comme celui de cet exemple,
il existe différentes méthodes classiques. Voyons donc les principaux types de plan à
blocs incomplet équilibrés ou non.
En première lieu, voici une méthode pour construire des plans qui sont, sous
certaines conditions, équilibré, et qui possèdent de toutes façons de bonnes
propriétés : ce sont les plus lattices. Cependant, avant d’aller plus avant, un rappel
d'algèbre est nécessaire.
Tout d’abord, on rappelle qu’un corps est un ensemble K, muni de deux lois +
et . dans lequel on peut toujours résoudre une équation du type ax+b = 0. Les
exemples classiques de corps sont : Q, corps des nombres rationnels, R corps des
nombres réels et C corps des nombres complexes.
Ici, ce sont plutôt les corps finis qui nous intéressent. On connaît un premier
exemple de corps fini Fp de cardinal p: dans le cas où p est un nombre premier,
alors Fp = Z/pZ, corps des entières modulo p. ce corps est unique à un
isomorphisme (application bijective respectant addition et multiplication) près. Plus
généralement, on a les propriétés suivantes:
Par exemple, pour q = 4 = 2², le polynôme X²+ X+1 est irréductible dans F 2, ce
qui veut dire qu'il n'a pas de racines. En effets 0² + 0 + 1 = 1 ≠ 0 et 1² + 1 + 1 ≠ 0. de
la même façon que pour la construction de C, on note x une racine « imaginaire »
de ce polynôme. Il est facile de voir que l'on obtient ainsi 4 élément de Fp(0,1,x,x+1).
Notons que pour tout corps fini Fp, 0 et 1 appartient à ce corps.
Un (3, 2²) lattice est un plan pour 4 traitements. Chaque traitement est indicé
arbitrairement par deux facteur A et B prenant chacun deux modalités numérotés
dans F2, corps de Galois à deux éléments c’est-à-dire Z/2Z.
Ces 4 traitements sont expérimentés sur 12 unités divisées en 3 répétitions de
deux blocs de taille deux.
• Définition 2
Un plan circulant est un plan pour t traitement en t bloc de tailles (t – 1). Pour
construire les blocs, on élimine tour à tour chacun des traitements. Un plan
circulant est toujours équilibré, son indice de concurrence λ vaut t – 2.
De manière générale, il n’y a pas de solution informatique dans tous les cas. Une
solution consiste à construire un plan initial non randomisé a partir de méthodes
algébriques ou à partir de table de plans, que l’on randomise par la suite.
Deux cas particuliers méritent notre attention : les plans circulants et les plans
lattices.
Dans le premier cas (plan circulant), voici un exemple dans le quel on désire
appliquer 6 traitement à 5 parcelles :
• Logiciel SAS
• Logiciel R et Splus
Voici à nouveau une épreuve permettant d’obtenir le même plan d’expérience
en R ou Splus.
Dans les plans en blocs complets ou incomplets, les unités sont regroupées selon
une classification : les blocs. Dans certains autres cas, les unités peuvent être rangées
dans une structure en ligne et colonne ; ceci fera l’objet de la prochaine section.
• Définition
On appelle carré latin, un plan comprenant n² unités pour trois facteurs ayant le
même nombre n de niveaux, et tel que le nombre de répétition d’une paire de
niveaux pour deux facteurs est toujours de 1.
Orientation
Maison Nord Sud Est Ouest
1 Peinture 1 Peinture 2 Peinture 3 Peinture 4
2 Peinture 2 Peinture 3 Peinture 4 Peinture 1
3 Peinture 3 Peinture 4 Peinture 1 Peinture 2
4 Peinture 4 Peinture 1 Peinture 2 Peinture 3
Orientation
Maison Nord Sud Est Ouest
1 Peinture 4 Peinture 3 Peinture 1 Peinture 2
2 Peinture 2 Peinture 1 Peinture 3 Peinture 4
3 Peinture 1 Peinture 4 Peinture 2 Peinture 3
4 Peinture 43 Peinture 2 Peinture 4 Peinture 1
Notez que le bloc initial qui est particulier donne des propriétés d’équilibre des
voisinages en ligne. Si on ne le précise pas, il sera par défaut 1 2 3 4 5 6.
Voici la génération d’un carré latin (particulier) qui repend celle de la matrice
circulante précédente. Ce traitement est donc moins général que celui donné en SAS.
On peut s’intéresser à un plan dont les unités sont placées sur un réseau de ℓ
lignes et de c colonnes mais dont l’allocation des traitements n’a plus la belle
propriété du carré latin. On utilise encore la même randomisation, mais elle valide
maintenant une analyse avec un effet ligne et un effet colonne aléatoire.
• Logiciel SAS
Blocs (jours)
ii Ensuite, chaque « grande parcelle » (ici les déférentes pâtes de gâteau), est
divisée en autant de « sous parcelle » qu’il y a de niveaux du second facteur
traitement : la température. ce dernier facteur est pris dans un ordre randomisé.
T1, T4,T2, T3, T5, T6 T4 , T5,T6, T2, T1, T3 T3 , T4,T1, T2, T6, T5
• Définition :
1 – 1 Présentation générale
• Exemple :
Considérons le cas de n=5 et t=3 et le plan initial 1,2,3,1,2, c’est-à-dire que l’unité
1 recoit le traitement 1, puis l’unité 2 le traitement 2….et enfin, l’unité 5 le
traitement 2. alors la matrice X est la suivante :
Avant de poursuivre, il nous faut revenir sur quelques notions algébriques qui
vont s’avérer utiles par la suite.
On rappelle d’abord qu’un groupe est un ensemble dans lequel les éléments
vérifient des propriétés de stabilité, d’associativité d’existence d’un élément neutre
et d’un symétrique pour une certaine opération que l’on notera + (par exemple ,
Z/3Z avec l’opération +).
• Définition
Tout élément ξ de H est identifié à une matrice que l’on notera encore ξ et qui
effectue la permutation correspondante des coordonnées. Par exemple, à la
permutation ξ suivante de S5.
On associe la matrice
Définition
A l’orbite Oij, on associe la matrice M = ( mi',j')1 ≤ i', j' ≤n, (qui dépend elle aussi de
(i,j) mais nous l'omettrons pour simplifier les notations) telle que:
Il est facile de voir que si M est la matrice d'une orbite. M' est également la
matrice d'une orbite (évidemment la même et alors M = M'). on définit alors l'orbite
symétrisée comme :
O = ½ ( M + M')
Propriété fondamentale
z€G → T(z)= g + z
Alors cette fonction est une bijection. Quand z parcourt G.g + z parcourt
également G.
1-3 Modèle
on suppose dans un modèle conceptuel (que l'on observe donc pas correctement,
qu'il existe une additivité entre un effet traitement et un effet unité. Si R ij est la
réponse conceptuelle du traitement i sur l'unité j, on pose:
Où les τi sont les paramètres à estimer et les uj sont des variables aléatoire dont
on supposera simplement qu’elles ont un moment d'ordre 2. Pour se débarrasser
d'une indétermination dans la formule ci-dessus, on suppose de plus que :
Z = ξ . X. τ + u
Remarque :
• Proposition
Avec les notations introduites précédemment posons Y = ξ'.Z (où ξ' désgne la
transposée de la matrice ξ, c'est-à-dire la matrice de l'application réciproque de ξ).
On a alors :
Y = X . τ + ε où ε = ξ' . u
Ξ ( ε) = 0 et
où :
• Démonstration
Et donc
On donc pour tout (i ,j) € Ω², σs(i)s(j) = σij pour tout s € H. les valeurs de σij sont donc
constantes sur les orbites doubles de H ce qui implique le résultat car Σ est
symétrique.
Les plans factoriels complets ont été étudiés par Yates et Hunter. Ils sont notés
k
2 (2 puissance k essais) avec 2 le nombre de niveaux (il existe aussi des plans avec 3
niveaux, voire davantage) et k le nombre de facteurs.
Les plans réduits (plans fractionnaires) ont pour objectif d'obtenir les effets de
plusieurs facteurs en faisant un minimum d'essais. Les plans réduits sont notés 2 n-
p
. On va ainsi chercher l'effet de n facteurs en faisant n-p essais. Pour cela il existe
deux démarches :
2. Partir du plan réduit et rajouter des colonnes pour prendre en compte les
nouveaux facteurs. Pour cela, il faut avoir une stratégie de rajout de colonnes. Box &
Hunter proposent que les colonnes ajoutées soient des combinaisons linéaires des
colonnes existantes.
(Nous renvoyons pour les détails à des ouvrages plus théoriques comme Jean-
Marc Azaïs, Jean-Marc Bardet [7] p, 256, F. PICAUD [4] p 52)
2-1 Remarque :
Plus les interactions entre les facteurs sont faibles, plus les contrastes du plan
réduit seront proches des effets du plan complet.
Les plans factoriels complets et fractionnaires sont basés sur des modèles
mathématiques du premier degré. Ils couvrent la plupart des besoins des
expérimentateurs lors d’une étude de dégrossissage. Ce sont eux qui seront
employés dans la majorité des cas.
1 Plans de Koshal
ces plans, peu connus, sont trés pratiques pour degrossirun probléme. Ils
offrent l'avantage de donner directement l'effet des facteurs. Ils forment le
debut d'un plan factoriel qu'il est toujours loisible de compléter pour obtenir un
plans complet ou fractionnaire.
2 Plans de Rechtschaffner
d'ordre deux. Toutes les autres interactions sont supposées nulles avant
méme l'experimentation. Le modéle mathematique adopte au départ de l'etude
est donc :
Une matrice de Hadamard, est une matrice carrée dont les coefficients sont
tous 1 ou -1 et dont les lignes sont toutes orthogonales entre elles. Le nom retenu
pour ces matrices rend hommage au mathématicien français Jacques Hadamard,
même si les premiers exemples systématiques sont dus à James Joseph Sylvester.
Exemple
• Propriété :
La question ouverte la plus importante à propos des matrices de Hadamard est celle
de leur existence. D'après la conjecture de Hadamard.
{isomorphe}
on vérifiera aisément que ces deux ensemble sont des espaces vectoriels en
bijection). Pour deux fonctions f et g de E, on définira la norme ║f║ et le produit
scalaire <f,g> à partir de la norme et du produit scalaire euclidien de l'écriture
dans R2p. Par exemple, pour p = 2 et pour f telle que f(1,1) = 3,2. f(1,-1) = -14,72,
f(-1,1) = -2 et f(-1, -1) = π, on a : ║f║² = (3,2)² + (14,72)² + (-2)² + π². On ce place
dans le cas où le nombre total (n = 2p) des expériences à réaliser pour obtenir un
plan factoriel complet est trop important pour que le plan puisse être mis en place
(par exemple pour des raisons de coût de chaque expérience). On ne va effectuer
qu'une partie, une fraction de ce plan, ce qui conduira à la mise en place d'un plan
factoriel fractionnaire.
( dans le cas où i ≠ j, on vérifie qu'il y a n/4 p-uplets de {-1 , +1} p tels que Ai.Aj
= (1,1), puis n/4 p-uplets de {-1,+1}p tels que Ai.Aj = (1, -1), puis n/4 tel que Ai.Aj =
(-1,1) et enfin n/4 tels que Ai.Aj =(-1,-1) : le produit scalaire vaut bien 0).
Par convention, la fonction A01 est la fonction constante égale à 1, telle que
quelque soit x appartient à Rp. On a la proposition suivante :
1 Proposition
Quand B varie dans l'ensemble des parties de {1.......p}, les AB forment une
base orthogonale de E de norme :
2 Démonstration
AB(x) = A1ε1(x)..............Apεp(x)
Posons maintenant
AB'(x) = A1ε'1(x)..............Apε'p(x)
on a alors εp + ε'p = 1 et
= 0
Par exemple, si p = 2:
• E = { f : {-1 , 1}² → R } donc f € E est telle qu'il existe (a,b,c,d) € R 4 tel que
f(1,1) = a f(-1,1) = b f(1,-1) = c f(-1,-1) = d
3Proposition
4 Démonstration
• Définition
• Définition
La génération d’un tel plan fractionnaire avec le logiciel Splus peut être
obtenu directement par la commande :
Le clef ici est A.B.C.D.E, puisque A.B.C.D.E = 1. le résultat est une matrice à
16 lignes, qui correspondent aux unité, et 5 colonnes qui correspondent aux
facteurs. En rajoutant dans la commande l’option randomize.rows = T, on
randomise les lignes (ce qui revient à faire une permutation des unités) et on
obtient alors (ici les différents niveaux de a sont notés a1 et a2 et non -1 et 1) :
5.2 Logiciel R
La génération d’un tel plan fractionnaire avec le logiciel R peut être obtenue
par la suite de commandes suivantes, après avoir fait appel au module AlgDesign.
Logiciel SAS
I. Objectif
La solution est :
2- L’écart type :
On définit
Résidus
Estimation
On définit :
Tester l'hypothèse qu’il y a une relation linéaire entre les 2 variables aléatoires X
et Y.
L’hypothèse est :
H0 : corr(x, y )= 0
contre
H1 : corr(x, y) ≠ 0
Avec
V Test global :
1 modèle
Soit le modèle
2 Propriétés
Modèle ajusté
5 Analyse de la variance
Lack of Fit (manque d’ajustement) : représente l’erreur qui est liée aux
termes qui ne sont pas présents dans le modèle. Cette erreur ne doit pas être
significative pour considérer que notre plan d’expérience est valide.
La variabilité dans les Yi peut maintenant être estimer à partir des données
ayant les meme combinaison pour les variables exogène :
Quand un modèle de régression est donné, alors la somme des carrées résiduels
est décomposée en somme des carrés provenant de deux sources :
Si le modèle de régression est bon alors l’erreur pur résiduels explique une
partie très important de la somme carrées et la somme due au manque d’ajustement
(lack of fit) devrait être de faible valeur.
Si on prend le modèle on obtient :
Rappel
La transformée de Box-Cox est la transformation non linéaire de loin la plus
rencontrée en statistique et en économétrie. Elle est définie comme :
où l’argument x doit être positif, D’aprés la règle de l’Hôpital, log x est la limite
de (xλ – 1)/λ quand λ→0. λ s’étend généralement d’une valeur inférieure à 0 `a une
valeur supérieure à 1. Il peut être montré que B(x,λ’) ≥ B(x,λ’’) pour λ’ ≥ λ’’.
Ainsi la valeur de courbure de la transformée de Box-Cox augmente quand λ
s’éloigne de 1 dans l’une ou l’autre direction du graphe.(2)
(Source de cette partie Russell Davidson et James MacKinnon [11] p 36-54)
Groupe de données ( i , si )
P λ Y'
3 -2 1/Y²
2 -1 1/Y
1,5 -0,5 Y-0,5
1 0 log(Y)
0,5 0,5 Y0,5
0 1 Y
-1 2 Y2
Groupe S
A 22,13 33,22
B 50,37 52,29
C 121,21 127,15
D 180,41 222,14
Chapitre IV EXEMPLE DE
VALIDATION DES
MODELES DE PLANS
D'EXPERIENCES DE
PLACKETT ET
BURMANN
Les éléments d’entrer sont choisis après une série d’expériences antérieures
suivant la méthode traditionnelle, en testant une multitude de paramètres, physiques
(température, agitation, pH), chimiques et biologiques, ce qui nous a permit de
garder ceux dont l’effet nous a paru prometteur et/ou rapporté en bibliographie
comme prometteur.
Les éléments (facteurs) mis en essais sont rapportés dans le tableau
Tableau 1 : Les facteurs testés dans l’expérience
3 Saccharose
4 NH4cl
5 (NH4)2HPO4
6 NH4NO3
7 CH4N2O
8 (NH4)2SO4
9 Extrait de levure
10 peptone
11 CaCl2
12 MnCl2
13 FeCl2
14 ZnCl2
15 MgCl2
2 variables de sortie :
2-1 Biomasse :
Les protéines constituent le troisième paramètre de sortie, elles sont dosées par
la méthode de Bradford (Bradford, 1976), la concentration finale est donnée en mg
de protéines par litre de milieu (mg/l). Elles permettent de donner une estimation
sur les amylases produites parmi l’ensemble des protéines présentes dans le milieu
en fin de fermentation.
2-4 pH finale :
(Nous renvoyons pour les détails à des ouvrages plus biologique comme
Bradford, M [3] 72:248-254)
On veut savoir quels sont les facteurs influent, on considère alors un modèle
additif et ce fait nous avons choisi d’appliquer la matrice de Plackett et Burman
(1946), qui est une des matrices d’Hadamard, avec un nombre d’expériences
multiple de 2 ou de 4.
Tout d’abord il faut repérer la ligne génératrice figurant dans le tableau, pour
lequel le nombre N de traitements à réaliser, est immédiatement supérieur ou égal
au nombre p d’inconnues à estimer. Dans le cas présent, nous retiendrons la ligne
correspondant à N =16 puisque nous avons P égal à 15. Le nombre N est parfois
appelé nombre d’Hadamard.
1-2 Étape II
A présent il faut transposer cette ligne dans la première ligne ou colonne d'une
matrice de rang N-1 puis recopier cette première colonne par permutation
circulaire Il existe quatre permutations possibles : permutation par la gauche,
permutation par la droite, permutation par le bas ou permutation par le haut.
Tableau3 La ligue génératrice ci-dessous sera donc a première ligne de notre tableau
2 Randomisation :
13 32 5 5 2 0 0 0 0,45 1 3 3 0 0,
14 3 5 5 2 0 0 0 0,45 1 3 3 0 0,
15 20 7 5 0 0,81 0 0 0 1 3 3 0,1 0
16 24 7 5 0 0,81 0 0 0 1 3 3 0,1 0
17 17 7 6 0 0 1 0 0 0 3 3 0,1 0,
18 28 7 6 0 0 1 0 0 0 3 3 0,1 0,
19 18 5 6 2 0 0 0,61 0 0 0 3 0,1 0,
20 30 5 6 2 0 0 0,61 0 0 0 3 0,1 0,
21 27 7 5 2 0,81 0 0 0,45 0 0 0 0,1 0,
22 9 7 5 2 0,81 0 0 0,45 0 0 0 0,1 0,
23 13 5 6 0 0,81 1 0 0 1 0 0 0 0,
24 15 5 6 0 0,81 1 0 0 1 0 0 0 0,
25 21 7 5 2 0 1 0,61 0 0 3 0 0 0
26 4 7 5 2 0 1 0,61 0 0 3 0 0 0
27 1 7 6 0 0,81 0 0,61 0,45 0 0 3 0 0
28 8 7 6 0 0,81 0 0,61 0,45 0 0 3 0 0
29 22 7 6 2 0 1 0 0,45 1 0 0 0,1 0
30 11 7 6 2 0 1 0 0,45 1 0 0 0,1 0
31 6 5 5 0 0 0 0 0 0 0 0 0 0
32 19 5 5 0 0 0 0 0 0 0 0 0 0
Afin de calculer les résidus, les incertitudes et déterminer les erreurs du modèle
et les paramètres non maîtrisables, nous avons dupliqué le plan d’expériences deux
fois. Tableau.
La matrice d’expériences obtenue après le rajout de la dernière ligne du tableau,
possède des propriétés d’orthogonalité, elle garantit une estimation des effets
moyens avec une incertitude optimale. L’estimation des effets moyens des facteurs
s’effectue en comparant la moyenne des réponses observées pour chacun des
niveaux des facteurs. Pour que cette comparaison soit la plus précis possible et
équitable, On introduire le même nombre d’observations pour chacune des
moyennes avec un nombre d’observations assez élevées. C'est pour cette raison que
l’on retrouve le même nombre de signes positifs que négatifs dans chaque colonne
du tableau précédent.
Par ailleurs, chaque fois qu’un facteur change de niveau dans une colonne
l’ensemble des autres facteurs apparaît d’un même nombre de fois avec un signe
positif et qu’avec un signe négatif dans les autres colonnes, de ce fait l’étude est
réalisée avec le même degré d’intérêt et d’une façon équitable.
Les résultats d'essais pour chacune des réponses après une culture de 72
heures, (Biomasse, Activité enzymatiques, Protéines et pH final) sont reportés
dans le tableau suivant :
Pour chacune des réponses observées, il faut tout d’abord vérifier que les
variations sont significatives. En utilisant le Box plot (Boite à moustache) Nous
pouvons observer rapidement sur les figures 1 à 4, l’étendue des réponses.
A partir du Box plot nous pouvons déjà faire quelques observations:
IV – LA VALIDATION DE MODELE
yi Si
j i
1 6.8005 0.0245
0=6.0391 1 =7.0059
2 8.939 0.007
1=-0.3187 2 =6.5895
3 3.513 0.043
2=1.6914 3 =3.3075
4 6.195 0.07
3=0.5289 4=5.9895
5 1.64 0.025
4=-0.1273 5=2.6123
6 8.147 0.034
5=0.4686 6=7.9415
7 6.6395 0.0805
6=0.1688 7=6.8445
8 4.641 0.056
7=-0.1553 8=4.4357
9 8.5785 0.12415
8=-0.2911 9=8.3733
10 8.6625 0.0035
9=1.2775 10 =8.4571
11 2.9435 0.0385
10 =0.0517 11 =2.7381
12 8.1495 0.4095
11 =-0.1027 12 =8.3549
13 8.5925 0.1015
12 =0.162 13 =8.7979
14 6.113 0.07
13 =0.4253 14 =6.3203
15 6.454 0.14
14 =0.5454 15=6.2485
16 0.6175 0.0085
15 =0.8917 16=0.8229
= 0.0305475 = 6.0391
Règle :
yi Si
j i
1 2471.675 146.28
0=1250.398 1=1232.765
2 2610.06 0.2601
1=1238.492 2=1208.879
3 315.24 111.3025
2=372.783 3=876.098
4 1462.035 286.794225
3=-42.191 4=675.897
5 1508 439.7409
4=128.227 5=65.908
6 1745.9 78.6769
5=114.153 6=1007.321
7 1267.69 64.9636
6=221.145 7=321.876
8 766.1 260.1769
7=324.9 8=546.768
9 1590.26 65.1249
8=8.018 9=344.897
10 64.515 2.608225
9=434.614 10 =676.231
11 135.475 10.400625
10 =94.66 11 =125.932
12 629.815 31.866025
11=-336.13 12 =224.987
13 1566.38 0.1024
12 =-109.21 13 =102.576
14 2638.605 166.539025
13 =-122.11 14 =344.278
15 1234.625 234.855625
14 =-14.228 15 =1217.467
16 0.000 0.000
15 =-46.678 16 =3.098
= 237.46 = 1250.398
23097667.38
Total 31 ***** ****** *******
Tous les facteurs sont significatifs alors notre modèle est bon.
yi Si
j i
1 0.7285 0.00018225
0=0.949 1=0.912
2 1.602 0.000064
1=0.038 2=0.045
3 1.045 0.000004
2=0.124 3=0.129
4 1.179 0.000016
3=-0.059 4=0.007
5 0.5695 0.00003025
4=0.003 5=0.123
6 1.761 0.000256
5=0.116 6=0.991
7 0.884 0.000025
6=-0.03 7=1.125
8 1.202 0.000036
7=0.092 8=1.238
9 2.213 0.00249
8=-0.043 9=1.112
10 0.4495 0.00009025
9=0.353 10 =0.845
11 0.799 0.000144
10 =0.142 11 =0.754
12 0.298 0.000025
11 =0.227 12 =0.323
13 0.8525 0.00046225
12=-0.059 13=0.126
14 0.769 0.000016
13=-0.008 14=0.943
15 0.7715 0.00000225
14=0.128 15=0.345
16 0.0725 0.00001225
15=-0.149 16=0.564
= 0.00058125 = 0.949
On remarque que les facteurs NH4Cl et FeCl2 ne sont pas significatifs (c’est-à-
dire que leur probabilité est supérieure à 0.05) donc on doit les enlever du modèle et
recalculer les résidus.
Puisque le Lack of fit n’est pas significatif alors il ne semble pas y avoir un problème de
manque d’ajustement pour notre réponse Y3
yi Si
j i
1 7.27 0.0001
0=6.899 1 =8.978
2 7.205 0.000025
1=0.303 2 =6.786
3 6.995 0.000025
2=-0.149 3 =6.897
4 7.265 0.000025
3=-0.171 4 =2.098
5 7.13 0.00
4=0.081 5 =0.897
6 7.195 0.000025
5=0.233 6 =8.908
7 7.57 0.0049
6=-0.068 7 =8.876
8 8.49 0.0039
7=0.093 8 =7.453
9 7.71 0.00
8=0.344 9 =6.786
10 4.545 0.070215
9=0.622 10 =4.672
11 5.665 0.05225
10=0.154 11 =6.897
12 6.175 0.005625
11=-0..026 12 =6.453
13 6.78 0.00
12=-0.233 13 =3.564
14 6.96 0.0004
13=-0.165 14 =3.453
15 7.115 0.000025
14=0.046 15 =6.889
16 5.81 0.0036
15=0.026 16 =6.213
= 0.018 = 6.899
On remarque que les facteurs CaCl2, ZnCl2 et MgCl2 ne sont pas significatifs (c’est-à-
dire que leur probabilité est supérieure à 0.05) donc on doit les enlever du modèle et
recalculer les résidus
Puisque le Lack of fit n’est pas significatif alors il ne semble pas y avoir un
problème de manque d’ajustement pour notre réponse Y4
On conclue alors que les outils que nous avons traiter est bien valider notre
exemple.
Méthodologie
du plans
d’expériences
La validation de
modèle de plan
d’expérience
Validation des
modèles de
plans
d’expériences
Les outils de
validation de
modèle
Bibliographie
[1] : Bernard CLÉMENT, « Planification et analyse d’expériences Design and Analysis of
Experiments (DOE) avec STATISTICA », école de polytechnique MONTREAL Département
de mathématiques et de génie industriel, MTH-6301 - automne 2007
[3] : Bradford, M.. 1976. A rapid and sensitive method for the quantification of
microgram quantities of protein utiling the principle of protein-Dye binding. Anal.
Biochem., 72:248-254
[5] : G. Daigle, « Analyse des résidus et test pour manque d’ajustement » Ed technip,
Automne 2007
[7] Jean-Marc Azaïs, Jean-Marc Bardet. «Le modèle linéaire par l'exemple:
régression, analyse de la variance et plans d'expériences illustrés avec R, SAS et Splus » , Ed
DUNO, 2005
[8] : LAGZOULI Mohamed, « Le criblage des facteurs qui influent sur la croissance et la
production de la glucoamylase chez Candida Sp par les plans d’expériences de Plackett et
Burman » thèse de doctorat en biologie, université Ibn Tofail, 2007
[9] :Nelson, N., 1944. A photometric adaptation of the Somogy method for the
determination of glucose. J. Biol. Chem., 153. 375-380
[10] :Plackett, R. L. and J. P. Burman. 1944. The design of optimum multifactorial
24 experiments.Ed Biometrika 33: 305-325
Webographie
Répertoire
A
Aveugle : Dans le domaine médical, le malade ne connaît pas la modalité du traitement qui
lui est administré. (En France la réglementation oblige à un consentement libre et éclairé du
patient à participer à l’essai)
Biomasse : l est la quantité totale de matière (masse) de toutes les espèces vivantes présentes
dans un milieu naturel donné.
Criblage : plan d’expériences qui aide à dégager le poids des facteurs principaux
Essais : expériences
combinaison
Interactions : des facteurs n’agissant pas de façon
indépendante.