Professional Documents
Culture Documents
1.1 Introduction
Ce premier chapitre aborde la notion generale de planication experimentale
en utilisant peu de notions mathematiques. Il est principalement destine
aux lecteurs novices ayant besoin, dans un premier temps, de bien cerner
la problematique et les objectifs de cette methode.
Le chapitre debute par une presentation tr`es generale de la demarche
de planication experimentale ainsi que du vocabulaire de base (facteurs,
reponse, domaine experimental, etc...). Les principaux ecueils `a eviter en pratique (realiser trop dexperiences, methode un facteur a` la fois, realisation
des experiences sans strategie able, etc...) sont presentes. Cette premi`ere
partie est suivie par un bref historique des plans dexperience. La structure
de louvrage est ensuite presentee en precisant clairement quels sont les sujets
abordes et ceux qui ne le sont pas. Une presentation des logiciels scientiques
pouvant etre utilises dans le cadre des plans dexperience (SAS, Nemrod, R,
etc...) gure aussi an de faciliter le choix du lecteur souhaitant realiser de
tels traitements informatiques.
Un exemple detude classique menee `a laide dun plan dexperience est
propose pour terminer le chapitre. Cette etude, realisee `a laide du logiciel
Nemrod, permet au lecteur davoir une premi`ere idee des techniques utilisees
lors de la mise en oeuvre pratique dun plan dexperience. Des references sont
de plus donnees tout au long de cet exemple an de pouvoir se reporter aux
divers chapitres correspondants.
Le lecteur souhaitant une introduction plus orientee vers les aspects industriels de la methode des plans dexperience pourra consulter aussi les premiers
chapitres des ouvrages de Goupy [45] ou [46], de Pillet [72] ainsi que Sado et
Sado [82].
W. Tinsson, Plans dexp
erience: constructions et analyses statistiques,
Math
ematiques et Applications 67, DOI 10.1007/978-3-642-11472-4 1,
c Springer-Verlag Berlin Heidelberg 2010
1.2 La d
emarche de planication exp
erimentale
1.2.1 Objectifs
A lepoque actuelle bon nombre de procedes de fabrication ou dexperiences
en laboratoire deviennent de plus en plus complexes car ils dependent dun
grand nombre de variables diciles `a regler intuitivement. Ceci concerne, par
exemple :
le probl`eme de la mise au point de moteurs atmospheriques dependant
dun nombre croissant de reglages electroniques,
le pilotage optimal de machines-outil,
la determination des proportions dun melange chimique,
la recherche des conditions environnementales optimales pour la production agricole, etc...
Seule la realisation dexperiences va permettre dapprehender et de modeliser de tels phenom`enes complexes. Si ces experiences sont eectuees sans
une methodologie rigoureuse il est fort probable quelles vont soit conduire a`
des impasses (mod`ele impossible a` ajuster, resultats incoherents, etc...) soit
a des resultats de qualite decevante. Cest pourquoi la m
`
ethode des plans
dexp
erience est preconisee an doptimiser ce type de demarche. Lobjectif
principal de cette methode peut etre resume par la devise :
obtenir un maximum dinformation
en un minimum dexp
eriences
Une autre vision du probl`eme est la recherche de variations simultanees pour
toutes les variables controlees an, une nouvelle fois, dextraire un maximum
dinformation en un minimum dessais. Une telle problematique est primordiale dans le milieu industriel o`
u minimiser le nombre dexperiences `a realiser
est synonyme de gain de temps et de productivite. Realiser des productions
de la meilleure qualite possible au co
ut le plus bas est de plus une quete
universelle pour tous les fabriquants.
1.2.2 R
eponse
On qualie de r
eponse la grandeur qui est observee pour chaque experience
realisee. On supposera toujours ici que cette grandeur est numerique et quune
seule reponse `a la fois est observee (des techniques de planication multireponses existent aussi voir, par exemple, le chapitre 7 de Khuri et Cornell [56]). Il appartient aux specialistes du phenom`ene etudie de cerner au
mieux ce qui les interesse et de fournir le type de reponse etudie ainsi que
lobjectif souhaite vis-`
a-vis de celle-ci. Cet objectif est dans la plupart des cas
une recherche dextremum.
Citons quelques exemples. Pour letude de lacidite dun jus de fruit il est
possible de mesurer son pH an de quantier ce probl`eme. Lobjectif souhaite
est alors la minimisation de la reponse. Pour le cas dune production agricole la reponse est, par exemple, le rendement `a lhectare et lobjectif est de
maximiser cette reponse.
1.2.3 Facteurs
On qualie de facteur toute variable, obligatoirement contr
olable, susceptible dinuer sur la reponse observee. La dierence fondamentale entre la
notion classique de variable et celle de facteur tient donc dans le fait que tout
facteur doit pouvoir etre modie sans diculte. Cette hypoth`ese est obligatoire pour les plans dexperience puisque nous allons par la suite proposer une
liste des experiences `a realiser. Il est donc imperatif que lexperimentateur
puisse sy tenir en adaptant les facteurs aux diverses valeurs donnees. A titre
dexemple lorsquune reaction chimique depend de la pression ambiante, il
sagit alors dun facteur si lexperience est menee dans un local o`
u la pression
peut etre modiee ou bien dune variable si le local nest pas equipe dun
tel dispositif (la pression est alors la pression atmospherique que lon peut
mesurer mais quil est impossible de faire varier).
Remarquons que les facteurs peuvent etre quantitatifs lorsquils sont naturellement exprimes `a laide de valeurs numeriques (pression, temperature,
duree, etc...) ou bien qualitatifs dans le cas contraire (couleur, type de
materiau, sexe, etc...). Il est classique de transformer des facteurs qualitatifs
en facteurs quantitatifs a` laide dun codage approprie (par exemple en aectant la valeur 0 pour Homme et la valeur 1 pour Femme dans le cas du
sexe), tout ceci sera detaille dans la suite.
Lorsquun facteur varie on dit quil change de niveau. La connaissance
de lensemble de tous les niveaux utilises par chaque facteur est necessaire
pour la realisation des experiences. Supposons que le facteur quantitatif
temperature peut prendre les valeurs suivantes :
Temperature 20 C
30 C
40 C
50 C
rouge
Exprience
Domaine
exprimental
2 bar
1 bar
Temprature
60 C
80 C
La gure 1.1 est un exemple lorsque les m = 2 facteurs temperature et pression sont consideres. Le domaine experimental obtenu par cette methode est
alors le rectangle grise. Toute experience est donc naturellement associee `a un
point de ce rectangle. Si seulement 4 experiences sont realisees un choix optimal consiste `a placer ces experiences aux sommets de ce rectangle. Lensemble
des experiences proposees constitue un plan dexp
erience (appele plan factoriel complet ici).
On consid`erera souvent par la suite des domaines experimentaux spheriques
car ils permettent dobtenir des proprietes mathematiques plus faciles `a
manier. Dans le cadre de cet exemple le domaine considere peut etre, par
exemple, limite par le cercle represente en pointilles (sous reserve, bien entendu, quil soit reellement possible de mener des experiences dans tout ce
nouveau domaine).
Remarquons enn que lorsque les dierents facteurs sont qualitatifs la
notion de domaine experimental est cette fois plus simple puisquon peut
alors lobtenir en croisant les ensembles des diverses modalites possibles pour
chacun des facteurs (une representation graphique a donc moins dinteret dans
ce cas).
1.2.5 R
ealisation des exp
eriences
Presentons ici sous forme dun exemple la problematique de la realisation
des experiences. Considerons une entreprise produisant une colle industrielle
qui a la f
acheuse tendance de se solidier durant le processus de fabrication.
An de sopposer a` cette tendance trois additifs sont introduits durant le
procede industriel et les debits injectes sont contr
olables `a laide de trois
vannes prenant les niveaux suivants :
Faible / Moyen / Fort.
Utilisons dans la suite les codages 0, 1 et 2 an de designer plus facilement
ces trois niveaux respectifs. La reponse mesuree en sortie est ici une mesure
de la uidite du produit mis au point. Lobjectif est de maximiser cette quantite. Supposons maintenant que cette uidite obeit au mod`ele mathematique
additif donne ci-dessous (o`
u Y designe la reponse observee et i1 , i2 , i3 sont
les niveaux des trois facteurs cest-`a-dire les positions des diverses vannes) :
[i ]
[i ]
[i ]
[i i2 ]
Y = Y (i1 , i2 , i3 ) = 0 + 1 1 + 2 2 + 3 3 + 121
avec les dierents eets tels que :
0 = +120,
[0]
[1]
= 0,
1 = +10,
1
[0]
[1]
2 = 0,
2 = 20,
[1]
3[0] = 0,
3 = 10,
[22]
[i i ]
12 = +60, 121 2 = 0
[2]
1 = 20,
[2]
2 = +10,
[2]
3 = 30,
sinon.
Le fait de ramener systematiquement les divers niveaux bas `a 0 est une technique classique avec ce type de mod`ele o`
u lorsquun facteur est `a h modalites
il sut alors den estimer les (h 1) eets (voir le chapitre 8 pour plus de
details). En dautres termes on suppose donc ici a` laide du mod`ele postule
que :
i) il existe un eet moyen general dune valeur de 120 (traduisant le fait
que si tous les debits sont au niveau faible alors la uidite est de 120),
ii) les trois facteurs presentent divers eets simples inuencant directement la reponse mesuree (par exemple ladditif 3 seul semble avoir un eet
nefaste sur la uidite lorsquil est utilise en grande quantite puisque plus son
debit est grand plus la uidite diminue),
iii) il existe un eet dinteraction entre les additifs 1 et 2 car sils sont
utilises simultanement avec un debit eleve alors une nette augmentation de
la uidite apparat (+60). Ceci peut etre d
u, par exemple, `a une reaction
chimique se produisant uniquement lorsque les quantites de ces deux additifs
sont assez elevees.
Remarquons quun tel exemple est presente uniquement a` titre pedagogique et
deux grandes hypoth`eses simplicatrices ont ete utilisees. Premi`erement il est
bien entendu evident que dans la realite le mod`ele mathematique expliquant
le phenom`ene etudie est generalement inconnu. Deuxi`emement on a suppose
ici que le mod`ele mathematique est deterministe (i.e. si deux experiences
identiques sont realisees alors les reponses observees sont les memes). L`a
aussi cest rarement le cas dans la realite car repeter une experience conduit
generalement `a des resultats dierents `a cause de diverses sources de variations
externes (erreurs humaines, facteurs non-controles, erreurs dues aux appareils
de mesure, etc...). Des mod`eles plus complexes, dits mod`
eles statistiques,
seront etudies et utilises dans la suite de louvrage (voir le chapitre 2).
Supposons maintenant que les valeurs des dierents param`etres du mod`ele
sont inconnues et quun utilisateur cherche a` les retrouver par le biais de
lexperimentation. Voici diverses facons classiques pour realiser des experiences
an de collecter des informations sur le phenom`ene etudie.
DV1
Faible
Moyen
Fort
Faible
Moyen
Fort
Faible
Moyen
Fort
Faible
Moyen
Fort
Faible
Moyen
Fort
Faible
Moyen
Fort
Faible
Moyen
Fort
Faible
Moyen
Fort
Faible
Moyen
Fort
DV2
Faible
Faible
Faible
Moyen
Moyen
Moyen
Fort
Fort
Fort
Faible
Faible
Faible
Moyen
Moyen
Moyen
Fort
Fort
Fort
Faible
Faible
Faible
Moyen
Moyen
Moyen
Fort
Fort
Fort
DV3 Rep.
Faible 120
Faible 130
Faible 100
Faible 100
Faible 110
Faible
80
Faible 130
Faible 140
Faible 170
Moyen 110
Moyen 120
Moyen
90
Moyen
90
Moyen 100
Moyen
70
Moyen 120
Moyen 130
Moyen 160
Fort
90
Fort
100
Fort
70
Fort
70
Fort
80
Fort
50
Fort
100
Fort
110
Fort
140
[1]
[2]
[1]
[2]
[1]
[2]
10
0
0 +
0 +
= 120
[1]
1
[2]
1
= 130
= 100
Puisque aucune experience na ete omise, il est donc possible de determiner les
reglages optimaux en selectionnant tout simplement lexperience qui conduit
a maximiser la reponse. Il sagit ici de lexperience 9 associee aux debits ci`
dessous :
Debit 1 : Fort / Debit 2 : Fort / Debit 3 : Faible.
Une telle demarche pose cependant le probl`eme du nombre dexp
eriences
a realiser qui peut devenir rapidement trop important. On peut en eet sup`
poser ici que chaque experience est longue et co
uteuse a` mettre en oeuvre. Il
est alors beaucoup trop lourd de realiser concr`etement 27 experiences alors
que seulement 8 param`etres sont a` determiner. Remarquons de plus que le
probl`eme est ici assez simple car seulement 3 facteurs a` 3 modalites interviennent. Pour 5 facteurs a` 6 modalites le nombre total dexperiences est cette
fois de 65 = 7776. Lorsque les facteurs sont quantitatifs continus (pression,
temperature, ...) il devient impossible de realiser toutes les experiences disctinctes puisquil en existe une innite.
2) Utilisation de la technique un facteur `
a la fois
Lexperimentateur devant faire face `a une situation o`
u la realisation de
toutes les experiences est beaucoup trop lourde se rabat souvent sur ce type
de technique. Comme son nom lindique elle consiste `a faire varier chacun
des facteurs, lun apr`es lautre, en lui aectant toutes les modalites possibles.
Puisquici chaque facteur est `a 3 modalites ceci conduit donc a` la realisation
dun total de 9 experiences donnees dans la table 1.2.
Table 1.2. Technique un facteur `a la fois.
Exp.
DV1
DV2
DV3 Rep.
13
Faible Moyen Moyen
90
14 Moyen Moyen Moyen 100
15
Fort Moyen Moyen
70
11
Moyen Faible Moyen 120
14
Moyen Moyen Moyen 100
17
Moyen Fort Moyen 130
5
Moyen Moyen Faible 110
14
Moyen Moyen Moyen 100
23
Moyen Moyen Fort
80
La demarche suivie consiste ici `a xer systematiquement au niveau moyen les
deux facteurs ne variant pas. Lexperience numero 14 a ainsi ete repetee `a
trois reprises. Dans un contexte deterministe cela na aucun interet (puisque
la reponse mesuree est trois fois la meme) mais une telle demarche nest pas
11
[1]
[1]
0
+2 +3 = 90
[1]
[1]
[1]
0 +1 +2 +3 = 100
[2]
[1]
[1]
0 +1 +2 +3 = 70
[1]
[1]
0 +1
+3 = 120
[1]
[2]
[1]
0 +1 +2 +3 = 130
+ [1] + [1]
= 110
0
1
2
[1]
[1]
[2]
0 +1 +2 +3 = 80
On verie sans peine que ce syst`eme dequations permet de retrouver les
valeurs exactes de leet moyen general ainsi que des divers eets lineaires. Par
contre leet dinteraction ne peut etre determine (ce qui est logique puisque
aucune experience ne fait intervenir simultanement les debits forts pour les
additifs 1 et 2). Remarquons que meme si le niveau des deux facteurs xes `a
chaque experience avait ete fort au lieu de moyen alors lestimation de cet
eet dinteraction aurait encore ete impossible car 7 equations distinctes ne
permettent pas de determiner les 8 param`etres inconnus. Ceci est le principal
defaut de ce type de technique. De mani`ere generale les inconvenients associes
a cette technique sont les suivants :
`
i) faire varier les facteurs un par un masque les eventuels eets dinteractions entre plusieurs facteurs,
ii) le choix du niveau pour les facteurs ne variant pas (moyen ici) nest
pas evident et peut avoir un eet sur la qualite des resultats obtenus,
iii) le plan dexperience obtenu presente le probl`eme detre desequilibre
dans le sens o`
u ici le niveau moyen est sur-represente au detriment des
deux autres niveaux.
Remarquons enn que lutilisation de la table 1.2 conduit `a une mauvaise
modelisation du phenom`ene etudie puisque, leet dinteraction etant omis, la
plus grande reponse theorique predite par le mod`ele vaut 140 pour la situation
suivante :
Debit 1 : Moyen / Debit 2 : Fort / Debit 3 : Faible.
Dapr`es la totalite des experiences de la table 1.1 il est clair que ce resultat
est faux puisquil ne sagit pas du meilleur choix possible.
12
[2]
3 = 10 et 3 = 30.
Table 1.3. Utilisation dun sous-ensemble dexperiences.
Exp. DV1 DV2 DV3 Rep.
1
Faible Faible Faible 120
10
Faible Faible Moyen 110
19
Faible Faible Fort
90
8
Moyen Fort Faible 140
17 Moyen Fort Moyen 130
26 Moyen Fort Fort
110
6
Fort Moyen Faible
80
15
Fort Moyen Moyen
70
24
Fort Moyen Fort
50
Les 6 autres experiences conduisent a` seulement deux equations distinctes
supplementaires donnees par :
[1]
[2]
1 +2 = 20
[2] + [1] = 40
1
13
14
que la valeur maximale de la reponse devrait etre de 170 lorsque les dierents
reglages suivants sont eectues :
Debit 1 : Fort / Debit 2 : Fort / Debit 3 : Faible.
Il est donc possible de determiner les conditions optimales de fonctionnement
sans meme avoir realise lexperience correspondante.
1.3 Historique
Realiser des experiences an detudier et de comprendre un phenom`ene est une
demarche qui remonte `a la nuit des temps. D`es le moyen-age Nicolas Oresme
(1325-1382) aborde cette question dans ses ecrits. Inspirateur de Descartes
et Leibnitz, Francis Bacon (1561-1626) est un des precurseur de la methode
experimentale. En 1627 il fait, par exemple, macerer des grains de ble dans
neuf concoctions dierentes an detudier leur eet sur la rapidite de germination. Arthur Young (1746-1820) cherche ensuite a` systematiser le procede
et aborde la notion de repetabilite des experiences an de prendre en compte
leur variabilite. Ses travaux concernent surtout lagronomie et la mise en uvre de methodes modernes de culture, basees plus sur lexperimentation
que sur des prejuges ou lhabitude. Citons aussi les travaux de Crette de
Palluel (1741-1798) qui publie en 1788 un Memoire sur les avantages et
leconomie que procurent les racines employees a
` lengrais des moutons `
a
letable. Lauteur propose un protocole experimental destine `a comparer les
merites des pommes de terre, des turneps, de la betterave et de la chicoree dans
lengrais des moutons de letable. Cest ensuite principalement au 19`eme si`ecle
que les methodes experimentales se democratisent. Citons a` titre dexemple
les experiences medicales menees par Claude Bernard (1813-1878) ainsi que
son ouvrage Principes de medecine experimentale.
Les methodes rigoureuses dexperimentation, basees sur lutilisation des
plans dexperience, sont dues aux travaux de Sir Ronald Fisher (1890-1962).
Ce brillant mathematicien, tr`es productif dans le domaine de la Statistique,
a ete amene `a sinteresser aux techniques dexperimentation suite a` son emploi, en 1919, a` la Rothamsted Experimental Station, centre de recherche
agronomique situe au nord de Londres. Il cherche alors `a augmenter les rendements agricoles en combinant divers types dengrais, de varietes vegetales,
de methodes de cultures, de types de sols, etc... Face a` limpossibilite de
realiser la totalite des experiences ceci lam`ene `a proposer des congurations
experimentales basees sur des mod`eles statistiques rigoureux (tels que les
carres latins). Ceci constitue le point de depart de la methode theorique des
plans dexperience. Un cel`ebre ouvrage sur le sujet a ete publie en 1935 [41].
Une synth`ese des travaux de Fisher dans le domaine des plans dexperience a
ete realisee par D. A. Preece [74].
15
Divers chercheurs ont par la suite marche dans les traces de Fisher
an de promouvoir et developper lutilisation des techniques de planication experimentales dans dautres domaines que lagronomie. D`es les annees
50 les travaux de Box et de ses collaborateurs (principalement sur les surfaces de reponse) ont entraine bon nombre dapplication pratiques. Mais ce
sont certainement les travaux de G. Taguchi qui ont permi une vaste diusion des plans dexperience, notamment dans le milieu industriel. Travaillant,
entre autre, comme consultant pour de multiples entreprises japonaises G.
Taguchi a eu lidee de realiser des tables de congurations experimentales
de reference facilement utilisables par des non-specialistes. Il a de plus inclu lexperimentation au sein dune demarche plus large de qualite totale
amenant `a la conception de produits ables et de bonne qualite. Ses idees ont
ete mises en uvre dans bon nombre dindustries japonaises d`es les annees
70.
De nombreux chercheurs contemporains ont continue le developpement de
cette branche de la Statistique dans des voies diverses et variees : adaptation
des plans dexperience pour les probl`emes de melanges, introduction deets
de blocs, utilisation de mod`eles non-lineaires, utilisation de mod`eles contenant
des eets de voisinage, plans dexperience pour experiences simulees, etc ...
Voici une liste, non-exhaustive, douvrages ayant fait avancer letat de lart
dans ce domaine lors des derni`eres annees (ces references, ainsi que dautres,
seront rappelees par la suite dans les divers chapitres correspondants) : Benoist
et al. [3], Collombier [19], Cox [24], Cox et Reid [25], Cornell [22], Dagnelie
[27], Dodge [29], Federer et King [39], John [52], Khuri et Cornell [56], PhanTan-Luu et Mathieu [71], Pukelsheim [75], Saporta et al. [84], etc...
16
17
18
Une troisi`eme partie est consacree aux plans dexperience pour facteurs qualitatifs. Elle est constituee par les deux chapitres presentes ci-dessous.
Chapitre huit : Plans dexp
erience pour facteurs qualitatifs.
Ce chapitre presente les dispositifs experimentaux adaptes `a ce type
de facteurs. Le mod`ele additif est etudie en details principalement
concernant la propriete dorthogonalite. Les plans dexperience factoriels complets sont presentes puis la theorie des fractions reguli`eres est
etendue au cas de ces facteurs qualitatifs. Diverses situations nonstandard (fraction pour nombre de modalites non premier, pour nombres de modalites dierents, etc...) sont etudiees. Le mod`ele `a eets
dinteractions est bri`evement presente.
Chapitre neuf : Plans dexp
erience en blocs pour facteurs
qualitatifs.
Tout comme pour les facteurs quantitatifs il est possible que les observations ne soient pas issues de conditions experimentales homog`enes. Il
est alors necessaire deectuer des regroupements en sous-ensembles
homog`enes encore appeles blocs. Les plans dexperience permettant
danalyser facilement un mod`ele `a eets de blocs sont presentes. Ce
chapitre sinteresse tout particuli`erement aux plans en blocs complets,
aux plans en blocs incomplets equilibres, aux plans en blocs partiellement equilibres et enn aux plans en blocs cycliques.
Une derni`ere partie aborde enn le probl`eme tr`es general de loptimalite
des plans dexperience. Elle est constituee par lunique chapitre presente cidessous.
Chapitre dix : Optimalit
e des plans dexp
erience.
Les elements mathematiques permettant de juger de la qualite dun
plan dexperience sont introduits tout au long de ce chapitre. Les
notions doptimalite uniforme, de q -optimalite (incluant les A, D et
E-optimalites) ainsi que doptimalite universelle sont presentees. Il est
pris soin dexpliciter le lien entre ces dierentes optimalites ainsi que
les outils techniques permettant de rechercher des plans optimaux. La
derni`ere partie de ce chapitre revient sur les principales congurations
etudiees tout au long de louvrage pour montrer quelles sont le plus
souvent optimales pour bon nombre de crit`eres.
Trois annexes, designees par annexes A, B et C, gurent ensuite `a la n
de louvrage. Ces dierentes annexes sont dediees aux th`emes presentes cidessous.
Annexe A : Plans factoriels et repr
esentation lin
eaire des
groupes.
Cette annexe est consacree `a des rappels sur la theorie algebrique de
representation lineaire des groupes nis ainsi qu`
a son application aux
19
20
PRESS (pour Prediction Error Sum of Square) mesurant cette fois les
capacites predictives du mod`ele, le R2 de prediction calcule `a partir
du PRESS, etc...
2) Toujours pour evaluer la qualite du mod`ele ajuste un certain nombre dindicateurs graphiques peuvent aider lutilisateur. Il sagit
principalement du nuage de points des residus estimes permettant
de visualiser ou non une bonne repartition des residus ou encore du
nuage de points des residus studentises plus adapte `a la detection de
mesures aberrantes. De meme, des graphiques du type droite de Henry
ou QQ-plot (pour quantile-quantile) permettent de juger la validite de
lhypoth`ese de normalite des observations.
3) Une fois le meilleur mod`ele determine le detail des diverses techniques doptimisation conduisant a` la recherche du ou des extrema
nest pas presente. En eet en dehors du cas des mod`eles lineaires
particuli`erement simples (tels les mod`eles de degre un) le probl`eme
de loptimisation (sous la contrainte de rester au sein du domaine
experimental) est un sujet tr`es vaste qui pourrait faire lobjet a` lui
seul dun ouvrage specialise. Le lecteur souhaitant se documenter plus
en detail sur ces diverses techniques pourra se referer au chapitre 5
de louvrage de Khuri et Cornell [56] concernant la methode generale
dite danalyse canonique basee sur un changement de rep`ere facilitant lanalyse dun mod`ele polynomial dordre deux. La methode classique qualiee de ridge analysis y est aussi presentee. Concernant
loptimisation de mani`ere plus generale on pourra se referer `a louvrage
de Ciarlet [18] pour la presentation de la technique des multiplicateurs
de Lagrange ainsi quun certain nombre dalgorithmes classiques (gradient, relaxation, etc...).
Le lecteur souhaitant en savoir plus sur ces diverses methodes peut aussi
consulter letude menee `a la n de ce chapitre ou bien se referer `a la plupart
des ouvrages de statistique generale tels que celui de Saporta [83] (ou Khuri
et Cornell [56] pour une approche plus orientee vers les plans dexperience).
1.5 Th`
emes non abord
es dans louvrage
Le but premier de cet ouvrage est de proposer au lecteur de solides bases
permettant dapprehender la methode des plans dexperience sous ses aspects
les plus generaux et les plus classiques. Il en resulte quun certain nombre de
th`emes plus specialises ne sont pas abordes ici. Il sagit principalement des
th`emes cites ci-dessous.
21
22
23
24
fait `a laide de simples tableurs tels que Excel ou OpenOce dailleurs tr`es
conviviaux an decrire facilement le plan dexperience ainsi que les observations. Tout langage de programmation (C, C++, Pascal, Fortran, etc...)
permet aussi de programmer aisement les divers resultats presentes.
2) Logiciels sp
ecialis
es en statistique.
Un grand nombre de logiciels specialises en statistique existent sur le
marche. Des codes SAS sont la plupart du temps utilises dans cet ouvrage
an de realiser les traitements proposes. Ce choix a ete fait par rapport aux
performances et a` la richesse de ce logiciel mais aussi en tenant compte de sa
popularite dans de nombreuses entreprises. Si lutilisation de ce logiciel nest
pas possible lutilisateur peut alors se tourner sans crainte vers le logiciel R
qui a la particularite detre totalement gratuit. Dautres logiciels statistiques
peuvent evidemment aussi etre utilises tels que : S-Plus, SPSS, Statgraphics, Genstat, etc...
3) Logiciels sp
ecialis
es en plans dexp
erience.
Il est enn possible dutiliser des logiciels directement specialises dans la
problematique des plans dexperience. Il sagit le plus souvent de modules particuliers des logiciels de statistique presentes precedemment. Pour reprendre
lexemple du logicial SAS le module SAS/QC (dedie au controle de la qualite)
permet davoir acces a de multiples procedures relatives `a la construction de
plans dexperience (ce module nest par contre pas fourni dans le package
de base SAS).
Il existe cependant un logiciel en langue francaise, Nemrod, qui est
exclusivement dedie `a la construction et lanalyse des plans dexperience.
Il presente de plus lavantage detre continuellement ameliore par une
equipe active dans la methodologie de la recherche experimentale
(http://www.nemrodw.com/). Ce logiciel est utilise, parall`element a` SAS,
pour traiter certains exemples de louvrage. Comme tout logiciel tr`es specialise
il presente lavantage detre rapidement utilisable pour traiter une etude
menee `a laide dun plan dexperience et tr`es convivial (quelques clics de
souris susent). Ses points forts sont de plus les plans dexperience pour
melanges ainsi que les sorties graphiques tr`es claires (2D et 3D simultanees).
Evidemment un tel logiciel va saverer par contre parfois dicile `a utiliser
pour des situations non-standard, cest pourquoi dans ce cas lutilisation de
SAS (en mode programmation) sera preferable.
1.7 Pr
esentation dune
etude
Terminons ce chapitre par la presentation compl`ete dune etude menee `a laide
de la methode des plans dexperience. Considerons une entreprise fabriquant
des pi`eces en plastique. Lobjectif est la conception de pi`eces les plus rigides
possibles. Le phenom`ene etudie ici etant a priori complexe `a etudier une serie
25
26
hors de ces modes de fonctionnement courants (si bien entendu cela est techniquement possible). Ceci pourra etre le cas ici puisque les specialistes du
phenom`ene etudie donnent les valeurs suivantes associees cette fois aux contraintes techniques du procede industriel (il sagit donc des valeurs `a respecter obligatoirement) :
30 x1 90 , x2 60
Ceci montre, par exemple, que la presse utilisee ne peut techniquement pas
fonctionner au del`a de 60 g/cm2 . Il ny a bien sur dans labsolu aucune contrainte pour la duree de loperation x3 si ce nest quelle doit etre positive.
1.7.3 Codage des facteurs
An de ramener chacun des facteurs `a un meme intervalle, de supprimer
leurs unites, de permettre leur comparaison et enn de simplier lanalyse
mathematique `a venir on va systematiquement les coder [voir 3.2.1]. Cette
operation classique est resumee dans la table 1.5 o`
u diverses valeurs initiales
et codees sont presentees. Comme indique precedemment les codages ont ete
realises de mani`ere `a ce que les valeurs 1 soient systematiquement associees
aux niveaux hauts et bas des valeurs de fonctionnement. Les valeurs codees
1.68 gurent aussi dans ce tableau car elles vont etre utilisees par la suite.
Table 1.5. Codage des facteurs.
Temperature ( C)
Pression (g/cm2 )
Duree (s)
Valeur cod
ee
56.6
16.6
3.98
60.0
20.0
5.00
62.5
22.5
5.75
27
X1
X2
X3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.6818
1.6818
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
0.0000
0.0000
1.6818
1.6818
0.0000
0.0000
0.0000
0.0000
0.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
0.0000
0.0000
0.0000
0.0000
1.6818
1.6818
0.0000
0.0000
0.0000
Un tel plan dexperience est qualie de composite car il est constitue de trois
parties dierentes utilisables pour divers types dajustements. La premi`ere
partie (experiences 1 `a 8) est la partie factorielle constituee par les 8 sommets
du cube unite. La seconde partie (experiences 9 `a 14) est la partie axiale constituee par des points sur les axes du rep`ere utilise. Tous ces points sont situes
a une distance egale a` 1.6818 du centre du rep`ere (la valeur exacte etant en
`
fait 81/4 ) dans le but dobtenir la propriete classique disovariance par transformations orthogonales [voir 5.2.5]. Il sagit ici du choix propose par defaut
par le logiciel. Chacune de ces 6 experiences utilise donc pour un des facteurs
des niveaux hors des valeurs de fonctionnement usuelles. Enn la derni`ere
partie du plan composite (experiences 15 a` 17) est constituee par une triple
repetition de lexperience qualiee de centrale (i.e. avec tous les facteurs xes
a leur niveau moyen). Dans un contexte statistique il est interessant de repeter
`
plusieurs fois certaines experiences car la nature aleatoire du phenom`ene va
entraner que les reponses observees ne seront pas egales. Ceci permet de plus
de realiser une analyse plus ne du phenom`ene etudie [voir 2.5.4]. Lusage de
facteurs sous forme codee simplie le travail danalyse mais cette transformation est inutile pour lutilisateur. Cest pourquoi il est courant dediter a` la
fois le plan dexperience avec les facteurs codes et le plan dexperience avec
les facteurs exprimes dans leurs unites initiales.
28
Temperature
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
C
60.0
70.0
60.0
70.0
60.0
70.0
60.0
70.0
56.6
73.4
65.0
65.0
65.0
65.0
65.0
65.0
65.0
Pression
g/cm 2
20.0
20.0
30.0
30.0
20.0
20.0
30.0
30.0
25.0
25.0
16.6
33.4
25.0
25.0
25.0
25.0
25.0
Duree
s
5.0
5.0
5.0
5.0
8.0
8.0
8.0
8.0
6.5
6.5
6.5
6.5
4.0
9.0
6.5
6.5
6.5
Cette seconde forme (table 1.7) est souvent appelee protocole exp
erimental
(le terme de plan dexperimentation est aussi utilise par le logiciel Nemrod).
Lorsque la liste des experiences est fournie au technicien devant les realiser il
convient, bien entendu, de lui donner directement le protocole experimental
auquel il devra se tenir.
1.7.5 Ajustement dun mod`
ele dordre un
Commencons par etudier le phenom`ene `a laide du mod`ele le plus simple
possible, en loccurence un polyn
ome du premier degre (en trois variables qui
sont les trois facteurs sous forme codee). En dautres termes on essaie donc
dexpliquer au mieux la reponse moyenne `a laide du mod`ele tel que :
f (x1 , x2 , x3 ) = 0 + 1 x1 + 2 x2 + 3 x3 .
On montre que pour estimer les 4 param`etres inconnus de ce mod`ele (leet
moyen general 0 ainsi que les trois eets lineaires 1 , 2 et 3 ) il est possible
de nutiliser que les experiences 2, 3, 5 et 8 de la table 1.6 (on dit que lon
consid`ere une fraction reguli`ere de la partie factorielle [voir 3.4]). An de
gagner en qualite il est possible de rajouter les experiences centrales 15, 16 et
17. Les diverses reponses observees lors de la realisation de ces 7 experiences
sont donnees ci-dessous (table 1.8, colonne notee Y 1).
29
X1
X2
X3
Y1
1
2
3
4
5
6
7
1.0000
1.0000
1.0000
1.0000
0.0000
0.0000
0.0000
1.0000
1.0000
1.0000
1.0000
0.0000
0.0000
0.0000
1.0000
1.0000
1.0000
1.0000
0.0000
0.0000
0.0000
63.4
57.2
70.2
56.6
54.8
55.2
54.6
Somme des
carres
Degres de
liberte
Carre
moyen
Rapport
Signif
Regression
Residus
Total
121.3100
83.7871
205.0971
3
3
6
40.4367
27.9290
1.4478
38.4
5.285
R2
R2A
R2pred
PRESS
Nombre de degres de liberte
0.591
0.183
N.D.
3186.361
3
Nom
Coecient
b0
b1
b2
b3
58.857
1.850
4.950
1.550
F.Ination
Ecart-Type
1.00
1.00
1.00
1.997
2.642
2.642
2.642
t.exp.
29.47
0.70
1.87
0.59
Signif. %
<0.01
53.7
15.7
60.0
30
X1
X2
X3
Y1
1
2
3
4
5
6
7
8
9
10
11
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
0.0000
0.0000
0.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
0.0000
0.0000
0.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
0.0000
0.0000
0.0000
58.9
63.4
57.2
61.3
70.2
74.5
52.6
56.6
54.8
55.2
54.6
Somme des
carres
368.3600
105.0981
473.4491
Degres de
liberte
6
4
10
Carre
moyen
61.3933
26.2723
Rapport
Signif
2.3368
21.5
31
Nom
b0
b1
b2
b3
b12
b13
b23
5.13
R2
R2A
R2pred
PRESS
Nombre de degres de liberte
0.778
0.445
N.D.
1223.474
4
Coecient
F.Ination
Ecart-Type
1.00
1.00
1.00
1.00
1.00
1.00
1.55
1.81
1.81
1.81
1.81
1.81
1.81
59.91
2.07
4.87
1.60
0.05
0.07
3.93
t.exp.
38.77
1.15
2.69
0.88
0.03
0.04
2.17
Signif. %
<0.0124
31.7
5.5
43.0
97.8
96.8
9.6
Les probl`emes dajustement de ce mod`ele peuvent etre cernes plus precisemment a` laide du nuage des residus. Ce nuage de points (donne ci-dessous)
represente, pour chacune des experiences realisees, lerreur dajustement commise (Y Y ).
Rsidus
1.45
Y Calcul
0.00
1.45
2.90
4.35
50.71
55.09
59.47
63.85
68.23
72.61
32
X1
X2
X3
Y1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.6818
1.6818
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
0.0000
0.0000
1.6818
1.6818
0.0000
0.0000
0.0000
0.0000
0.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
0.0000
0.0000
0.0000
0.0000
1.6818
1.6818
0.0000
0.0000
0.0000
58.9
63.4
57.2
61.3
70.2
74.5
52.6
56.6
53.2
61.7
74.5
58.0
57.4
63.3
54.8
55.9
54.6
Somme des
carres
Degres de
liberte
Carre
moyen
Rapport
Signif
Regression
Residus
Validite
Erreur
Total
751.4572
1.6334
0.6534
0.9800
753.0906
9
7
5
2
16
83.4592
0.2333
0.1307
0.4900
357.8215
<0.01
0.2667
89.9
33
La somme des carres due a` lerreur est maintenant tr`es faible devant la somme
totale. Ceci indique que le mod`ele semble etre maintenant bien ajuste. Le
tableau danalyse de la variance propose ici par le logiciel est plus complexe
que pour les deux mod`eles precedents car la somme des carres due aux residus
a ete decomposee en somme due `a la validite et somme due `a lerreur. Il
sagit dune technique permettant daner lanalyse de la variance, utilisable
d`es lors quau moins une experience a ete repetee, et permettant de tester
lhypoth`ese H0 : le mod`ele est bien ajuste en moyenne [voir 2.6.5]. Une
analyse plus ne donne ensuite les resultats ci-dessous :
Ecart Type de la reponse
0.483
R2
R2A
R2pred
PRESS
Nombre de degres de liberte
0.998
0.995
0.990
7.164
7
Nom
Coecient
F.Ination
Ecart-Type
b0
b1
b2
b3
b11
b22
b33
b12
b13
b23
55.093
2.284
4.910
1.686
0.855
3.966
1.880
0.088
0.037
3.693
1.00
1.00
1.00
1.16
1.16
1.16
1.00
1.00
1.00
0.278
0.131
0.131
0.131
0.144
0.144
0.144
0.171
0.171
0.171
t.exp.
197.93
17.47
37.56
12.90
5.94
27.57
13.07
0.51
0.22
23.20
Signif. %
<0.01
<0.01
<0.01
<0.01
0.0701
<0.01
<0.01
62.8
82.6
<0.01
34
58.900
63.400
57.200
61.300
70.200
74.500
52.600
56.600
53.200
61.700
74.500
58.000
57.400
63.300
54.800
55.900
54.600
58.646
63.465
56.927
61.396
70.018
74.686
52.449
56.767
53.670
61.353
74.568
58.054
57.576
63.246
55.093
55.093
55.093
0.254
0.065
0.273
0.096
0.182
0.186
0.151
0.167
0.470
0.347
0.068
0.054
0.176
0.054
0.293
0.807
0.493
0.525
0.134
0.565
0.198
0.377
0.386
0.313
0.346
0.972
0.719
0.141
0.112
0.364
0.111
0.607
1.671
1.021
dU
0.670
0.670
0.670
0.670
0.670
0.670
0.670
0.670
0.607
0.607
0.607
0.607
0.607
0.607
0.332
0.332
0.332
0.901
0.217
0.980
0.322
0.627
0.643
0.515
0.515
1.773
1.179
0.209
0.166
0.552
0.165
0.716
2.981
1.311
0.169
0.011
0.196
0.024
0.087
0.091
0.060
0.060
0.373
0.204
0.008
0.005
0.052
0.005
0.027
0.208
0.078
Les dierents residus peuvent une nouvelle fois etre representes sous forme
graphique.
Rsidus
0.78
0.52
0.26
Y Calcul
0.00
52.45
56.90
61.34
65.79
70.24
74.69
0.26
La plus grande erreur dajustement commise (de lordre de 0.8 pour une
reponse observee de 55.9) correspond a` lune des experiences dites centrales
(experiences 15, 16 et 17). Ceci etait previsible car il est impossible que la
reponse moyenne predite au centre du domaine par le mod`ele soit parfaitement ajustee aux trois valeurs dierentes obtenues lors des trois repetitions
35
(x1 , x2 , x3 ) = 0
x1
2.284 + 1.710x1 = 0
Y
4.910
+
7.932x
2 3.963x3 = 0
(x1 , x2 , x3 ) = 0
x2
1.686
+
3.760x
3 3.963x2 = 0
(x1 , x2 , x3 ) = 0
x3
Ce syst`eme dequations admet alors une unique solution donnee par :
x1 = 1.336 , x2 = 0.834 , x3 = 0.431.
On verie aisement que ce point critique est bien un minimum (global) de la
fonction Y . Ce point est de plus situe dans le domaine experimental donc il
constitue bien la solution cherchee pour le probl`eme. On verie de plus par
un simple calcul que la reponse moyenne predite par le mod`ele en ce point est
donnee par :
Y (1.336, 0.834, 0.431) 51.8.
Une valeur aussi faible pour lelasticite na jamais ete obtenue lors des 17
experiences realisees donc ce resultat est a priori tr`es interessant. Remarquons que le minimum a ete recherche ici par derivation et il a ete ainsi
36
immediatemment determine car le point critique obtenu est a` la fois un extremum et un point du domaine experimental. Ceci nest pas toujours le
cas (on peut en eet obtenir par exemple un point selle annulant toutes les
derivees partielles aussi bien quun extremum hors du domaine experimental).
Il est alors necessaire dutiliser dans de tels cas des methodes doptimisation
plus generales (multiplicateurs de Lagrange, analyse canonique, etc...) ou
bien des techniques algorithmiques de recherche approchee dextrema. Des
representations graphiques telles que celle proposee `a la gure 1.2 (avec une
representation simultanee en deux et trois dimensions pour plus de clarte)
permettent aussi de cerner la position du minimum cherche.
Dure
8.0
X3
1.00
61.0 69.057.0 55.0
53.0
0.50
6.5
X2
1.00
0.50
0.00
0.50
1.00
0.50
55.0
1.00
5.0
20.0
25.0
30.0
Pression
58.3 C
Facteur 2
Facteur 3
29.2 g/cm2
7.1 s
37
http://www.springer.com/978-3-642-11471-7