You are on page 1of 9

L’estimation du modèle a priori

Décompter les ddl

------------ François Cheptou Juin 2004

Dans le programme de mathématiques BTS Chimiste, trois modèles a priori sont étudiés.

1) y = µ (modèle simple)
2) y = α x + β (modèle affine – droite des moindres carrés)
3) y = α0 + α1 x1 + α2 x2 + α12 x1x2 (modèle polynomial du premier degré – plans d’expérience)

L’objectif est toujours le même ; à partir de n mesures ou expériences :


y1 , y2 , … , yn
il s’agit d’estimer au mieux le modèle théorique et si possible l’erreur expérimentale. Ce dernier point
nécessite un savoir-faire : décompter les ddl (degrés de liberté)

Rappelons que seule la variable y est à étudier ou à expliquer, les valeurs de la variable x ou des
variables x1 , x2 , x12 sont données (variables explicatives).

Le principe est simple :


• estimer le ou les coefficients du modèle théorique,
• recalculer la réponse y à partir du modèle estimé,
• faire l’examen des écarts entre la réponse observée d’une part et la réponse recalculée d’autre
part.

Remarque : dans un souci de clarté, les lettres grecques désignent les paramètres inconnus.
Partie A Les degrés de liberté ou ddl

I- Une approche intuitive, la dimension d’un ensemble de points

Le vocabulaire 2D, 3D étant suffisamment vulgarisé, intuitivement on précise la dimension des


ensembles de points usuels : le plan, l’espace, la droite, le point...1
Ensuite, la démarche est simple.

r
Etape 1 : Un point O et un vecteur unitaire i

L’ensemble des points M d’abscisse x est une droite.


Soit un ensemble {M (x)} de dimension 1

Introduisons une équation ie une « contrainte » par exemple x = 2


L’ensemble des points M d’abscisse x vérifiant x = 2 se réduit à un point.
Soit un ensemble {M ( x) et x = 2} de dimension 0, plus précisément de dimension 1-1=0

r r
Etape 2 : Un point O et deux vecteurs unitaires ( i ; j ) non colinéaires ie le repère d’un plan

1) L’ensemble des points M de coordonnées (x1 ; x2) est un plan. Soit un ensemble de dimension 2

Un point M1(x1) d’une droite, donc de dimension 1 « plus » * un point M2(x2) d’une autre droite
« indépendante » de la première de dimension 1 également, définissent un point M (x1 ; x2) unique du
plan de dimension 2 et réciproquement, d’où l’intérêt de la formule synoptique :
1+1=2
* c’est une addition vectorielle

1
L’espace, le plan, la droite, le point, et … pourquoi pas l’ensemble vide, logiquement de dimension -1
Synoptique 1+1=2

X1

M1 (x1 )

M (x1 ; x2 )

M2 (x2 )
X2

x1 + x2
2) Introduisons une équation ie une « contrainte » par exemple = 0,5
2
x +x
L’ensemble des points M de coordonnées (x1 ; x2 ) vérifiant 1 2 = 0,5 est une droite.
2
⎧ x1 + x2 ⎫
Soit un ensemble ⎨M ( x1 ; x2 ) et = 0,5⎬ de dimension 1 plus précisément 1+1-1=1
⎩ 2 ⎭

3) Introduisons une autre équation « indépendante de la première» par exemple 2 x1 + x2 = 5


L’ensemble des points M de coordonnées (x1 ; x2 ) vérifiant
⎧ x1 + x2
⎪ = 0,5
⎨ 2 est le point d’intersection de deux droites de dimension 0.
⎪⎩2 x1 + x2 = 5
⎧ x1 + x2 ⎫
L’ensemble ⎨M ( x1 ; x2 ) et = 0,5 et 2 x1 + x2 = 5⎬ est de dimension 1+1-1-1=0
⎩ 2 ⎭

Question : quelle est la dimension des ensembles de points suivants


{M ( x1 ; x2 ) et 4 x1 + 2 x2 = 10 et 2 x1 + x2 = 5} rep 1
{M ( x1 ; x2 ; x3 ) et 2 x1 + x2 = 5} rep 2
{M ( x1 ; x2 ; x3 ) et 2 x1 + x2 = 5 et x1 + x2 + x3 = 5} ? rep 1
Autre question : quelle est la dimension de {M ( x1 ; x2 ) et 2 x1 + x2 = 6 et 2 x1 + x2 = 5} ? rep -1
II- Une mesure

Etape 1

Soit Y la variable aléatoire qui, à une expérience associe la mesure y observée.


L’ensemble des « possibles » ou univers est un ensemble de dimension 1

yy .
Etape 2

Soit (Y1 ; Y2 ) le couple de variables aléatoires qui, à deux expériences indépendantes associe le couple
de mesures (y1 ; y2 ) observées.
L’ensemble des « possibles » ou univers est un ensemble de dimension 2.

Synoptique 1+1=2

Y1

y1

( y1 ; y2 )

y2
Y2

Etape 3

Soit (Y1 ; Y2 ; Y3 ; … ; Yn) une suite de n variables aléatoires indépendantes.


L’ensemble des « possibles » { (y1 ; y2 ; y3 ; … ; yn) } est un ensemble de dimension 1+1+1+..+1=n

Etape 4

Imposons une contrainte ou une relation entre les n mesures observées par exemple le calcul préalable
y + y 2 + ... + y n
de la moyenne : 1 =y
n
y1 + y 2 + ... + y n
L’ensemble des « possibles » { (y1 ; y2 ; y3 ; … ; yn) et = y } est un ensemble de
n
dimension 1+1+1+..+1-1=n - 1

Etape 5

La dimension de l’ensemble des « possibles » est appelée le nombre de ddl

Pour décompter les ddl associés à un calcul statistique, il suffit de repérer le nombre n de mesures
indépendantes effectuées et le nombre p de relations indépendantes liant ces mesures.

Exemple 1
Le calcul de la somme S de n mesures S = y1 + y 2 + ... + y n
ddl = 1+1+…+1=n

Exemple 2
Le calcul de la somme Q des carrés des écarts à la moyenne Q = ( y1 − y ) 2 + ... + ( y n − y ) 2
ddl = 1+1+…+1-1=n – 1

Exemple 3
Le calcul de la somme Q des carrés des écarts à la droite des moindres carrés
Q = ( y1 − ax1 − b) 2 + ... + ( y n − axn − b) 2
a et b sont des calculs préalables et donc, des contraintes liant les n observations (y1 ; y2 ; y3 ; … ; yn)
ddl = 1+1+…+1-1-1=n – 2

Conclusion : l’ensemble des « possibles » de la mesure est de dimension 1, d’où la nécessité de diviser
ces sommes par le nombre de ddl. Ainsi, une estimation s de l’écart entre la mesure observée et la
mesure « théorique » est donnée par la célèbre expression :

Q
s=
ddl (estimation de l’erreur expérimentale)
Partie B L’estimation d’un modèle a priori

I- y=µ (modèle simple)

On veut estimer une grandeur µ à partir de n mesures indépendantes et répétées :


(y1 ; y2 ; y3 ; … ; yn)

La valeur moyenne y est la mieux placée. (Ce qui se démontre aisément en statistiques)
D’où, y = y est une estimation du modèle théorique y = µ

L’estimation s de l’erreur expérimentale. Disposition des calculs.

Réponse observée yi Réponse recalculée y i* Carré de l’écart ( yi − yi* ) 2


y1 y ( y1 − y ) 2
y2 y ( y2 − y ) 2
…. … …
yn y ( yn − y ) 2

y = .... Q = ...
ddl = …
s = ...

Remarque : on retrouve un résultat connu s =


∑(y i − y)2
n −1
II- y=αx+β ( modèle affine)

On cherche à expliquer l’évolution d’une réponse y à partir d’une variable x dite explicative.
Le modèle supposé est affine : y = α x + β

On dispose de n mesures yi obtenues de la manière suivante :


à x=x1 , on obtient y1
à x=x2 , on obtient y2
...
à x=xn , on obtient yn

La droite des moindres carrés y = a x + b est la mieux placée pour estimer la droite théorique y = α x +
β (ce qui se démontre aisément en statistiques)

y variable à expliquer y=αx+β

yn * y=ax+b

y2 *
*

y1 * x variable explicative

x1 x2 xn

L’estimation s de l’erreur expérimentale. Disposition des calculs.

Réponse observée yi Variable explicative xi Réponse recalculée y i* Carré de l’écart ( yi − yi* ) 2


y1 x1 y1* = ax1 + b ( y1 − y1* ) 2
y2 x2 y 2* = ax 2 + b ( y 2 − y 2* ) 2
…. … …
yn xn y n = ax n + b
*
( y n − y n* ) 2

a = ..... b = .... Q = ...


ddl = …
s = ...

Remarque : on retrouve un résultat connu s =


∑(y i − axi − b) 2
sous Excel : ERREUR.TYPE.XY
n−2
(estimation de l’écart résiduel moyen entre les points et la droite théorique)
III- y = α0 + α1 x1 + α2 x2 + α12 x1x2 (modèle polynomial du premier degré)

On cherche à expliquer l’évolution d’une réponse y à partir de deux* variables x1 et x2 dites


explicatives.
x1 (resp. x2) = -1 au niveau bas du facteur F1 (resp. F2)
x1 (resp. x2) = +1 au niveau haut du facteur F1 (resp. F2)
Le modèle supposé est un polynôme du premier degré : y = α0 + α1 x1 + α2 x2 + α12 x1x2

* trois variables peuvent être envisagées (cf programme)

Plan initial
On dispose de 4 réponses yi obtenues de la manière suivante (Yates):
à x1 = -1 et x2 = -1, on obtient y1
à x1 = +1 et x2 = -1, on obtient y2
à x1 = -1 et x2 = +1, on obtient y3
à x1 = +1 et x2 = +1, on obtient y4
permettant de calculer a0 , a1 , a2 , et a12 (estimations des effets α0 , α1 , α2 , et α12)

L’équation ainsi obtenu y = a0 + a1 x1 + a2 x2 + a12 x1x2


estime le modèle théorique y = α0 + α1 x1 + α2 x2 + α12 x1x2

y = α0 + α1 x1 + α2 x2 + α12 x1x2
Y variable à expliquer
y = a0 + a1 x1 + a2 x2 + a12 x1x2

y1
z y2
z

-1

z y4
-1
y3 1
X1 variable explicative
z

1
X2 variable explicative

L’ensemble des « possibles » { ( y1 ; y 2 ; y3 ; y 4 ) et a0 = et a1 = et a 2 = et a12 = }


est de dimension 1+1+1+1-1-1-1-1=0

ddl = 0, il n’est pas possible d’estimer l’erreur expérimentale.

Effets négligeables et mesures au « centre »

Pour estimer l’erreur expérimentale, il est donc nécessaire de retenir un modèle renfermant un nombre
moins important de paramètres inconnus et/ou d’ajouter des mesures complémentaires (au centre par
exemple).

L’estimation s de l’erreur expérimentale. Disposition des calculs.

Réponse observée yi Variables Réponse recalculée y i* Carré de l’écart ( yi − yi* ) 2


explicatives
y1 -1 -1 y1* = a 0 + ... ( y1 − y1* ) 2
PLAN y2 +1 -1 y 2* = a0 + ... ( y 2 − y 2* ) 2
INITIAL y3 -1 +1 y3* = a 0 + ... …
y4 +1 +1 y 4* = a 0 + ...
AUTRES y5 0 0 y 5* = a 0
...yn y n* = a 0 + ... ( y n − y n* ) 2

a0 = ..... a1 = ..... a2 = ..... a12 = ..... Q = ...


ddl = …
s = ...

F.Cheptou
Professeur de mathématiques
ETSCO
francois.cheptou@uco.fr