Professional Documents
Culture Documents
Chapitre 1
Chapitre 1
LE MODELE LINEAIRE
SIMPLE
E(Y/X’)
E(Y/X)
La droite de régression (en rouge) E(Y)=aX+b passe par les points E(Y/Xi), pour tout i=1,…n et donc en
particulier en E(Y/X) et E(Y/X’) représentés sur ce graphique.
ESTIMATION DES PARAMETRES
ESTIMATION DES PARAMETRES :
Introduction
On veut obtenir de bonnes estimations des paramètres b 0 et b1 de la droite de régression E(Y)=
b0 + b1X . On voudra également évaluer l’ampleur de la variabilité des observations Yi autour
de la droite de régression cad obtenir une estimation de la variance des erreurs.
Comme tout travail statistique, nous nous servons des données de l’expérience pour calculer
les statistiques qui servent d’estimateurs des paramètres. En régression linéaire simple
l’objectif est d’obtenir une droite qui s’ajuste le mieux possible aux points du diagramme de
dispersion. On verra comment.
Pour chaque échantillon de taille n issu de la population, on obtiendra une estimation
différente de la droite de régression E(Y)= b0 + b1X . Soit une estimation de cette droite notée
= b0+b1X où b0 (estimateur de b0) représente l’ordonnée à l’origine et b1 (estimateur de b1) la
pente de la droite. On montrera que la méthode des moindres carrés ordinaires assurent que b 0
et b1 ont des propriétés importantes.
ESTIMATION DES PARAMETRES :
Principe des MCO
On cherche donc la droite = b0+b1Xi qui ajuste le mieux le nuage de points (X1,Y1), (X2,Y2),…,
(Xn,Yn). La valeur estiméede Yi est l’ordonnée d’un point de la droite dont l’abscisse est X i.
Comme le montre la figure ci-dessous certains points du couple(X i,Yi) sont au-dessus de la
droite d’autres en-dessous. Ces écarts notés e i par rapport à la droite et définis par : e i = Yi - =
Yi - b0+b1Xi
sont appelés résidus.
Le meilleur ajustement suppose que ces écarts mesurés verticalement entre les points du nuage
et la droite de régression soient aussi faibles que possible. La méthode des MCO consiste à
minimiser la somme des carrés des écarts donc la somme des carrés des résidus :
MCO min ² =
empirique
Valeur estimée
Ecart ei = Yi -
Valeur observée
ESTIMATION DES PARAMETRES :
Application des MCO
Etape 1 : Annulation des dérivées partielles : Etape 2 : Positivité des dérivées
secondes
=0 (1)
(1) =0
= 2n ≥ 0
(1)
=0 (2) =2≥0
et
Remarques
= = =
CSQ :
Lorsque que les variables sont centrées, cad lorsque les observations sont centrées sur leur
moyenne telles que et ,
Alors et =
la droite de régression empirique passe toujours par le point (, ):
On a : = b0+b1Xi , en remplaçant b0 par sa valeur on obtient :
= +b1(Xi -)
Les équations normales peuvent s’écrire :
et
ESTIMATION DES PARAMETRES :
Résidus et mesure de dispersion
On cherche à obtenir une estimation de la dispersion des Yi donc de s².
Résidu :
ei = Yi - = Yi - b0- b1Xi = = b0 + b1Xi + ei - b0 - b1Xi et donc ei = ei – ( b0 -b0 )- (b1-b1)Xi
Estimation de s²
On montre que la statistique est un estimateur sans biais de s². Une estimation s² de s² est calculée sur
l’échantillon. Il s’agit de la variance corrigée des résidus :
s² =
Propriétés des résidus
1) : la somme des résidus est nulle, et le modèle en moyenne est correctement estimé
2) est minimale
3)
4)