Professional Documents
Culture Documents
Chapitre 8
Corrlation et rgression
linaire simple
Jos LABARERE
Anne universitaire 2011/2012
Universit Joseph Fourier de Grenoble - Tous droits rservs.
Plan
Annexes
Plan
Corrlation :
Liaison entre 2 variables quantitatives X et Y
Rle symtrique (on peut permuter X et Y)
Rle asymtrique
Rgression :
Liaison entre 2 variables quantitatives X et Y
Rle asymtrique uniquement :
X = variable explicative / Y = variable explique
X = variable indpendante / Y = variable
dpendante
(on ne peut pas permuter X et Y)
I.2. Corrlation versus rgression
ventes glaces
ventes glaces ventes lunettes
I.2. Corrlation versus rgression
ventes lunettes
3. Exemple : rgression
X = ge (de 0 15 ans)
Y = taille (cm)
Il existe une liaison entre X et Y :
Quand lge augmente, la taille augmente
Quand lge diminue, la taille diminue
La liaison est asymtrique :
la taille dpend de lge mais lge ne dpend pas de la taille
on ne peut pas permuter X et Y en abscisses et en ordonnes
On peut prdire la taille par lge laide dune quation de droite ou
de courbe de rgression (cf carnet de sant)
I.2. Corrlation versus rgression
Corrlation Rgression
Variables X = quantitative X = quantitative
Y = quantitative Y = quantitative
Cas 1
Cas 2
Il existe une liaison entre X et Y mais cette liaison nest pas linaire
: Y varie avec les valeurs de X.
Le nuage de points nest pas rsum au mieux par une droite mais
plutt par une fonction quadratique.
La condition dapplication nest pas vrifie
Il ne faut pas utiliser le coefficient de corrlation ni la rgression
linaire simple pour quantifier la liaison entre les 2 variables
Coefficient de corrlation non nul
Pente de la droite de rgression non nulle
Cas 3
Cas 4
La nature de la liaison nest pas linaire (le nuage de points nest pas
rsum au mieux par une droite mais plutt par une fonction
exponentielle)
La condition dapplication nest pas vrifie
Il ne faut pas utiliser le coefficient de corrlation ni la rgression
linaire simple pour quantifier la liaison entre les 2 variables
I.3. Conditions dapplication de la corrlation et de la
rgression linaire simple
covX, Y X Y
i1 i X i Y
N
Cas particulier : X = Y cov(X,Y) = cov(X,X) = var(X)
N N
X X
i X i X X
i X
covX, X i1
i1
2 varX
N N
II.1. Covariance
X et Y indpendantes
cas particulier Y constant quelle que soit la valeur de X
cov X, Y X
i1 i X Yi Y
0
N
0 car Yi = constante =Y
II.1. Covariance
n n
xi y
n i
xi y i 1 n i 1
covX, Y i i1
2
n
n
xi
x 2 i 1 n
Rappel : varX
n
i i1
Plan
covX,
YX
var
varY
-1+
1
II.2. Interprtation du coefficient de corrlation
1. X et Y indpendantes : = 0
=0
2. X et Y corrles : > 0
>0
Liaison linaire croissante entre X et Y
cov(X, Y) > 0
covX,
YX
var 0
varY
NB : si Y = X cov(X,Y) = var(X) et var(Y) = var(X) =1
II.2. Interprtation du coefficient de corrlation
2. X et Y corrles : < 0
<0
Liaison linaire dcroissante entre X et Y
cov(X, Y) <0
covX,
YX
var 0
varY
NB : si Y = - X cov(X,Y) = - var(X) et var(Y) = var(X) =-1
Plan
population
chantillon
r
y y
covX, Y
n i1
s 2x s 2y i1 i
i i1 n
-1 -1 n -1
II.3. Estimation du coefficient de corrlation
x m y m
i x i y
r i1
n n
x m
my
i x
2
i y
2
i1
i1
II.3. Estimation du coefficient de corrlation
n
n
n
i1 x i i1y i
x y
i i
n
r i1
n
2
n 2
i
n
i 1 x i
n
y
i
x 2
n
i
y 2 i 1
n
i1 i1
Plan
population
chantillon
r
r
r
t (n-2)ddl
sr
1
Lestimateur de lcart-type du coefficient de sr
corrlation est gal : r
n
2
II.4. Test du coefficient de corrlation
to r n
1
2 r
Conditions dapplication
indpendance des observations
liaison linaire entre X et Y
distribution conditionnelle normale et de variance constante
1
(non-rejet de H0)
/2 /2
(rejet de H0 = acceptation de H1) (rejet de H0 = acceptation de H1)
n
r
t 2 r
1
-t t
0
|to| > t |to| |to| > t
t
Exemple :
to = 2.12
n = 20
Annexes
III.1. Rgression linaire simple
Y = + X
Y
Y : variable dpendante (explique)
X : variable indpendante (explicative)
: ordonne lorigine (valeur de Y pour
x = 0)
: pente (variation moyenne de la valeur
de Y pour une augmentation dune unit
X de X)
Plan
Annexes
III.2. Estimation par la mthode des moindres carrs
(xi, yi)
Y
(xi, yi)
Y
^)
(xi, yi
Y = + X
^
yi = + xi
X
La droite de rgression Y = + X est la droite qui rsume le mieux le
nuage de points. Intuitivement, il sagit de la droite dont les points
du nuage sont en moyenne les plus proches (cest--dire la droite
qui passe la plus faible distance de chaque point du nuage, en
moyenne).
III.2. Estimation par la mthode des moindres carrs
^ yi - yi
(xi, yi)
Y
^)
(xi, yi
Y = + X
^
yi = + xi
^)
(xi, yi
Y = + X
^
yi = + xi
Y Y = + X
my
mx
X
Y Y = + X
a et b sont les estimations de
lordonne lorigine et de la
my
pente de la droite de
rgression.
Lestimation de la pente de la
droite de rgression b est gale
mx
au rapport de la covariance de X X
et Y sur la variance de X.
n
cov X, x m y m
b b
i x i y
n
Y var
2
i1
i x
x m
X
i1
III.2. Estimation par la mthode des moindres carrs
Y Y = + X
my
mx
X
Annexes
III.3. Test de la pente de la droite de rgression
population
b
chantillon
b
b
t (n-2)ddl
sb
s 2y b 2
2
sx
Lestimateur de lcart-type de la pente est gal : sb
n
2
III.3. Test de la pente de la droite de rgression
Conditions dapplication
indpendance des observations
liaison linaire entre X et Y
distribution conditionnelle normale et de variance constante
Corrlation et rgression
Corrlation Rgression
Variance
var(X) = E(X) [E(X)]
2
1 1
varx x x 2
n n
2
n
n
xi
x i
2
i 1
n
varx i1
n
Annexe : variance et covariance
Covariance
cov(X,Y) = E(XY) [E(X) x E(Y)]
1
covx, y 1 1
n xy
n
x n y
n
n
n
x y i i
x y i i 1
n i 1
covX, Y i i1
n
Mentions lgales
L'ensemble de cette uvre relve des lgislations franaise et internationale sur le droit d'auteur
et la proprit intellectuelle, littraire et artistique ou toute autre loi applicable.
Tous les droits de reproduction, adaptation, transformation, transcription ou traduction de tout ou
partie sont rservs pour les textes ainsi que pour l'ensemble des documents iconographiques,
photographiques, vidos et sonores.
Cette uvre est interdite la vente ou la location. Sa diffusion, duplication, mise disposition du
public (sous quelque forme ou support que ce soit), mise en rseau, partielles ou totales, sont
strictement rserves luniversit Joseph Fourier (UJF) Grenoble 1 et ses affilis.
Lutilisation de ce document est strictement rserve lusage priv des tudiants inscrits
lUniversit Joseph Fourier (UJF) Grenoble 1, et non destine une utilisation collective, gratuite
ou payante.
Ce document a t ralis par la Cellule TICE de la Facult de Mdecine de Grenoble (Universit Joseph Fourier Grenoble 1)
en collaboration avec lEquipe Audiovisuel et Production Multimdia (EAEPM) de lUniversit Stendhal de Grenoble.