You are on page 1of 6

Statistique Double

1- Introduction :
Souvent, pour l’étude de certains phénomènes, on est amené à considérer
deux ou plusieurs caractères en même temps, dont le but est de savoir s’il
existe une relation entre ces caractères (variables).

2- Définition :
On appelle statistique à deux dimensions, ou Statistique Double, toute
applications C définie d’un ensemble  fini vers R 2
 R 2
C : 
 C     X ( ), Y ( ) 


X   : Est la réponse de l’individu  au caractère X, X est appelée


la première statistique marginale.
Y   : Est la réponse de l’individu  au caractère Y , Y est appelée
la deuxième statistique marginale.

3- Présentation des tableaux statistiques à doubles entrées :


Tableau de Contingence :
On considère deux caractères quantitatifs X et Y, mesurés sur n individus,
Le caractère X présente k modalités x1  x2  ...  xk
Le caractère Y présente l modalités y1  y2  ...  yl
Les observations sont classées dans un tableau, où figurent en :
1° colonne, les modalités de X.
1° ligne les modalités de Y.
Le tableau comportera k lignes et l colonnes, le nombre inscrit dans la
case (i,j) : ième ligne et jème colonne, est notée : n i j donné par :
n i j = l’effectif des individus qui présentent à la fois la modalité x i de X
et la modalité y j de Y
Y yj yj ……. yj ….. yl total
X
x1 n11 n12 n1 j n1l n 1.
x2 n21 n22 n2 j n2l n 2.
.
xi ni1 ni 2 nij nil n i.
.
xk nk1 nk 2 nkj nkl n k.

Total n .1 n. 2 n. j n. l
n
1
Statistique Double

n i . : est l’effectif des individus qui présentent la modalité de X


l
C’est le total des effectifs de la ième ligne =  n i j
j 1
n. j : est l’effectif des individus qui présentent la modalité y j de Y
k
C’est le total des effectifs de la jème colonne =  n i j
i 1
k l
Remarque : n   n i. =  n . j
i 1 j 1

On définit aussi les fréquences :


ni j
fij : La proportion d’individus qui présentent la modalité x i de
n
X et la modalité y j de Y.
ni . n. j
fi .  et f . j 
n n

k l k l
 f i . =  f . j =   fi j  1
i 1 j 1 i 1 j 1

On peut tracer le tableau de contingence des fréquences :

Y yj yj ……. yj ….. yl total


X
x1 f11 f12 f1j f1l f 1.
x2 f 21 f 22 f2 j f 2l f 2.
.
.
xi fi1 fi2 f ij f il f i.
.
.
xk f k1 fk 2 f kj f kl f k.

total f .1 f. 2 f. j f. l 1

2
Statistique Double

4- Distributions marginales :
 Les sommes des effectifs ou des fréquences en lignes, définissent la
distribution marginale du caractère X : appelé 1° distribution
marginale.

X x1 x2 ….. xi ….. xk Total


n i. n 1. n 2. n i. n k. n

 Les sommes des effectifs ou des fréquences en colonnes, définissent


la distribution marginale du caractère Y : appelé 2° distribution
marginale.

Y y1 y2 ….. yj ….. yl Total


n.j n .1 n .2 n.j n .l n

Exemple :
Le tableau suivant indique la répartition de 50 logements d’une cité, en fonction de leur
surface X exprimée en m 2 et du nombre de pièces principales Y.

X\Y 3 4 5 6 n i.
70 4 5 1
80 2 8 3
90 2 6
100 1 8 10
n. j

1. Déterminer le nombre de logements de 4 pièces dont la surface est supérieure à 80 m 2 .


2. Quel est le pourcentage de logements de superficie  90 m .
2

3. Quel est le nombre de logements de surface  80 m 2


4. Quel est le nombre de logements de 4 pièces ?
5. Que représentent la colonne ni . et la ligne n. j ?
6. Donner les distributions marginales de X et Y.
7. Calculer la surface moyenne de l’ensemble des logements.
8. Calculer et donner les significations des fréquences conditionnelles :
f et f
X 70 / Y 3
.
Y  4 / X 70

3
Statistique Double

5- Distributions conditionnelles:
Considérons les n i . individus qui présentent la modalité x i de X , parmi
ni j
ceux là, il y a une proportion qui présentent simultanément la
n i.
modalité y j de Y.
ni j
Cette proportion est appelée fréquence conditionnelle de la modalité
n i.
y j sachant la modalité x i de X. et on note :
ni j
f Y  y j / X  xi  .
n i.
Et
ni j
f X  xi / Y  y j  : la fréquence conditionnelle de la modalité x i ,
n. j
sachant la modalité y j de Y.
6- propriétés :
ni j fi j
f X  xi / Y  y j    f i j  f X  xi / Y  y j . f . j
n. j f. j
ni j fi j
f Y  y j / X  xi    f i j  fY  y j / X  xi . f i .
n i. f i.

7- indépendance :
X et Y sont dites indépendantes si f i j  f i . . f. j , i 1,..., k
 j 1,...,l
Remarque :
Si X et Y sont indépendantes  f X  x i / Y  y j  f X  xi
fY  y j / X  xi  f Y  y j

8- moyenne et variance :
Les moyennes et variances sont définies comme au chapitre précédent :
2
1 k 1 k
X   n i . xi et  ( X )  V ( X )   ni . xi  X 
2
n i 1 n i 1
2
1 l
Y   n . j y j et
n j 1
 (Y )  V (Y ) 
2 1 l
 n . j y j Y
n j 1
 

4
Statistique Double

9- moyenne conditionnelle :
k
m X /Y  y   f X  xi / Y  y j . x i
j i 1
l
m Y / X  x   f Y  y j / X  xi . y j
i j 1

10- covariance entre X et Y : Cov(X,Y)


1 k l
Cov  X , Y     ni j xi  X  y j  Y
n i 1 j 1
 
1 k l
   ni j xi y j  X Y
n i 1 j 1

11- Coefficient de corrélation linéaire :


Cov X , Y 
Il est défini par : r  X , Y   ,
 X Y
Avec Xet Y sont les écart types de X et Y.
 1  r  X ,Y   1

12- Régression linéaire :


a. Définition et Représentation : nuage de points

Une série statistique à deux caractères quantitatifs X et Y, est une


série statistiques double dont les valeurs sont données par les couples
(xi; yi). Cette série est représentée dans un repère orthogonal , par les
points de coordonnées (xi; yi) qui forment un nuage de points. Ce nuage
peut avoir une forme allongée (au voisinage d’une droite) ou curviligne
ou parabolique ou très dispersée.
On cherche à savoir s’il existe une relation ou un lien entre les
variables X et Y, pour cela on se base sur le calcul du coefficient de
corrélation linéaire :

Cov X , Y 
r  X ,Y     1, 1 
 X Y
r est une mesure symétrique qui mesure le lien linéaire entre X et Y.
r  1 : X et Y sont proportionnels et varient en sens opposé.
r  1 : X et Y sont proportionnels et varient dans le même sens.
r  0 : X et Y ne sont pas corrélés.

5
Statistique Double

Si r ( X ,Y )  0.75 , On a une forte corrélation linéaire entre X et Y.


Si non (  0.75  r  0.75 ) : faible corrélation linéaire.

Propriété :
Si X et Y sont indépendants, alors r  X , Y   0 .

b. Droite de régression de Y en X :
Lorsque le nuage de points pourrait se distribuer au voisinage
d’une droite, la droite d’ajustement est donnée par l’équation
suivante :
(D) : Y  a X  b
Cov X , Y 
Avec a 
V (X )
b, est tel que la droite passe par le point G  X ,Y : le centre de
gravité. Donc b  Y  a X .

c. Droite de régression de X en Y:
D: X  Y  
Cov X , Y 

V (Y )
  X  Y

d. Remarque :
- Les deux droites D  et D  passent par le même point
G  X ,Y : le centre de gravité.
- D  et D  sont perpendiculaires si et seulement si
r  X ,Y   0 .
- D  et D  sont identiques (confondues) si et seulement si
r  X , Y   1 : ceci correspond, aux cas où les points sont
alignés, la corrélation est maximale.

You might also like