Corrélation et causalité

D’après www.acnice.fr/ses/stage/outilsstatistique s/correlationetcausalite.ppt

La dépendance (corrélation)

Lorsqu’une distribution présente 2 caractères, il est parfois légitime de se demander s’il existe un lien entre eux. On s’interroge alors sur la possible dépendance, dans un sens ou dans l’autre de ces deux variables.

La représentation graphique : le nuage de points

Le graphique en nuage de points permet de mettre en évidence la relation entre 2 variables. En abscisses, on porte la variable explicative X et en ordonnée, la variable expliquée Y.

Des représentations graphiques de corrélation?
Ces représentations graphiques correspondent-elles à une relation de corrélation?

Des représentations graphiques de corrélation?
Ces représentations graphiques correspondent-elles à une relation de corrélation?

Une mise en évidence graphique de l’existence d’une corrélation

Quelle différence opérez-vous entre dépendance totale et liaison relative?

Une mise en évidence graphique de l’existence d’une corrélation

De la dépendance à la causalité
La mise en évidence d’une relation graphique ne signifie pas qu’un lien de causalité existe entre les 2 variables.

Exemple : Fautes d’orthographe et pointure
Diagramme de dispersion du nombre de fautes d'orthographe en fonction de la pointure
Nombre de fautes d’orthographe

Les élèves ayant les plus grands pieds font moins de fautes. Ces deux grandeurs apparemment indépendantes s'avèrent en fait liées négativement
Source : Nicolas Gauvrit, Statistiques : méfiez-vous, Ellipses, 2007.
Pointure

Les variables de confusion
Si deux grandeurs sont liées, il se peut qu'il n'y ait en fait aucune causalité entre elles.

Il se peut qu'aucune relation logique ne puisse alors être établie entre les deux variables.
Mais il se peut aussi qu'on trouve une causalité indirecte, passant par une autre variable (ou grandeur). Dans un tel cas, on appelle cette variable cachée variable de confusion.

Exemple : Fautes d’orthographe et pointure
Diagramme causal entre la pointure, le nombre de fautes, et la variable de confusion âge
Source : Nicolas Gauvrit, Statistiques : méfiez-vous, Ellipses, 2007.

 

L'exemple des fautes d'orthographe et de la taille des pieds est un cas où une telle variable de confusion intervient : il s’agit de l'âge. Dans une école, les plus grands pieds correspondent, en moyenne et globalement, aux élèves les plus vieux, donc à ceux de CM2, meilleurs que les CE1 ou les CP en orthographe...

Corrélation contraire au lien causal

Les variables de confusion peuvent faire apparaître des liens de corrélation entre des variables indépendantes. Mais, il existe des cas, où la corrélation est le contraire du lien causal.

Exemple : espérance de vie et consommation d’alcool
Diagramme de dispersion de l'espérance de vie à la naissance en fonction de la consommation d'alcool par pays
Espérance de vie

Le diagramme ci-contre montre une liaison positive entre les 2 variables. Cela voudrait donc dire que lorsque l’on boit plus d’alcool, on vit plus vieux.

Consommation d’alcool

Source : Joseph Klatzman, Attention stisitiques !, La Découverte 1996.

Exemple : espérance de vie et consommation d’alcool
Diagramme de dispersion de l'espérance de vie à la naissance en fonction de la consommation d'alcool par pays
Espérance de vie

La figure ci-contre nous permet de mieux analyser la relation entre ces 2 variables.
On y découvre que :  les pays les plus riches sont ceux où l’on boit le plus  Les pays les plus riches sont aussi ceux où l’on vit le plus longtemps.

Consommation d’alcool Source : Joseph Klatzman, Attention statistiques !, La Découverte 1996.

Exemple : espérance de vie et consommation d’alcool
En fait, il faut considérer la variable de confusion "richesse du pays". Cette variable agit sur l'espérance de vie de manière inverse de la consommation d'alcool.

Autrement dit, si l'on considère un pays comme la France, on peut dire que dans ce pays :

les gens boivent beaucoup parce qu'ils sont assez riches pour se le permettre. Cela a pour effet de réduire l'espérance de vie. Mais d'un autre côté, la richesse du pays permet aussi de meilleurs soins, une meilleure alimentation globale. Cela augmente considérablement l'espérance de vie. Cette augmentation fait plus que compenser la réduction d'espérance de vie due à la consommation d'alcool.

Le diagramme causal de la figure ci dessous donne une représentation de la situation.

Sign up to vote on this title
UsefulNot useful