You are on page 1of 7

Analyse factorielle des correspondances de Benzcri

Laboratoire dAnalyse Recherche en Economie Quantitative


One Pager

Dcembre 2013

Vol. 8 Num. 011


Copyright Larq 2013

http://www.lareq.com

Analyse Factorielle des Correspondances de Benzcri


Une illustration laide de la mtrique de Chi deux
Yannick Mavita Mukwanga

Lincomprhension vient de trois dficits majeurs, savoir : le manque de pr


requis ; la non matrise du jargon ; . . .
Jean Paul Tsasa
Rsum
Ce

papier

prsente

un

outil

danalyse

des

donnes,

lanalyse

factorielle

des

correspondances, en se basant sur la notion de la mtrique de Chi deux.

Mots cl : mtrique de chi deux, analyse factorielle des correspondances

Abstract
This paper focuses on the correspondence analysis, based on the notion of chi-squared
distance metric.

Introduction
Lanalyse en composantes principales [ACP] permet de produire dans un espace de faible
dimension une ou plusieurs reprsentations graphiques cherchant mettre en vedette les
principales caractristiques des donnes initiales [Mavita, 2013, One pager vol.8, num. 11]. De ce
fait, son efficacit dpend fortement de la nature des donnes, dans le sens o cette mthode
devient inapproprie en face des donnes qualitatives. Cest sous cet angle que ce papier propose
un outil alternatif de lanalyse factorielle, lanalyse factorielle des correspondances [AFC],
permettant de trancher sur lanalyse des donnes qualitatives. Contrairement lACP, lAFC
sintresse plus au lien entre ces variables qu leur intensit.
Prcisons dores et dj que cette mthode des correspondances, permettant la visualisation et la
hirarchisation de linformation a t mise au point ds 1941 par Louis Guttman. Cependant, cest
en 1962 que le statisticien franais Jean Paul Benzcri

dveloppa une analyse des

correspondances particulire sur base de la mtrique de Chi deux. Depuis lors, cette mthode
est devenue trs pratique du fait de sa particularit de faire recours une distribution classique.
Lobjet de ce papier est de procder une prsentation succincte et pratique de lAFC et plus
particulirement de lAFC de Benzcri. A cet effet, deux sections seront retenues dont la premire
rappelle la mtrique de Chi deux et la seconde expose la mthode AFC.

Jean Paul Benzcri est un statisticien franais n en 1932 et il est le fondateur de lcole franaise danalyse
des donnes.
Yannick Mavita Mukwanga
Laboratoire dAnalyse Recherche en Economie Quantitative

101

Mtrique de Chi - deux


Cette section fournit un aperu global de la mtrique de Chi deux, mise au point par le
statisticien britannique Karl Pearson en 1900. Pour une prsentation et une dmonstration plus
rigoureuses, nous renvoyons Tombola [2013].
Sagissant de variables qualitatives, il sied de noter quune variable qualitative est une variable
dont les valeurs ne sont pas numriquement mesurables. Selon la hirarchisation des modalits,
ces variables peuvent tre ordinales, si les tats de la variable ou modalits peuvent tre
hirarchiss ou ordonns ; ou nominales si les modalits peuvent tre ordonnes.
Selon la variabilit des modalits, on distingue gnralement la variable binaire (dichotomique) et
la variable polytomique, selon quelle prend respectivement deux ou

modalits.

Ainsi, cest la recherche de lexplication de liaison entre deux variables qualitatives que Pearson
a pu proposer la mtrique de Chi deux. Ce test est connu sous le nom dindpendance des
caractres tudis dans un tableau de contingence. . Nous en prsentons la dmarche.
Considrons un tableau de contingence1 de deux variables polytomiques X et Y sur un chantillon
de taille T et des modalits respectives

et

Tableau 1

Modalits de Y

Total

Modalits de X

Total

Ainsi, on peut prsenter ce tableau sur base des frquences qui sont dtermines par :

et

reprsentent les frquences marginales.

Pour plus de dtails sur le tableau de contingence, nous pensons Tombola (2013, p. 55).

Yannick Mavita Mukwanga


Laboratoire dAnalyse Recherche en Economie Quantitative

102

En cherchant liminer lincidence des effets marginaux ou conditionnels, on dtermine les


frquences relatives.
Pour les colonnes, on obtient le tableau des profils colonnes avec :

la probabilit conditionnelle.
Il convient de noter que lavantage de cette transformation est quelle autorise une pondration de
chaque frquence par la frquence marginale de sorte que la comparaison entre deux lignes ne
soit pas influence par la diffrence de leurs effectifs.
Tableau 2 : Tableau des profils colonnes

Modalits de Y

Distribution

Modalits de X

marginale selon X

Total

Par analogie, on trouve le tableau des profils lignes.


Prsentation de la mthode AFC
Lintrt de la mthode AFC rside dans le fait que la mthode de lACP apparat inoprante en
face des donnes qualitatives. Aussi, le niveau lev de la frquence des analyses des faits
intrinsquement qualitatifs ont pousss les scientifiques rflchir sur une mthode pratique
traitant des donnes qualitatives, la mthode de lAFC. Cette mthode base son analyse sur la
comparaison des modalits de deux variables
Le choix sur lAFC de Benzcri se justifie par le simple fait que dans son approche, Benzcri fait
appel une notion connue et pratique concernant les donnes qualitatives, la mtrique de Chi
deux.
Mise en uvre de lAFC1
La mthode de lAFC suit la mme dmarche que la mthode de lACP, de la transformation des
donnes linterprtation en passant par lanalyse de chaque nuage des points.

Pour question de dtails et dapplications numriques sur la mthode AFC, lire Delgado (2001) et Zouhhad
(2002).
Yannick Mavita Mukwanga
Laboratoire dAnalyse Recherche en Economie Quantitative

103

Transformation des donnes en profils : la premire dmarche consiste transformer les


donnes en tableaux des profiles lignes et profiles colonnes.
Analyse des nuages des points
Reprsentation graphique des profils colonnes
Les profils lignes peuvent tre reprsents dans

et les

catgories. Chaque profil ligne donne un point

axes du systme reprsentant les

de coordonnes

, les probabilits

conditionnelles de chaque colonne du tableau des profils colonnes.


Ces points ont un barycentre not

et les coordonnes sont calcules par :

Figure 1

F2
j2
jn
Bj
F1

j3

j1

Cette carte factorielle indique que les modalits j1 et j2 sont voisines, la modalit jn est proche du
barycentre tandis que la modalit j3 est un point extrme et oppos tous les autres.
Reprsentation graphique des profiles lignes

Cependant, lAFC en tant une des mthodes danalyse factorielle cherche des axes principaux en
projetant tous ces points sur un mme plan. Le premier axe factoriel
des moindres carrs qui ajuste tous

points

est dtermin par la droite

. Cette droite est dans ce plan de projection,

suit naturellement la direction dinertie maximale de tous ces points, passe par
dtermine dans

. Le deuxime axe factoriel

du barycentre par rapport

et lquation est

est dtermin par une perpendiculaire abaisse

Comme les profiles colonnes, les profiles lignes peuvent tre galement reprsents dans
et n axes reprsentant les catgories. Chaque profil ligne donne un point de coordonnes les
probabilits conditionnelles de chaque ligne du tableau des profils lignes.

Yannick Mavita Mukwanga


Laboratoire dAnalyse Recherche en Economie Quantitative

104

Ces points ont un barycentre not

dont les coordonnes sont trouves par :

En projetant ces points sur un mme plan, le premier axe factoriel F3 est donn par la droite des
moindres carrs qui ajuste ces points. Cette droite est dans ce plan de projection, suit
naturellement la direction dinertie maximale de tous ces points, passe par
dtermine dans

. Le deuxime axe factoriel

du barycentre par rapport

et lquation est

est dtermin par une perpendiculaire abaisse

.
Figure 2

F4
i2
in
Bi
F3

i3

i1

Cette carte factorielle montre que les modalits i1 et i2 sont voisines, la modalit in est proche du
barycentre tandis que la modalit i3 est un point extrme et oppos tous les autres.
Dualit des profils lignes et des profils - colonnes
Il sagit de reprsenter sur mme graphique les deux cartes factorielles prcdentes.
Figure 3

F2

F4

j1
i1
F1

Bj

j3

i3

Bi

i2

F3
j2

Yannick Mavita Mukwanga


Laboratoire dAnalyse Recherche en Economie Quantitative

105

Les zones encercles selon les proximits montrent les correspondances entre les modalits. La
figure indique que la zone M fait apparatre deux sous zones particulires avec videmment deux
correspondances particulires.
Somme toute, le prsent papier a donn une vision plus ou moins simplifie de la mthode
danalyse factorielle des correspondances (AFC). Par ailleurs, il reste une srie de mthodes
danalyse factorielle qui seront abordes dans des publications ultrieures, et ce sera galement
de fournir des illustrations plus pratiques laide des logiciels appropris.

Yannick Mavita Mukwanga


Laboratoire dAnalyse Recherche en Economie Quantitative

106

Rfrences bibliographiques

DELGADO Jean pierre, 2001, Mathmatiques appliques, ESKA, 2 Edition, Paris, 165p.

DENIZET Frdric, 2008, Algbre et gomtrie, Edition Nathan, Paris, 501p.

ESCH Louis, 1992, Mathmatiques pour conomistes et gestionnaires, Edition De Boeck,


Bruxelles, 697p.

KLOTZ Grard, 2000, Mathmatiques pour les sciences conomiques et sociales, Edition
Presses universitaires de France, Paris, 344p.

MALU Rassa, 2010, Lindispensable des Mathmatiques, Collection savoirs et dcouvertes,


Louvain-la-Neuve, 116p.

MAVITA Yannick, 2013, Analyse en composantes principales , One pager (septembre),


8 (11): 92 100.

MICHEL Philippe, 1989, Cours de mathmatiques pour conomistes, Economica, 2


Edition, Paris, 748p.

MONIER Jean Marie, 1993, Gomtrie, Editions Dunod, Paris, 347p.

PEARSON, Karl, 1901, On Lines and Planes of Closest Fit to Systems of points in Space,
Philosophical Magazine, 2 (6): 559 572.

TOMBOLA Cdrick et Jean Paul TSASA, 2013, Analyse de la Structure dEspaces


Vectoriels , One Pager Larq (fvrier), 5 (15): 93 99.

TOMBOLA Cdrick, Au dl de la corrlation linaire : Mtrique de Khi deux et rapport


de corrlation , One Pager (fvrier), 5 (9):, 54 59.

ZOUHHAD Rachid, Jean Laurent VIVIANI et Franoise BOUFFARD, 2002, Mathmatiques


appliques, Dunod, 5 ed, Paris, 335p.

Yannick Mavita Mukwanga


Laboratoire dAnalyse Recherche en Economie Quantitative

107