You are on page 1of 4

Exercice ACP On considère le tableau R de notes sur 20 suivant ( n = 9 individus, p = 5 variables

) :
Mathématiques Jean Aline Annie Monique Didier André Pierre Brigitte Evelyne 6 8 6 14,5 14 11 5,5 13 9 Sciences 6 8 7 14,5 14 10 7 12,5 9,5 Français 5 8 11 15,5 12 5,5 14 8,5 12,5 Latin 5,5 8 9,5 15 12 7 11,5 9,5 12 Musique 8 9 11 8 10 13 10 12 18

Le tableau des moyennes par matière est :
Mathématiques Moyenne 9,67 Sciences 9,83 Français 10,2 Latin 10,1 Musique 11,0

On désire soumettre le tableau R à une ACP. Pour cela on est conduit à rechercher les vecteurs propres de la matrice T X X des covariances empiriques des cinq variables, qui est

  Math.  Sciences T XX =   Français  Latin  Musique 

Math. 11,4

Sciences 9,92 8,94

Français 2,66 4,12 12,1

Latin 4,82 5,48 9,29 7,91

Musique 0,111   0,056   0,389  0,667   8,67  

i) Indiquer la transformation qui permet de passer de la matrice R à la matrice X . Calculer la première ligne de X . ii) Les trois plus grandes valeurs propres de la matrice T X X des variances-covariances sont λ1 = 28,253 , λ 2 = 12,075 et λ 3 = 8,616 . Quels sont les taux d'inertie expliquée par chacun des trois axes factoriels correspondants ? En limitant la représentation à l'espace des 3 premiers facteurs, quel est le taux d'inertie totale expliquée par cette représentation ? Que peut-on en conclure ? iii) Les trois premiers vecteurs propres normés de T X X sont donnés dans le tableau ci-dessous :
1 Maths Sciences Français Latin Musique 0,515 0,507 0,492 0,485 0,031 2 -0,567 -0,372 0,650 0,323 0,113 3 -0,051 -0,014 0,108 0,023 -0,992

Calculer les coordonnées de « Jean » sur les trois axes factoriels. iv) Calculer les coefficients de corrélation linéaire entre le premier facteur et les 5 variables. v) Les corrélations entre les variables et les deux autres facteurs sont données ci-dessous :

La coordonnée du premier individu sur l'axe factoriel α est donc le produit de la première ligne T L1 de la matrice X .651 0.4 + 8. vi) En utilisant les résultats obtenus à la première et à la troisième question.576 + 0.507 0. Conclure.Facteur 2 Maths Sciences Français Latin Musique -0.02 = 0.014 0. soit : xij = rij − r j n −1 . Solution i) On passe de la matrice R à la matrice X par centrage par rapport aux variables.998 Le nuage est pratiquement dans un espace à 3 dimensions.399 0.67 = 49.576 .5 − 10. τ = λ1 + λ 2 + λ 3 α =1 ∑ λα 5 = 0.91 + 8.990 Donner brièvement une interprétation possible pour les 3 facteurs.075 49.1) 2. iii) Les coordonnées des individus sur l'axe factoriel α (valeur propre λ α ) sont données par X u α (ce sont les composantes).246 + 0.432 0.94 + 12.317 T . x14 = (5.828 = −1. n .045 -0.584 -0.626 − 1. j = 1. Les taux d'inertie expliquée par les ( ) trois premiers axes factoriels sont donc : τ1 = λ1 α =1 ∑ λα λ3 = 5 = 28.1 + 7. 2. puis sur l'espace des trois premiers facteurs.839 − 1.02 = 0.83) 2.354 − 1. calculer l'indice ponctuel de qualité de la représentation de « Jean » sur le premier axe factoriel. τ 2 = λ2 α =1 ∑ λα 5 = 12. puis sur le plan des deux premiers facteurs.626 .515 0. x12 = (6 − 9.  .354 . x13 = (5 − 10.828 = −1.828 = −1.060]⋅ ⋅ [0.298 − 1.492 0.485 0.253 49.02 . i = 1.06 ii) On a T ∑5 α =1 λ α = trace X X = 11.  .024 -0.176 Le taux d'inertie totale expliquée par cette représentation est la somme des taux calculés à la question précédente.02 α =1 ∑ λα 5 = 0.091 0.616 49.828 = −1. x15 = (8 − 11) 2.298 . calculée à la question 1.133 Facteur 3 -0. τ3 = 8. Pour le premier axe de vecteur u1 : T L1 u1 = [− 1.839 .2 ) 2. par u α . p Pour la première ligne de X on trouve donc x11 = (6 − 9.176 = 0.67 ) 2.828 = −1.031] = −2. 2.246 .

315 = 0. Angle formé entre la variable j et l'axe factoriel α β j est l'angle entre la variable et sa projection sur l'axe factoriel : cos β j = ( ) T x j vα xj λ α d'où T x j v α = λ α u jα .492 ⋅ 5.315 = 2.850 . Le tableau suivant donne les corrélations entre les variables et le premier facteur : Maths  2.315 . Il suffit donc de diviser chaque composante de la matrice précédente par l'écart type de la variable correspondante.615 /  Latin 2.507 ⋅ 5. xj βj vα Figure A.811  8.615   Latin 0.485 ⋅ 5.578 / Musique   0.4 = 0.695 Français 0. et pour le troisième axe u 3 .315 = 2.165   Le coefficient de corrélation linéaire ρ jα entre la variable j et l'axe factoriel α est le cosinus de l'angle β j ainsi formé. de même.315 = 2.67 = 0. De plus.1 = 0.031 ⋅ 5. obtenu par T X v1 = λ1 u1 . T L1 u3 = 0. ρ jα = λ α u jα σ j .752   7.737 /  Sciences  2. pour le deuxième axe u 2 .94 = 0.315 = 2.91 = 0.737   Sciences  0.On trouve. Le troisième facteur est fortement corrélé avec la musique et caractérise l'« aptitude artistique » (musicale ici).578 Musique   0. Le deuxième facteur oppose les matières scientifiques et littéraires. T L1 u 2 = −0.566 . Puisque λ1 = 28. .901 12. vi) L'indice ponctuel est défini par cos 2 (θi ) où θi est l'angle entre le vecteur individu (centré) L i et le sous-espace vectoriel de la représentation l i (ici le premier axe factoriel).916 8. Finalement.056   v) Le premier facteur est fortement et positivement corrélé avec les quatre matières principales : c'est un facteur de taille.695 / Français  2. u α = T X v α r j − rj n −1 d'où x j 2 = 1 n 2 ∑ ( rij − rj ) = σ2j ( σ j est n − 1 i =1 l'écart-type de la variable j ) et donc x j = σ j .165 / 11.515 ⋅ 5. on a Maths 0.253 = 5.1. iv) Commençons par calculer les coordonnées des variables sur le premier axe factoriel v1 de l’analyse du nuage des variables. x j = Or.

Notons maintenant l1 j la projection de l'individu 1 sur le j -ième axe factoriel.2. cos 2 (θ1 ) = Gl1 2 GL1 2 = 0.L1 (Jean) G θ1 l1 F1 Figure A. Jean est déjà bien représenté sur le premier axe factoriel et idéalement dans l'espace des 3 premiers axes puisque .904 )2 = 8. Angle formé entre l'individu Jean et le premier axe factoriel On a donc cos 2 (θi ) = Gl i 2 GLi 2 .000. GL1 = ∑ x12j 2 j =1 5 Ainsi.923 Considérons le plan des trois premiers axes factoriels : cos 2 (θ1 ) = Gl11 2 + Gl12 + Gl13 2 GL1 2 2 = 1. Gl1 2 = (− 2.000 cos 2 (θ1 ) vaut 1.890 pour le premier axe. Considérons le plan des deux premiers axes factoriels : cos2 (θ1 ) = Gl11 + Gl12 2 GL1 2 2 = 0.433 .