You are on page 1of 31

Université du Québec à Trois-

Rivières

Maîtrise en mathématiques et informatique appliquées

Réalisé par : Professeur :

Amine DAOUDI Nadia GHAZALI

Ayoub BOKHABRINE
TABLE DES MATIERES
Maîtrise en mathématiques et informatique appliquées ............................................................................. 1
EXERCICE 1 : .................................................................................................................................................. 4
Solution EXERCICE 1 : .................................................................................................................................... 4
a) Calcule de la matrice X des Variables Centrées : .............................................................................. 4
b) Calcule de la matrice : = 𝑋𝑇𝑋 ......................................................................................................... 5
c) En déduire la troisième valeur propre, calcule du troisième vecteur propre u3 ............................. 6
d) Le pourcentage d’inertie expliquée par les deux premiers axes factoriels : .................................... 7
e) Représentation du nuage des points-individus dans le plan ............................................................ 7
f) Situer les membres G, H, I parmi les individus A,...,F sur le graphique précédent. ...................... 8
EXERCICE 2 : ................................................................................................................................................ 11
a) Démonstration du 𝑚𝑗𝑗′ a les mêmes marges que le tableau binaire 𝑘𝑗𝑗′ : .................................... 11
b) Démonstration qu’il y a une indépendance conditionnellement à T entre J1 et J2, alors 𝑚𝑗𝑗′ est
égal à 𝑘𝑗𝑗′ : .............................................................................................................................................. 12
c) Indépendance conditionnelle moyenne entraîne t’elle l’indépendance conditionnelle ............... 13
d) L’analyse des correspondances du tableau J1 × J2 ......................................................................... 13
e) Indiquer ce que permet d’étudier l’analyse des correspondances binaires de ce tableau. ........... 13
EXERCICE 3 : ................................................................................................................................................ 14
a) L’ACM de Z est équivalente à celle de 𝐵 = 𝑍𝑡𝑍 ............................................................................. 14
b) L’ACM de Z est équivalente à celle de 𝑍2𝑇𝑍1 ................................................................................ 15
EXERCICE 4 .................................................................................................................................................. 16
SOLUTION EXERCICE 4 ................................................................................................................................ 16
a) Que conclut-on du fait que la statistique du khi-deux ................................................................... 16
b) Pourquoi cette statistique a-t-elle 45 degrés de liberté ................................................................. 16
c) Quelle proportion de l’inertie est expliquée par les deux premiers axes factoriels ....................... 16
d) Quel point-ligne est le moins bien représenté dans ce plan .......................................................... 16
e) Identifier le point-ligne qui possède la plus grande masse. ........................................................... 16
f) Identifier les points-colonnes qui affichent de plus grands cosinus carrés dans le deuxième axe
factoriel que dans le premier. ................................................................................................................. 17
g) Interpréter le graphique obtenu pour les deux premiers axes factoriels....................................... 17
h) Est-il possible de faire une analyse des correspondances multiple du jeu de données de Heuer . 17
EXERCICE 5 .................................................................................................................................................. 22
SOLOTION EXERCICE 5 ................................................................................................................................ 22
a) La matrice de corrélation : .............................................................................................................. 22
Exercice 6 .................................................................................................................................................... 26
Solution EXERCICE 6 .................................................................................................................................... 26
Exercice 7 .................................................................................................................................................... 26
SOLUTION EXERCICE 7 ................................................................................................................................ 26
a) Construire la Matrice de similarité basé sur l’indice de Jaccard pour les quatre individus............ 26
b) Classifier ces données en vous basant sur le critère du saut minimal............................................ 27
c) La méthode du saut maximale ........................................................................................................ 28
EXERCICE 8 .................................................................................................................................................. 29
Solution EXERCICE 8 .................................................................................................................................... 30

TABLE DE FIGURE
Figure 1 représentation des individus .......................................................................................................... 8
Figure 2 représentation des variables ........................................................................................................ 10
Figure 3 Table Contingence ........................................................................................................................ 17
Figure 4Profil de lignes ................................................................................................................................ 18
Figure 5 KHI-2 .............................................................................................................................................. 18
Figure 6 Coordonnés des lignes / Figure 7 Statistiques descriptives pour les points lignes / Figure 8
Contribution partielles ................................................................................................................................ 19
Figure 9 Inertie des points lignes / Figure 10 𝑐𝑜𝑠2 / Figure 11 Coordonnées des colonnes ...................... 19
Figure 12 Statistique descriptive pour les points des colonnes / Figure 13indices des coordonnes
contribuant le plus à l'inertie des points colonnes ..................................................................................... 20
Figure 14 Cos caré pour les points colonnes ............................................................................................... 20
Figure 15 ACP .............................................................................................................................................. 21
Figure 16 Tableau de Burt ........................................................................................................................... 21
Figure 17 matrice de corrélation ................................................................................................................ 22
Figure 18 Valeurs propres de la matrice de corrélation ............................................................................ 23
Figure 19 Vecteurs Propres ........................................................................................................................ 23
Figure 20 Diagramme des valeurs propres ................................................................................................. 24
Figure 21 facteurs retenus .......................................................................................................................... 24
Figure 22 ..................................................................................................................................................... 25
Figure 23 Classification avec la méthode du saut maximal ........................................................................ 30
Figure 24 Classification avec Ward ............................................................................................................. 30
Figure 25 Classification avec saut minimal ................................................................................................. 31
EXERCICE 1 :
Trois films désignés par I, II et III ont été notés par un jury formé de 6 membres désignés par A,
B, C, D, E, F. Les résultats ont été regroupés dans la matrice 𝑅 = (𝑟𝑖𝑗) 1≤𝑖≤6
1≤𝑗≤3

Trois nouveaux membres du jury désignés par G, H, I communiquent leurs notes une fois
l’analyse faite ; elles sont indiquées dans la matrice 𝑇 = (𝑡𝑖𝑗) 1≤𝑖≤3
1≤𝑗≤3

𝐴 8 1 0
𝐵 4 6 5
𝐺 8 1 3
𝐶 6 8 7
𝑅= 𝑇 = 𝐻 (1 2 1)
𝐷 10 4 7
𝐼 4 0 0
𝐸 8 2 5
𝐹(0 3 6)

Solution EXERCICE 1 :
a) Calcule de la matrice X des Variables Centrées :

On doit calculer la moyenne de la variable j :

8 + 4 + 6 + 10 + 8 + 0
𝑥1 = =6
6

1+6+8+4+2+3
𝑥2 = =4
6

0+5+7+7+5+6
𝑥3 = =5
6

Donc la matrice X devient :


2 −3 5
−2 2 0
0 4 2
𝑋=
4 0 2
2 −2 0
(−6 −1 1)
b) Calcule de la matrice : ∑ = 𝑋 𝑇 𝑋

2 −3 5
−2 2 0
2 −2 0 4 2 −6
𝑇 0 4 2
∑ = 𝑋 𝑋 = (−3 2 4 0 −2 −1)
4 0 2
−5 0 2 2 0 1
2 −2 0
(−6 −1 1)
64 −8 −8
= (−24 34 22 )
−8 22 34

 Calcule des valeurs propres de la matrice 𝛴 :

64 − 𝜆 −8 −8
det(𝛴 − 𝜆𝐼) = | −24 34 − 𝜆 22 | = 0
−8 22 34 − 𝜆
det(𝛴 − 𝜆𝐼) = −λ3 + 132 × λ2 − 4896 × λ + 41472
𝑑𝑒𝑡(𝛴 − 𝜆𝐼) = −(𝜆 − 12) × (𝜆 − 48) × (𝜆 − 72)
Donc : 𝜆1 = 72, 𝜆2 = 48 et 𝜆3 = 12
 Calcule des Vecteurs propres :

𝛴𝑢1 = 𝜆1 𝑢1
𝛴𝑢2 = 𝜆2 𝑢2
 Pour le Vecteur 𝑢1 :

On sait que 𝜆1 = 72 :

𝑥 64 − 72 −8 −8 𝑥 0
(𝛴 − 𝜆1 𝐼 ) (𝑦) = ( −24 34 − 72 22 ) (𝑦) = (0)
𝑧 −8 22 34 − 72 𝑧 0
−8𝑥 − 8𝑦 − 8𝑧 = 0
⟺ {−8𝑥 − 38𝑦 + 22𝑧 = 0
−8𝑥 + 22𝑦 − 38𝑧 = 0
𝑥 = −2𝑧
⟺ {
𝑦=𝑧
2
 Donc le Vecteur propre associe à 𝜆1 est : 𝑢1 = (−1)
−1

 Pour le Vecteur 𝑢2 :

On sait que 𝜆2 = 48 :

𝑥 64 − 48 −8 −8 𝑥 0
(𝛴 − 𝜆1 𝐼 ) (𝑦) = ( −24 34 − 48 22 ) (𝑦) = (0)
𝑧 −8 22 34 − 48 𝑧 0
16𝑥 − 8𝑦 − 8𝑧 = 0
⟺ {−8𝑥 − 14𝑦 + 22𝑧 = 0
−8𝑥 + 22𝑦 − 14𝑧 = 0
⟺ {𝑥 = 𝑦 = 𝑧
1
 Donc le Vecteur propre associe à 𝜆1 est : 𝑢2 = (1)
1

c) En déduire la troisième valeur propre, calcule du troisième vecteur propre u3

On sait que :
𝑡𝑟(𝛴) =𝜆1 + 𝜆2 + 𝜆3
On a 𝜆1 = 72 𝑒𝑡 𝜆2 = 48

Donc on peut déduire 𝜆3 = 12

Après on va calculer le vecteur propre u3 :

𝑥 64 − 12 −8 −8 𝑥 0
(𝛴 − 𝜆3 𝐼 ) (𝑦) = ( −24 34 − 12 22 ) (𝑦) = (0)
𝑧 −8 22 34 − 12 𝑧 0
52𝑥 − 8𝑦 − 8𝑧 = 0
⟺{
−8𝑥 + 22𝑦 + 22𝑧 = 0
𝑥 = 0
⟺{
𝑦 = −𝑧

0
Donc le Vecteur propre associe à 𝜆3 est : 𝑢2 = (−1)
1

d) Le pourcentage d’inertie expliquée par les deux premiers axes factoriels :

𝜆𝑖
∑ 𝑖 𝜆𝑖

𝜆1 + 𝜆2
𝑣𝑎𝑟 = = 0.9090
𝜆1 + 𝜆2 + 𝜆3

Les deux premiers facteurs représentent 90.91% de l'inertie total donc on peut effectuer notre
analyse en se focalisant sur les deux axes

e) Représentation du nuage des points-individus dans le plan

Premièrement il faut calculer les composantes principales Y1 et Y2 mais avant ça il faut


normer les vecteurs U1 et U2

2 1
√6 √3
−1 1
|𝑢1 | = 𝑒𝑡 |𝑢2 | =
√6 √3
−1 1
( √6 ) (√3)
On a:
2 −3 5 2 4.89898
−2 2 0 √6 −2.44949
0 4 2 −1 −2.44949
𝑌1 = 𝑋𝑢1 =
4 0 2 √6 2.44949
−1
2 −2 0 2.44949
(6 −1 1) ( √6 ) (−4.89898)
1
2 −3 5 −3.46410
−2 2 0 √3 0
0 4 2 1 3.46410
𝑌2 = 𝑋𝑢2 =
4 0 2 √3 3.46410
2 −2 0 1 0
(6 −1 1) ( 3) (−3.46410)

Figure 1 représentation des individus

f) Situer les membres G, H, I parmi les individus A,...,F sur le graphique précédent.

Il faut centrer la matrice T


8+1+4
𝑥1 = = 13⁄3
3

1+2+0
𝑥2 = = 3⁄3
3

3+1+0
𝑥3 = = 4⁄3
3
Donc la matrice T va devenir
4
8 − 13⁄3 0 3−
3
4
1 − 13⁄3 1 1−
3
13⁄
4
(4 − 3 −1 0 − )
3

2 1
√6 √3
−1 1
|𝑢1 | = 𝑒𝑡 |𝑢2 | =
√6 √3
−1 1
( √6 ) (√3)

On a:
4 2
8 − 13⁄3 0 3−
3 √6
2.31341
4 −1
𝑦1 = 1 − 13⁄3 1 1− = (−2.99382)
3 √6 0.680414
13⁄
4 −1
(4 − 3 −1 0 − )
3 ( √6 )

4 1
8 − 13⁄3 0 3− √3
3.0792 3
13 4 1
𝑦2 = 1 − ⁄3 1 1 − 3 √3
= ( −1.5396 )
4 −1.5396
4 − 13⁄3 −1 0 −
1
( 3) (√3)
Donc la matrice va être

2.31341 3.0792
(−2.99382 −1.5396)
0.680414 −1.5396
Figure 2 représentation des variables
EXERCICE 2 :
On considère un ensemble d’individus I, de cardinal n sur lequel sont définis, d’une part deux
variables qualitatives dont les ensembles de modalités sont notés J1 et J2, et d’autre part une
variable qualitative dont l’ensemble des modalités est noté T. Le croisement de J1, J2 et T
définit un tableau ternaire dont le terme général est noté kjj0t. Les marges binaires de ce tableau
sont notées kjj0 . (sur J1 × J2), kj.t et k.j0t et les marges unaires sont notées kj.., k.j0 . et k..t.
Son effectif total est égal au nombre d’individus n. Soit mjj0 un tableau J1 × J2 défini de la
façon suivante :

𝑘𝑗.𝑡 𝑘.𝑗′𝑡
𝑚𝑗𝑗 ′ = ∑𝑡 ∈𝑇 𝑘..𝑡 , 𝑗 ∈ 𝐽1 , 𝑗 ′ ∈ 𝐽2
𝑘..𝑡 𝑘..𝑡

a) Démonstration du 𝑚𝑗𝑗′ a les mêmes marges que le tableau binaire 𝑘𝑗𝑗′ :

𝑚𝑗. = ∑ 𝑚𝑗𝑗′
𝑗′∈𝐽2

𝑘𝑗.𝑡 𝑘.𝑗′𝑡
𝑚𝑗𝑗′ = ∑ ∑ 𝑘..𝑡
𝑗′∈𝐽2 𝑡∈𝑇
𝑘..𝑡 𝑘..𝑡
𝑘𝑗.𝑡 𝑘.𝑗′𝑡
= ∑∑
𝑘..𝑡
𝑗′∈𝐽2 𝑡∈𝑇

𝑘𝑗.𝑡
=∑ ∑ 𝑘.𝑗′𝑡
𝑘..𝑡
𝑡∈𝑇 𝑗′∈𝐽2

On Sait que ∑𝑗′∈𝐽2 𝑘.𝑗′𝑡 = 𝑘..𝑡 alors on va la remplace :


𝑘𝑗.𝑡 𝑘𝑗.𝑡
∑𝑡∈𝑇 ∑𝑗′∈𝐽2 𝑘.𝑗′𝑡 = ∑𝑡∈𝑇 𝑘..𝑡
𝑘..𝑡 𝑘..𝑡

= ∑ 𝑘𝑗.𝑡
𝑡∈𝑇

= 𝑘𝑗.
𝑚𝑗. = ∑ 𝑚𝑗𝑗′
𝑗′∈𝐽1

𝑘𝑗.𝑡 𝑘.𝑗′𝑡
= ∑ ∑ 𝑘..𝑡
𝑗′∈𝐽1 𝑡∈𝑇
𝑘..𝑡 𝑘..𝑡
𝑘𝑗.𝑡 𝑘.𝑗′𝑡
= ∑∑
𝑗′∈𝐽1 𝑡∈𝑇
𝑘..𝑡

𝑘𝑗.𝑡
=∑ ∑ 𝑘𝑗.𝑡
𝑘..𝑡
𝑡∈𝑇 𝑗′∈𝐽2

𝑘.𝑗′𝑡
=∑ 𝑘
𝑘..𝑡 ..𝑡
𝑡∈𝑇

= ∑ 𝑘.𝑗′𝑡
𝑡∈𝑇

b) Démonstration qu’il y a une indépendance conditionnellement à T entre J1 et J2,


alors 𝑚𝑗𝑗′ est égal à 𝑘𝑗𝑗′ :

Pour ce faire on doit démontrer que :


𝑓𝑗𝑗′ = 𝑓𝑗. 𝑓.𝑗′
𝑘𝑗𝑗′ 𝑘𝑗. 𝑘.𝑗′
=
𝑘. . 𝑘.. 𝑘..
On a :
𝑘𝑗.𝑡 𝑘.𝑗′𝑡
𝑚𝑗𝑗′ = ∑ 𝑘..𝑡
𝑡∈𝑇
𝑘..𝑡 𝑘..𝑡
𝑘𝑗𝑗′𝑡
= ∑ 𝑘..𝑡
𝑡∈𝑇
𝑘..𝑡

= ∑ 𝑘𝑗𝑗′𝑡
𝑡∈𝑇

= 𝑘𝑗𝑗′
c) Indépendance conditionnelle moyenne entraîne t’elle l’indépendance
conditionnelle

Oui, puisque 𝑚𝑗𝑗′ = 𝑘𝑗𝑗′ on a l’indépendance conditionnelle forcement.

d) L’analyse des correspondances du tableau J1 × J2

Qui nous représente que pour chacun des points, on réalise une analyse de la moyenne.

e) Indiquer ce que permet d’étudier l’analyse des correspondances binaires de ce


tableau.
EXERCICE 3 :
Dans le cadre d’une analyse des correspondances multiple (ACM) où Q = 2

a) L’ACM de Z est équivalente à celle de 𝐵 = 𝑍 𝑡 𝑍

Démonstration, dans un premier temps en va montrer que ACM de Z détermine les


mêmes facteurs.

 Calcule de ACM de Z :

𝒁
𝑭= , ∑𝒏𝒊=𝟏 ∑𝒑𝒋=𝟏 𝒇𝒊𝒋 = 𝟏
𝒏𝑸

Soit 𝐷𝑛 la matrice diagonale des profils ligne et 𝐷𝑝 celle des profils colonne :

𝑫𝒏 = 𝒅𝒊𝒂𝒈(𝒇𝒊. ) et 𝑫𝒑 = 𝒅𝒊𝒂𝒈(𝒇.𝒊 )

Sachant que la somme de chaque ligne est : Q=2

𝑫 𝒅𝒊𝒂𝒈(𝒁𝑻𝒊 𝒁)
𝑫𝒏 = =
𝒏𝑸 𝒏𝑸
Aussi que 𝜆𝑗 sont les valeurs propres de 𝐹 𝑇 𝐷𝑛−1 𝐹𝐷𝑝−1 associées aux vecteurs
propres 𝑢𝑗 , Donc on retient :

𝐹 𝑇 𝐷𝑛−1 𝐹𝐷𝑝−1 𝑢𝑗 = 𝜆𝑗 𝑢𝑗

𝐷𝑝−1 𝐹 𝑇 𝐷𝑛−1 𝐹𝐷𝑝−1 𝑢𝑗 = 𝐷𝑝−1 𝜆𝑗 𝑢𝑗

𝐷𝑝−1 𝐹 𝑇 𝐷𝑛−1 𝐹(𝐷𝑝−1 𝑢𝑗 ) = 𝜆𝑗 (𝐷𝑝−1 𝑢𝑗 )

Sachant que φ𝑗 = 𝐷𝑝−1 𝑢𝑗

𝐷𝑝−1 𝐹 𝑇 𝐷𝑛−1 𝐹φ𝑗 = 𝜆𝑗 φ𝑗

−1
𝑍𝑇 𝑍
𝑛𝑄𝐷 𝑛 φ = 𝜆𝑗 φ𝑗
𝑛𝑄 𝑛𝑄 𝑗

1 −1 𝑇
𝐷 𝑍 𝑍φ𝑗 = 𝜆𝑗 φ𝑗
𝑄
 Calcule de ACM de B :
𝐁
Prennent B est Symétrique Donc : 𝐅 = 𝐧𝐐𝟐
𝑫
𝑫𝒑 = 𝑫𝒏 =
𝒏𝑸
Sachant que φ′𝑗 = 𝐷𝑛−1 𝑣𝑗

Aussi 𝜑 ′ = 𝑛𝑄𝐷−1 𝑣𝑗

𝐹𝐷𝑝−1 𝐹 𝑇 𝐷𝑛−1 𝑣𝑗 = 𝜆′𝑗 𝑣𝑗

𝐷𝑛−1 𝐹𝐷𝑝−1 𝐹 𝑇 φ′𝑗 = 𝜆′𝑗 φ′𝑗

𝐵 𝐵𝑇
𝑛𝑄𝐷−1 𝑛𝑄𝐷 −1
φ′ = 𝜆′𝑗 φ′𝑗
𝑛𝑄 2 𝑛𝑄 2 𝑗

1 −1 −1
𝐷 𝐵𝐷 φ𝑗 = 𝜆𝑗2 φ𝑗
𝑄2

On se basant sur les solutions précédentes on trouve que :

𝜆𝑗2 = 𝜆′𝑗
{ , 1 ≤ 𝑗 ≤ 𝑝.
φ𝑗 = φ′𝑗

On conclut donc que les deux analyses sont équivalentes.

b) L’ACM de Z est équivalente à celle de 𝑍2𝑇 𝑍1

On sait que Q = 2 donc on a 𝑍 = [𝑍1 |𝑍2 ] et 𝜑𝑖 est (𝜑𝑖 , 𝑝𝑖 )𝑇 par conséquence :

1 + √𝜆𝑗′
𝜆𝑗 =
2
De ce fait l’ACM de Z est équivalente à celle de 𝑍2𝑇 𝑍1
EXERCICE 4
Le tableau suivant est tiré d’un ouvrage de Gerhild Heuer intitulé «Selbstmord bei Kindern und
Jugendlichen», publié chez Ernst Klett Verlag (Stuttgart) en 1979. On y trouve une compilation
de 48 961 suicides survenus en Allemagne de l’Ouest sur une longue période de temps. Les
données sont ventilées en fonction du sexe et de l’âge de la victime, ainsi que de la cause du décès.

SOLUTION EXERCICE 4
a) Que conclut-on du fait que la statistique du khi-deux

On suppose que l’hypothèse H0 est exacte


dans la sortie SAS on a 𝜒2𝑐𝑎𝑙 = 8371.28 > 61.66 donc on rejette l’hypothèse H0 on
conclut que les variables ne sont pas indépendantes

b) Pourquoi cette statistique a-t-elle 45 degrés de liberté

Dans une khi-deux, c’est toujours (n-1)(m-1) degrés avec n et m modalités donc
(6-1) (10—1) = 5*9 = 45 Ce qui explique les 45 degrés de liberté.

c) Quelle proportion de l’inertie est expliquée par les deux premiers axes factoriels

La proportion expliqué par les 2 axes factoriels est de 93.336%

d) Quel point-ligne est le moins bien représenté dans ce plan

Le profil ligne le moins bien représenté est P : F ∗ 10−20 parce que sa qualité est la plus faible

e) Identifier le point-ligne qui possède la plus grande masse.

Le point ligne le qui a le plus grand poids est M ∗ 40 − 50 car :


2465 625 3936 247 875 244
𝑓𝑖. = + + + + + = 0.171401
48961 48961 48961 48961 48961 48961
f) Identifier les points-colonnes qui affichent de plus grands cosinus carrés dans le
deuxième axe factoriel que dans le premier.

Les points-colonne ayant le plus grand cosinus carré sont :


- Pendaison
- Suffocation

g) Interpréter le graphique obtenu pour les deux premiers axes factoriels.

A partir du graph on voit que :


 les hommes 55-65 ans et 70-90 se pendent
 les femmes de 40-50 ans sautent
 les femmes de 70-90 se noient

h) Est-il possible de faire une analyse des correspondances multiple du jeu de


données de Heuer

Oui il est possible de faire une des correspondances multiples du jeu de données d’Heure il faut
faire le tableau de Burt

Figure 3 Table Contingence


Figure 4Profil de lignes

Figure 5 KHI-2
Figure 6 Coordonnés des lignes / Figure 7 Statistiques descriptives pour les points lignes / Figure 8 Contribution partielles

Figure 9 Inertie des points lignes / Figure 10 𝑐𝑜𝑠 2 / Figure 11 Coordonnées des colonnes
Figure 12 Statistique descriptive pour les points des colonnes / Figure 13indices des coordonnes contribuant le plus à l'inertie
des points colonnes

Figure 14 Cos caré pour les points colonnes


Figure 15 ACP

Figure 16 Tableau de Burt


EXERCICE 5
On étudie les consommations annuelles en 1972, exprimées en francs, de 8 denrées alimentaires
(les variables), les individus étant 8 catégories socio-professionnelles. Les données sont des
moyennes par CSP :

AGRI = Exploitants agricoles PAO = Pain ordinaire


SAAG= Salariés agricoles PAA = Autre pain
PRIN = Professions indépendantes VIO = Vin ordinaire
CSUP = Cadres supérieurs VIA=Autre vin
CMOY= Cadres moyens POT= Pommes de terre
EMPL= Employés LEC=Légumes secs
OUVR = Ouvriers RAI=Raisin de tables
INAC = Inactifs PLP= Plats préparés

SOLOTION EXERCICE 5
a) La matrice de corrélation :

Figure 17 matrice de corrélation


Figure 18 Valeurs propres de la matrice de corrélation

Figure 19 Vecteurs Propres


Figure 20 Diagramme des valeurs propres

Le critère de Kaiser nous conduit à sélectionner un seul axe, qui retient 77% de l’inertie totale. L’axe
2 retient tout de même 11% de l’inertie, ce qui n’est pas négligeable, et qui conduit à un taux d’inertie
expliquée de 89%, ce qui est un très bon résultat. Il peut être donc intéressant de l’étudier aussi. Nous
le retiendrons si nous pouvons l’interpréter

Figure 21 facteurs retenus


Figure 22

On sait que les variables contribuant le plus à la formation de l’axe 1 sont celles dont les
coordonnées sur cet axe sont proches de 1 en valeur absolue. Pour repérer les contributions
significatives, PAA et VIO sont très proches de la contribution moyenne, on les intègrera
donc dans l’interprétation de l’axe si elles vont dans le sens de l’interprétation que l’on
peut en faire, sans elles.
L’axe 1 oppose les individus consommant du pain ordinaire, des légumes secs (et
éventuellement du vin ordinaire) à ceux qui consomment du raisin, du vin (éventuellement
du pain) plus sophistiqué et des plats préparés.
L’axe 1, et donc la première composante principale, mesure la répartition entre aliments
ordinaires bon marchés et aliments plus recherchés.
Exercice 6
Montrer que dans la décomposition de la somme de carrés due à Huygens qui intervient en
analyse discriminante, le terme général de la matrice B de variation inter-groupes s’exprime sous
la forme

Solution EXERCICE 6
On sait que S = W + B,
Donc 𝑠𝑖𝑗 = 𝑊𝑖𝐼𝑗+ 𝐵𝐼𝑗
𝑛1 𝑛2
Dans le cas ou Q=2 et en utilisant 𝑦𝑗 = 𝑦1 + 𝑦2
𝑛 𝑛
2

𝑏𝑗𝑗′ = ∑ 𝑛𝑘 ( 𝑦𝑘𝑗 − 𝑦𝑗 )(𝑦𝑘𝑗 ′ − 𝑦𝑗 ′)


𝑘
′ ′
=n1(𝑦1𝑗 − 𝑦𝑗 ) (𝑦1𝑗 ′ − 𝑦𝑗 ) + 𝑛2(𝑦2𝑗 − 𝑦𝑗 ) (𝑦2𝑗 ′ − 𝑦𝑗 )
𝑛1𝑛2 ′
= (𝑦1𝑗 − 𝑦2𝑗 ) (𝑦1𝑗 ′ − 𝑦2𝑗 )
𝑛

Exercice 7
1 1 0 1
1 0 0 0
On a la matrice T = ( )
0 1 1 0
0 1 1 1

SOLUTION EXERCICE 7
a) Construire la Matrice de similarité basé sur l’indice de Jaccard pour les quatre
individus

+ total
-
I a a+b
+ b c+d
c
- d
Total a+c a+b+c+d
b+d
On sait que l’indice de Jacard est :
𝑎
𝑎+𝑏+𝑐
Similarité entre Variables Indice de Jacard
S-→ (1,2) 1 1 0 1 1
( ) 𝑠(1,2) =
1 0 0 0 3
S-→ (1,3) 1 1 0 1 1
( ) 𝑠(1,3) =
0 1 1 0 4
S-→ (1,4) 1 1 0 1 1
( ) 𝑠(1,4) =
0 1 1 1 2
S-→ (2,3) 1 0 0 0 𝑠(2,2) = 0
( )
1 0 0 0
S-→ (2,4) 1 0 0 0 𝑠(2,4) = 0
( )
0 1 1 0
S-→ (3,4) 0 1 1 0 2
( ) 𝑠(3,2) =
0 1 1 1 3

On obtient :
1 1 1
1
3 4 2
1
1 0 0
𝑇= 3
1 1 2
1
4 2 3
2
(0 0 3
1)

b) Classifier ces données en vous basant sur le critère du saut minimal

On va utiliser la méthode du saut minimal

On a

1 1 1
1
3 4 2
1
1 0 0
𝑇= 3
1 1 2
1
4 2 3
2
(0 0
3
1)
2
On va commencer par 𝑠(3,4) = 3 par ce que c’est la plus grande donc la première partition

𝑆 = {{1]{2]{3; 4]}

1 1
1 3 2
1
Donc : 1 0
3
1
0 1
(2 )

Avec:
1
𝑠(1, 3.4) = 𝑚𝑎𝑥(𝑠(1, 3), 𝑠(1, 4)) =
2
𝑠(2, 3.4) = 𝑚𝑎𝑥(𝑠(2, 3), 𝑠(2, 4)) = 0
1
Les classe les plus similaires sont {1} 𝑒𝑡 {3,4} avec 𝑠(1, 3.4) = donc :
2
1
1
( 2)
1
1
2

c) La méthode du saut maximale

Il faut minimiser les 𝑆𝑖𝑗

1 1 1
1
3 4 2
1
1 0 0
𝑇= 3
1 1 2
1
4 2 3
2
(0 0
3
1)

Les points les moins similaires sont : 2 4 avec 𝑠(3, 4) = 0


1 1
1
( 3 4)
1 0
1

𝑎𝑣𝑒𝑐 ∶

1
𝑠(1, 2.4) = min(𝑠(1, 2), 𝑠(1, 4)) =
3

Et

𝑠(3, 2.4) = 𝑚𝑖𝑛(𝑠(3, 2), 𝑠(3, 4)) = 0

Les classes les moins similaires sont : {3 }𝑒𝑡 {2,4 } avec 𝑠(1, 3.4) = 0 donc la partition
devient {{1}, {2,3,4}}.

1
(1 4)
1

On conclut qu’avec 2 méthode différente on obtient pas toujours le même résultat

EXERCICE 8
À l’aide de l’analyse discriminante et de méthodes de classification appropriées, analyser le
fichier de données représentant deux classes imbriquées dont le programme de simulation SAS

data concave;
keep x y;
do i=1 to 100;
a=i*0.0628319;
x=cos(a)+(i>50)+rannor(7)*0.1 ; y=sin(a)+(i>50)*0.3+rannor(7)*0.1 ;
output;
end;
run;
Solution EXERCICE 8

Figure 23 Classification avec la méthode du saut maximal

Figure 24 Classification avec Ward


Figure 25 Classification avec saut minimal