Professional Documents
Culture Documents
Devoir Latex
Devoir Latex
LIME-LISE 3 Unité-Progès-Justice
I Partie A 4
1 Statistiques descriptives 4
1.1 Analyse descriptive de CHO . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Analyse descriptive de CRO . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Analyse descriptive de INF . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Analyse descriptive de CPR . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Analyse descriptive de INV . . . . . . . . . . . . . . . . . . . . . . 21
2 Statistique inférentiel 25
2.1 Analyse des corrélations . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Tests d’Hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3 Régression linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 Régression linéaire multiple . . . . . . . . . . . . . . . . . . . . . . 36
3 Analyse de donnée 42
3.1 Réalisation d’un ACP . . . . . . . . . . . . . . . . . . . . . . . . . . 42
II Partie B 59
5 Exercices 59
5.0.1 Exercice 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.0.2 Exercice 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.0.3 Exercice3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
6 Corrections 61
6.0.1 Exercice 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.0.2 Exercice3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
1
Table des figures
1 Graphique médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Boite à moustache de CHO . . . . . . . . . . . . . . . . . . . . . . 6
3 Histogramme de CHO . . . . . . . . . . . . . . . . . . . . . . . . . 6
4 Evolution de CHO . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
5 Boite à moustache de CRO . . . . . . . . . . . . . . . . . . . . . . . 9
6 Histogramme de CRO . . . . . . . . . . . . . . . . . . . . . . . . . 11
7 Evolution de CRO . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
8 Boite à moustache de INF . . . . . . . . . . . . . . . . . . . . . . . 14
9 Histogramme de INF . . . . . . . . . . . . . . . . . . . . . . . . . . 15
10 Evolution de INF . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
11 Boite à moustache de CPR . . . . . . . . . . . . . . . . . . . . . . . 18
12 Histogramme de CPR . . . . . . . . . . . . . . . . . . . . . . . . . 19
13 Evolution de CPR . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
14 Boite à moustache de INV . . . . . . . . . . . . . . . . . . . . . . . 22
15 Histogramme de INV . . . . . . . . . . . . . . . . . . . . . . . . . . 23
16 Evolution de INV . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
17 Representation des variables . . . . . . . . . . . . . . . . . . . . . . 46
18 Representation des individus . . . . . . . . . . . . . . . . . . . . . . 47
19 Representation des individus . . . . . . . . . . . . . . . . . . . . . . 47
20 Dendogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
21 Duda Hart index . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
22 Scree plot of eigenvalues . . . . . . . . . . . . . . . . . . . . . . . . 52
23 score variable (pca) . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
24 component loading . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
25 scree plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
26 biplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
27 Répresentation des classes en terme de distance . . . . . . . . . . . 56
28 Répresentation des classes sur le premier plan factoriel . . . . . . . 57
29 Nuage de points des individus . . . . . . . . . . . . . . . . . . . . . 66
2
Liste des tableaux
1 Tableau de corrélation . . . . . . . . . . . . . . . . . . . . . . . . . 25
2 Tableau de corrélation . . . . . . . . . . . . . . . . . . . . . . . . . 27
3 Tableau de régression entre CHO et CRO . . . . . . . . . . . . . . . 28
4 Tableau de régression entre CHO et INF . . . . . . . . . . . . . . . 29
5 Tableau de régression entre CHO et CPR . . . . . . . . . . . . . . . 30
6 Tableau de régression entre CHO et INV . . . . . . . . . . . . . . . 31
7 Tableau de régression entre CRO et INF . . . . . . . . . . . . . . . 32
8 Table de régression entre CRO et CPR . . . . . . . . . . . . . . . . 33
9 Table de régression entre INF et CPR . . . . . . . . . . . . . . . . . 34
10 Table de régression entre INF et INV . . . . . . . . . . . . . . . . . 35
11 Régression linéaire multiple entre la indépendante CHO et les autres 37
12 Régression linéaire multiple entre la indépendante CRO et les autres 38
13 Régression linéaire multiple entre la indépendante INV et les autres 39
14 Régression linéaire multiple entre la indépendante CPR et les autres 40
15 Régression linéaire multiple entre la indépendante INF et les autres 41
16 Valeurs Propres (matrice de correlation.) et stat. associées . . . . . 43
17 Composantes principales . . . . . . . . . . . . . . . . . . . . . . . . 44
18 Saturations, contributions et qualités de représentation des variables 45
19 Représentation des individus dans le premier plan factoriel . . . . . 46
20 Centre des classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3
Première partie
Partie A
1 Statistiques descriptives
1.1 Analyse descriptive de CHO
1. Taux de chomage
* Mesure de la position
• La moyenne de la variable CHO est 7,625. Le taux de chômage en Bel-
gique entre les années 1971 à 1990 était en moyenne égale à 7,625.
• La médiane de la variable CHO est 7,5. A partir des année 1981 le taux
de chômage est strictement supérieur à 7,5. On constate que le taux
de chômage avait en moyenne augmenté à partir des années 1981 par
rapport aux années antérieures.
* Graphique médiane
CHO
6
Distance above median
2 0 4
0 2 4 6
Distance below median
4
• Le premier et le troisième quartile de la variable CHO sont :
Q1= 4,85 et Q3=11,25
* Mesure de la dispersion
• L’étendue de la variable CHO est égale à 10,8
* Paramètre de forme
• LE coefficient d’asymétrie de Fisher(skewness)est égal à -0,2545367. Une
asymétrie négative est estimée pour le taux de chômage. La distribution
est asymétrique étalé à gauche de la moyenne.
* Paramètre d’aplatissement(kurtosis)
• Le coefficient d’aplatissement(Kurtosis) de la variable CHO est égal à
1,782306.
Un aplatissement positif estimé pour le taux de chômage. La distribution
présente un pic moins plat et des extrémités plus épaisses par rapport à
la distribution normal. On constate un regroupement d’outliers (valeur
aberrantes ou distante des autres valeurs).
• Representation graphique
* Boite à moustache
La première moustache à gauche indique le taux de chomage le plus
bas atteint entre les années 1971 à 1990 qui est de 1,7
La deuxième moustache à droite indique le taux de chomage le plus elévé
entre 1971 à 1990 qui est de 12,5
L’étendu dans cette série statistique est de 10,8 Il y’a 10,8 d’ecart entre
le taux de chomage le plus élévé et le plus bas.
Le prémier quartile est de 4,85 ie qu’au bout des 20 années,le taux de
chomage sur 5 années est de 4,8
* Histogamme de CHO
5
2 4 6 8 10 12
CHO
2 4 6 8 10 12
CHO
6
* Evolution de CHO
12
10
8
CHO
6
4
2
70 75 80 85 90
Année
Le taux de chomage connait une evolution croissante entre les années 1971
à 1983,reste stationnaire entre 1983 à 1984,et décroit de 1985 à 1990
7
1.2 Analyse descriptive de CRO
2. Taux de croissance
* Mesure de la position
• La moyenne de la variable CRO est 2,59.
Le taux de croissance en Belgique entre les années 1971 et 1990 était en
moyenne égale à 2,59.
• La médiane de la variable CRO est 2,45
• Le premier et le troisième quartile de la variable CRO sont :
Q1=1,1 et Q3=4,2
* Mesure de la dispersion
* Paramètre de forme
* Paramètre d’aplatissement(kurtosis)
* Représentation graphiques
8
* Boite à moustache
-2 0 2 4 6
CRO
9
bout des 20 années sur 10 année le taux de croissance du PIB se tient
dans un intervalle de 3,1.
10
.2
.15
Density
.1.05
0
-2 0 2 4 6
CRO
11
* Evolution de CRO
Le taux du croissance du PIB evolue en dent de scie d’annéé en année
6
4
CRO
2
0
-2
70 75 80 85 90
Année
12
1.3 Analyse descriptive de INF
3. Inflation
* Mesure de la position
Q1=4,15 et Q3=7,15
* Mesure de la dispersion
• L’étendu de la variable INF est égale à 10,8.
* Paramètre de forme
• Le coefficient d’asymétrie de Fisher (skewness) de la variable INF est
égal à 1.09252.
Une asymétrie positive est estimée pour taux d’inflation. La moyenne
est alors supérieure à la médiane alors la distribution est étalée à droite
de la moyenne.
13
* Representation graphique
* Boite à moustache
2 4 6 8 10 12
INF
14
* Histogramme
.2
.15
Density
.1.05
0
2 4 6 8 10 12
INF
15
* Evolution de INF
12
10
8
INF
6
4
2
70 75 80 85 90
Année
16
1.4 Analyse descriptive de CPR
4. Taux de consommation privée
* Mesure de la position
• La moyenne de la variable CPR est 62,76.
• Le taux de consommation privée par rapport au PIB en Belgique était
en moyenne égale à 62,76 entre les années 1971 et 1990.
• La médiane de la variable CPR est 62,6
• le premier et le troisième quartile de la variable CPR sont :
On a Q1=61,05 et Q3=64,7
* Mesure de la dispersion
• L’étendue de la variable CPR est égale à 5,8.
• la variance de la variable CPR est égale à 3,766737.
• Pour la variable CPR, son écart-type est égale à 1,940808
* Le coefficient d’asymétrie de Fischer (skewness)est égal à 0,0770367.
Une asymétrie proche de zéro est estimée pour le taux de consommation
privée la moyenne est alors très proche de la médiane. Les observations se
répartissent de manière quasi uniforme autour de la moyenne la médiane
et le mode.
* Paramètre d’aplatissement(kurtosis)
• Pour la variable CPR son coefficient est égal à 1,660096. Un aplatisse-
ment positif est estimé pour le taux de consommation privé. La distri-
bution présente un pic moins plat et des extrémités plus épaisses par
rapport à la distribution normal. On constate un regroupement d’out-
liers (valeur aberrantes ou distante des autres).
17
* Representation graphique
* Boite à moustache
60 62 64 66
CPR
18
* Histogramme
.25
.2.15
Density
.1
.05
0
60 61 62 63 64 65
CPR
19
* Evolution de CPR
66
64
CPR
62
60
70 75 80 85 90
Année
20
1.5 Analyse descriptive de INV
5. Taux d’investissement
* Mesure de la position
• La moyenne de la variable INV est 19,46.
• Le taux d’investissement en Belgique était en moyenne égale à 19,46
entre les années 1971 et 1990.
• La médiane de la variable INV est 20,45. A partir des années 1981
le taux de d’investissement est inférieur à 20,45. On constate que en
moyenne à partir des années 1981 le taux d’investissement avait baisser
comparativement aux années antérieures.
• le premier et le troisième quartile de la variable INV sont : Q1=16,75 et
Q3=21,65.
* Mesure de la dispersion
• Pour la variable INV son coefficient est égal à -0,3264258. Une asymé-
trie négative est estimée pour le taux d’investissement. La moyenne est
inférieure à la médiane alors la distribution est étalée à gauche de la
moyenne.
* Paramètre d’aplatissement(kurtosis) :Pour la variable INV son coeffi-
cient est égal à 1,486694.
21
* Representation graphique
* Boite à moustache
16 18 20 22 24
INV
22
* Histogramme
.25
.2.15
Density
.1
.05
0
16 18 20 22
INV
23
* Evolution de INV
24
22
20
INV
18
16
70 75 80 85 90
Année
24
2 Statistique inférentiel
2.1 Analyse des corrélations
Analyses des corrélations(Calcul du coefficient de détermination) (ob-
servations=20)
25
— Le coefficient de corrélation entre le taux d’inflation et le taux de crois-
sance du PIB est de -0. 1480.Une corrélation négative est estimée entre
le taux d’inflation et le taux de croissance du PIB. Une augmentation
du taux d’inflation entraine une baisse du taux de croissance du PIB en
Belgique.
* Corrélation entre les variables CRO et CPR Le coefficient de corrélation
entre le taux de consommation privé et le taux de croissance du PIB
est de -0.5605. Une corrélation négative est estimée entre le taux de
consommation privée et le taux de croissance du PIB. Une augmentation
du taux de consommation privé entraine une baisse du taux de croissance
du PIB en Belgique.
* Corrélation entre les variables CRO et INV
— Le coefficient de corrélation entre le taux d’investissement et le taux de
croissance du PIB est de 0.3630. Une corrélation positive est estimée
entre le taux d’investissement et le taux de croissance du PIB. Une
augmentation du taux d’investissement entraine une augmentation du
taux de croissance du PIB en Belgique.
* Corrélation entre les variables CPR et Le coefficient de corrélation entre
le taux de consommation privé et le taux d’inflation est de -0.4466. Une
corrélation négative est estimée entre le taux de consommation privé et
le taux d’inflation. Une augmentation du taux de consommation privé
entraine une baisse du taux d’inflation en Belgique.
* Corrélation entre les variables CPR et INV
— Le coefficient de corrélation entre le taux de consommation privée et le
taux d’investissement est de -0.9030. Une corrélation négative est esti-
mée entre le taux de consommation privée et le taux d’investissement.
Une augmentation du taux de consommation privée entraine une baisse
du taux d’investissement en Belgique.
* Corrélation entre les variables INF et INV Le coefficient de corréla-
tion entre le taux d’inflation et le taux d’investissement est de 0.5045.
Une corrélation positive est estimée entre le taux d’inflation et le taux
d’investissement. Une augmentation du taux d’inflation entraine une
augmentation du taux d’investissement en Belgique.
26
Table 2 – Tableau de corrélation
La variable CHO suit une loi normale car p-value égale 0,30510>0,05
La variable CRO suit une loi normale car p-value égale 0,78557>0,05
La variable INF ne suit pas une loi normale car p-value égale 0,03516<0,05
La variable CPR suit une loi normale car p-value égale 0,15365>0,05
La variable INV ne suit pas une loi normale car p-value égale 0,01178<0,05
27
2.3 Régression linéaire
Hypothèse :
Entre le taux de chômage et taux de croissance du PIB. Les hypothèses
formulées sont :
H0 : le taux de croissance du PIB explique le taux de chômage.
H1 : le taux de croissance du PIB n’explique pas le taux de chômage.
28
Hypothèse :
Entre le taux de chômage et le taux d’inflation. Les hypothèses formulées
sont :
H0 : le taux d’inflation explique le taux de chômage.
H1 : le taux d’inflation n’explique pas le taux de chômage
29
Hypothèse :
Entre le taux de chômage et taux de consommation privée. Les hypothèses
formulées sont :
H0 : le taux de consommation privée explique le taux de chômage.
H1 : le taux de consommation privée n’explique pas le taux de chômage.
30
Hypothèse :
Entre le taux de chômage et taux d’investissement. Les hypothèses formulées
sont : H0 : le taux d’investissement explique le taux de chômage. H1 : le
taux d’investissement n’explique pas le taux de chômage.
31
Hypothèse :
Entre le taux de croissance du PIB et taux d’inflation. Les hypothèses for-
mulées sont : H0 : le taux d’inflation explique le taux de croissance du PIB.
H1 : le taux d’inflation n’explique pas le taux de croissance du PIB
32
Hypothèse :
Entre le taux de croissance du PIB et taux de consommation privée. Les
hypothèses formulées sont :
H0 : le taux de consommation privée explique le taux de croissance du PIB.
H1 : le taux de consommation privée n’explique pas le taux de croissance
du PIB .
33
Hypothèse :
Entre le taux de consommation privée et taux d’inflation. Les hypothèses
formulées sont :
H0 : le taux de consommation privée explique le taux d’inflation.
H1 : le taux de consommation privée n’explique pas le taux d’inflation
34
Hypothèse :
Entre le taux d’investissement et taux d’inflation. Les hypothèses formulées
sont :
H0 : le taux d’investissement explique le taux d’inflation.
H1 : le taux d’investissement n’explique pas le taux d’inflation
35
2.4 Régression linéaire multiple
36
La valeur P pour chaque terme teste l’hypothèse nulle.
Régression linéaire avec CHO la variable dépendante. Les hypothèses rete-
nues sont : H0 : Les variables indépendantes expliquent le taux de chômage.
H1 : Les variables indépendantes n’explique pas le taux de chômage.
37
La valeur P pour chaque terme teste l’hypothèse nulle. Régression li-
néaire avec CRO la variable dépendante. Les hypothèses retenues sont :
H0 : Les variables indépendantes expliquent le taux de croissance du PIB.
H1 : Les variables indépendantes n’explique pas le taux de croissance du
PIB.
38
La valeur P pour chaque terme teste l’hypothèse nulle. Régression li-
néaire avec INV la variable dépendante. Les hypothèses retenues sont : H0 :
Les variables indépendantes expliquent le taux d’investissement. H1 : Les
variables indépendantes n’explique pas le taux d’investissement.
Nous avons P = 0,015 < 0,05 donc la statistique du test est inférieure à
la p-value. Nous rejetons l’hypothèse H0. On a R-carré=0,8669, la régres-
sion détermine la distribution des points de la variable INV. On a R-carré
ajusté=0,8314, le modèle possède des valeurs prédictives. A l’issue des ré-
sultats, on peut dire que en général le taux de chômage, le taux d’inflation,
le taux de croissance du PIB et le taux de consommation privée n’affectent
pas l’évolution du taux d’investissement entre les années 1971 à 1990. En
particulier le taux d’inflation explique significativement l’évolution du taux
d’investissement. Contrairement au taux de chômage, au taux de croissance
du PIB qui expliquent peu l’évolution du taux d’investissement.Et au taux
d’investissement qui n’a aucun effet sur elle car sa p-value est inférieur à
0,05.
39
La valeur P pour chaque terme teste l’hypothèse nulle. Régression li-
néaire avec CPR la variable dépendante. Les hypothèses retenues sont :
H0 : Les variables indépendantes expliquent le taux de consommation pri-
vée. H1 : Les variables indépendantes n’explique pas le taux de consomma-
tion privée.
Nous avons P = 0,000 < 0,05 donc la statistique du test est inférieure à
la p-value. Nous rejetons l’hypothèse H0. On a R-carré=0,9267, la régres-
sion détermine la distribution des points de la variable CPR. On a R-carré
ajusté=0,9071, le modèle possède des valeurs prédictives. A l’issue des ré-
sultats, on peut dire que en général le taux de chômage, le taux d’inflation,
le taux de croissance du PIB et le taux d’investissement n’affectent pas
l’évolution du taux de consommation privée entre les années 1971 à 1990.
En particulier le taux d’inflation explique significativement l’évolution du
taux consommation privée. Contrairement au taux de chômage, au taux de
croissance du PIB au taux d’investissement qui n’a aucun effet sur lui car
leur p-value est inférieur à 0,05.
40
La valeur P pour chaque terme teste l’hypothèse nulle. Régression li-
néaire avec INF la variable dépendante. Les hypothèses retenues sont : H0 :
Les variables indépendantes expliquent le taux d’inflation. H1 : Les variables
indépendantes n’explique pas le taux d’inflation.
41
3 Analyse de donnée
3.1 Réalisation d’un ACP
42
Corrélation des variables :
43
Table 17 – Composantes principales
44
Table 18 – Saturations, contributions et qualités de représentation des variables
45
Table 19 – Représentation des individus dans le premier plan factoriel
46
Figure 18 – Representation des individus
47
6. Etude du tableau des valeurs propres
48
4 Classification ascendante hiérachique (CAH)
et K-means
4.1 Classification ascendante hiérachique (CAH)
Principe de la méthode CAH : La classification ascendante hiérarchique,est
une méthode de classification itérative, ou l’on commence d’abord par re-
groupé les deux individus les plus proches en utilisant euclidienne créant
ainsi une classe comprenant ces deux individus.Ensuite ce sont les deux
classes les plus proches qui sont regroupés,grâce à un indice d’agrégation :
l’indice Ward,appelé aussi critère d’agrégation suivant la perte d,inertie mi-
nimale.On poursuit,jusqu’à ce que tous les individus soient regroupés.Ces
regroupement successive produisent un arbre binaire de classification «den-
dogramme» ;,dont la racine correspond à la classe regroupant l’ensemble des
individus.Ce dendogramme représente une hiérarchique de partition .On
peut alors choisir une partition en tronquant l’arbre à un niveau donné. En
réalisant la Classification ascendante hiérachique sur nos données on obtient
le dendogramme ci-dessous
49
Dendrogram for _clus_3 cluster analysis
50 40
L2 dissimilarity measure
20 30
10
0
1 2 3 6 4 5 7 8 9 10 20 19 11 12 13 15 14 16 17 18
Figure 20 – Dendogramme
50
Figure 21 – Duda Hart index
51
Figure 22 – Scree plot of eigenvalues
52
Figure 24 – component loading
53
Figure 26 – biplot
54
4.2 K-means
55
Figure 27 – Répresentation des classes en terme de distance
56
Figure 28 – Répresentation des classes sur le premier plan factoriel
57
Classe 3 : Composée des années 81 82 83 84 85 et 86, elle est caractéri-
sée par un taux de chômage et un taux de consommation privée très élevée.
Cette classe représente 30% de la période observée.
58
Deuxième partie
Partie B
5 Exercices
5.0.1 Exercice 1
A.Le présent projet est étude sur la base de données conjoncturelle de la
Belgique.
Le tableau ci-dessous présente l’évolution du taux de chomage.
59
• CHO : taux de chomage
• CRO : taux de croissance du PIB,
• INF : taux d’inflation,
• CPR : taux de consommation privée (rapport de la consommation privée
au PIB),
• INV : taux d’investissement (rapport de la formation brute de capital fixe
au PIB)
5.0.2 Exercice 2
On considère le tableau X suivant de type (3,2) suivant :
2 3
X= 4 5
6 1
1. Donner le tableau des années centrées réduites (normée).
2. Donner la matrice des corrélation Γ.
3. Diagonaliser la matrice γ. On note λ1 et λ2 ses valeurs propres avec λ1 >λ2 .
4. Déterminer les axes factoriels. Donner le vecteur unitaire ui de chaque axe
Fi .
5. Vérifier que ces axes sont perpendiculaire.
V
6. Écrire la matrice diagonale des valeurs propres et calculer sa trace et
V
vérifier que tr( )=tr(Γ).
7. Calculer les composantes principales et les facteurs principaux.
8. Dessiner le nuage de points projeté sur le premier axe. Calculer la représen-
tation globale sur le premier axe, et la contribution de chaque individu sur
le premier axe.
5.0.3 Exercice3
Soient une v.a. exponentielle X de paramètre λ et la v.a. Y dont la densité condi-
tionnelle fY /X=x par rapport à X = x est égale à 1[x,x+1] .
la suite (Tn )n∈N converge en probabilité, les Yi étant de même loi que Y .
4. Quelle est la loi limite de la suite définie par Wn = √1n ni=1 (Yi − λ1 − 12 )
P
60
6 Corrections
6.0.1 Exercice 2
6 1
* Premiere colonne :
2−4 −2
4 − 4
= 0
6−4 2
* Deuxième colonne :
3−3 0
5 − 3 = 2
1−3 −2
On trouve donc
−2 0
Y = 0 2
2 −2
Y étant la matrice centrée
• Calculons l’écart type de chaque :
* Première colonne :
s √
q (−2)2 + (0)2 + (2)2 2 2
V (X) = = √
3 3
61
* Deuxième colonne :
s √
q (0)2 + (2)2 + (−2)2 2 2
V (X) = = √
3 3
− 2√√2 2 0
3
2
Z=
0 √
2√ 2
3
2 2
− 2√ 2
√ √
2√ 2
3 3
√
√
6
√
6
! − 6 0
1 − 0 2 √
Γ= 2 √ 2√ 0 6
p 6 6 √ 2√
0 2
− 2 6 6
2
− 2
!
1 − 12
Γ=
− 21 1
3. Diagonalisons la matrice Γ.On note λ1 et λ2 ses valeurs propres avec λ1 >λ2
!
1 − λ − 12
Γ − λI =
− 21 1 − λ
1 − λ − 12
det Γ − λI =
−1 1 − λ
2
1 3 3 1
det Γ − λI = 2
−λ 2
− λ d ou λ1 = 2
et λ2 = 2
62
• Déterminons les vecteurs propres :
! ! !
1 − 12 x1 3 x1
ΓX1 = λ1 X1 ⇒ =
− 21 1 x2 2 x2
1 3
1 − 2 x2 = 2 x1
x
− 1 x1 + x2 = 3 x2
2 2
donc v2 = (1, 1)
Nous pouvons
! donc déduire la valeur de la matrice de passage qui est
1 1
p=
−1 1
• Diagonalisons
Γ = pDp−1
!
3
2
0
D= 1
0 2
!
1
− 21
En calculant l’inverse de p nous avions p−1 = 2
1 1 Alors
2 2
! ! !
3 1
1 1 2
0 2
− 12
Γ= 1 1 1
−1 1 0 2 2 2
63
F1 2
√ √
2
√
u1 = ∥F1 ∥
=( , − ) car ∥F 1∥ = 2
√2 √ 2 √
F2 2 2
u2 = =
∥F2 ∥
( 2 , 2 ) car ∥F 2∥ = 2
5. vérifions que ses axes sont perpendiculaires
les axes sont perpendiculaires si u1 .u2 = 0
√ √ √ √
2 2 2 2
u1 .u2 = ( ,− ).( , )
2 2 2 2
√ √ √ √
2 2 2 2
=( ).( ) + (− ).( )
2 2 2 2
1 1
− =0
u1 .u2 =
2 2
Comme le produit scalaire est nul alors les axes sont perpendiculaires.
6. Ecrivons la matrice diagonale des valeurs propres Λ et calculons sa trace et
vérifie que
tr(Λ) = tr(Γ) !
3 3 1
2
0
Λ= 1 alors tr(Λ) = + =2
0 2 2 2
!
1 − 21
Γ= alors tr(Γ) = 1 + 1 = 2
− 12 1
Donc tr(Λ) = tr(Γ)
7. Calculons les composantes principales et les facteurs principaux
• les composantes principales :
Les composantes principales ci sont les variables définies par les axes princi-
paux (représentant donc la projection des données Z centrées réduites dans
ce cas ; sur les axes principaux ) : ci = Zui avec ui =ieme vecteur unitaire
=ieme axe principal
c1 = Zu1
√ √
− 6 0 √
2
! − 3
2 √ √2
= 6 2√ = 3
√0 −
6
2√
6
− 2 √2
2 3
2
− 2
Ainsi :
√
− 3
√2
c1 = 3
−√2
3
64
c2 = Zu2
√ √
− 6 0 √
2
! − 3
2 √ √2
= 6 √2 = 3
√0
2√ 2 2
6 6 2 0
2
− 2
Ainsi :
√
− 3
√2
c2 =
2
3
0
• Les Facteurs principaux :
Les facteurs principaux sont déterminés par les vecteurs propres de R.
Il y en a donc d=2 qui sont :
di = √cλi i
d1 = √c1
λ1
√
− 3
√2
− 3 √
√2
− 2
3 √2
d1 = √ 3 ⇒ d1 =
−
2
2 √2
2
d2 = √cλ2 2
√
− 3
√2
3 √
− 6
2
0 √2
d2 = √1 ⇒ d2 = 6
2
2
0
8.Dessiner le nuage de points projeté sur le premier axe.Calculer la repré-
sentation globale sur le premier axe, et la contribution de chaque individu
sur le premier axe
* Dessinons
√ le√nuage de points projeté
u1 = ( √22 ; −
√ 2
2
)
2 2
u2 = ( 2 ; 2 )
65
Figure 29 – Nuage de points des individus
6.0.2 Exercice3
1. Déterminons la loi de (X, Y ) et son support :
ou
λe−λx ,x ≥ 0 et x ≤ y ≤ x + 1
fX,Y (x, y) =
0 sinon
— Calculons E (Y/X=x)
R
E(Y /X = x)= R yfY /X=x (y/x)dy
1
fY (y) = (x+1−x) .1[x,x+1] (y) ; alors (Y /X = x) −→ U ([x; x + 1])
x+x+1
E(Y /X = x)= 2 d’ou R(Y /X = x)= 2X+1 2
66
— Calculons E(Y )
E(Y )=E(R(Y /X = x))
= E( 2x+1
2
)
= E(x + 12 )
1
= R(x) + 2
= λ1 + 21 ; X −→ e(λ)
d’ou E(Y ) = 2+λ
2λ
— Calculons E(Y 2 /X = x)
X −→ U ([a, b])
E(X 2 ) = V(X) + E(X 2 )
(b−a)2 (a+b)2
= 12
+ 4
b2 +ab+a2
= 3
(x+1)2 +x(x+1)+x2
E(Y 2 /X = x) = 3
3x2 +3x+1
= 3
1
d’ou E(Y 2 /X = x) = x2 + x + 3
— Calculons E(Y 2 )
E(Y 2 ) = E(E(Y 2 /X = x))
= E(x2 + x + 13 )
1
= E(x2 + x) + 3
1
= E(x2 ) + E(x) + 3
67
2 1 1
= λ2
+ λ
+ 3
3λ2 +λ+2
d’ou E(Y 2 ) = 3λ2
2. Déterminons
R
la loi de densité Y :
fY (y) = R fX,Y (x, y)dx
On n’a 0 ≤ x ≤ y ≤ x + 1 =⇒ 0 ≤ y − x ≤ 1
=⇒ −1 ≤ x − y ≤ 0
=⇒ y − 1 ≤ x ≤ y
— Si 0 ≤ yR ≤ 1 =⇒ y − 1 ≤ 0
fY (y) = 0y λe−λx dx car R+ ∩ [y − 1, y] = [0, y]
fY (y) = 1 − e−λy
— Si y ≥ 1R =⇒ y − 1 ≥ 0
y
fY (y) = y−1 λe−λx dx car R+ ∩ [y − 1, y] = [y − 1, y]
d’ou
1 − e−λysi 0 ≤ y ≤ 1
fY (y) = −λy
e (−1 + e−λy ) si y ≥ 1
E(Yi − 21 ) = E(Yi ) − 1
2
= ( λ1 + 21 ) − 1
2
68
P
donc E(Yi − 21 ) = 1
λ
alors (Tn ) −→ T avec T = 1
λ
1
(Yi − 12 ) = 1
P P
n n
(Zi )
P
d’après la loi faible des grands nombres Zn −→ E(Z1 ) = E(Y1 − 12 ) = 1
λ
P 1
Zn −→ λ
1
La suite (Tn )n∈N converge vers λ
Pn
4. Déterminons la loi limite de Wn = √1 − 1
− 12 )
n i=1 (Yi λ
√
Posons Vi = Yi − E(Yi ) =⇒ Wn = n(Vn − E(Vi ))
)
Les Vi convergent en loi vers la loi normale N (0, V(Y
n
)
Vn −E(Vn ) L L
V (Vn )
−→ N (0, 1) =⇒ Vn − E(Vn ) −→ N (0, V(Vn )) et
L )
comme V −→ N (0, V(Y
n
)
√ L
n(Vn − E(Vn )) −→ N (0, V(Y )) et
√ L
n(Vn − E(Vn )) = Wn =⇒ Wn −→ N (0, V(Y ))
Donc Wn converge en loi vers la loi normale N (0, V(Y )).
69