You are on page 1of 70

Université Thomas SANKARA BURKINA FASO

LIME-LISE 3 Unité-Progès-Justice

TRAVAUX PRATIQUE SUR LE LOGICIEL STATA ET SUR LATEX

MEMBRE DU GROUPE Professeur chargé du cours


OUEDRAOGO Pingwende Grace Dr Mathieu SOME
KABORE Oumou
Table des matières

I Partie A 4
1 Statistiques descriptives 4
1.1 Analyse descriptive de CHO . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Analyse descriptive de CRO . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Analyse descriptive de INF . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Analyse descriptive de CPR . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Analyse descriptive de INV . . . . . . . . . . . . . . . . . . . . . . 21

2 Statistique inférentiel 25
2.1 Analyse des corrélations . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Tests d’Hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3 Régression linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 Régression linéaire multiple . . . . . . . . . . . . . . . . . . . . . . 36

3 Analyse de donnée 42
3.1 Réalisation d’un ACP . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4 Classification ascendante hiérachique (CAH) et K-means 49


4.1 Classification ascendante hiérachique (CAH) . . . . . . . . . . . . . 49
4.2 K-means . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

II Partie B 59
5 Exercices 59
5.0.1 Exercice 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.0.2 Exercice 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.0.3 Exercice3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

6 Corrections 61
6.0.1 Exercice 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.0.2 Exercice3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

1
Table des figures
1 Graphique médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Boite à moustache de CHO . . . . . . . . . . . . . . . . . . . . . . 6
3 Histogramme de CHO . . . . . . . . . . . . . . . . . . . . . . . . . 6
4 Evolution de CHO . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
5 Boite à moustache de CRO . . . . . . . . . . . . . . . . . . . . . . . 9
6 Histogramme de CRO . . . . . . . . . . . . . . . . . . . . . . . . . 11
7 Evolution de CRO . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
8 Boite à moustache de INF . . . . . . . . . . . . . . . . . . . . . . . 14
9 Histogramme de INF . . . . . . . . . . . . . . . . . . . . . . . . . . 15
10 Evolution de INF . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
11 Boite à moustache de CPR . . . . . . . . . . . . . . . . . . . . . . . 18
12 Histogramme de CPR . . . . . . . . . . . . . . . . . . . . . . . . . 19
13 Evolution de CPR . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
14 Boite à moustache de INV . . . . . . . . . . . . . . . . . . . . . . . 22
15 Histogramme de INV . . . . . . . . . . . . . . . . . . . . . . . . . . 23
16 Evolution de INV . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
17 Representation des variables . . . . . . . . . . . . . . . . . . . . . . 46
18 Representation des individus . . . . . . . . . . . . . . . . . . . . . . 47
19 Representation des individus . . . . . . . . . . . . . . . . . . . . . . 47
20 Dendogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
21 Duda Hart index . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
22 Scree plot of eigenvalues . . . . . . . . . . . . . . . . . . . . . . . . 52
23 score variable (pca) . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
24 component loading . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
25 scree plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
26 biplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
27 Répresentation des classes en terme de distance . . . . . . . . . . . 56
28 Répresentation des classes sur le premier plan factoriel . . . . . . . 57
29 Nuage de points des individus . . . . . . . . . . . . . . . . . . . . . 66

2
Liste des tableaux
1 Tableau de corrélation . . . . . . . . . . . . . . . . . . . . . . . . . 25
2 Tableau de corrélation . . . . . . . . . . . . . . . . . . . . . . . . . 27
3 Tableau de régression entre CHO et CRO . . . . . . . . . . . . . . . 28
4 Tableau de régression entre CHO et INF . . . . . . . . . . . . . . . 29
5 Tableau de régression entre CHO et CPR . . . . . . . . . . . . . . . 30
6 Tableau de régression entre CHO et INV . . . . . . . . . . . . . . . 31
7 Tableau de régression entre CRO et INF . . . . . . . . . . . . . . . 32
8 Table de régression entre CRO et CPR . . . . . . . . . . . . . . . . 33
9 Table de régression entre INF et CPR . . . . . . . . . . . . . . . . . 34
10 Table de régression entre INF et INV . . . . . . . . . . . . . . . . . 35
11 Régression linéaire multiple entre la indépendante CHO et les autres 37
12 Régression linéaire multiple entre la indépendante CRO et les autres 38
13 Régression linéaire multiple entre la indépendante INV et les autres 39
14 Régression linéaire multiple entre la indépendante CPR et les autres 40
15 Régression linéaire multiple entre la indépendante INF et les autres 41
16 Valeurs Propres (matrice de correlation.) et stat. associées . . . . . 43
17 Composantes principales . . . . . . . . . . . . . . . . . . . . . . . . 44
18 Saturations, contributions et qualités de représentation des variables 45
19 Représentation des individus dans le premier plan factoriel . . . . . 46
20 Centre des classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3
Première partie
Partie A
1 Statistiques descriptives
1.1 Analyse descriptive de CHO
1. Taux de chomage

* Mesure de la position
• La moyenne de la variable CHO est 7,625. Le taux de chômage en Bel-
gique entre les années 1971 à 1990 était en moyenne égale à 7,625.

• La médiane de la variable CHO est 7,5. A partir des année 1981 le taux
de chômage est strictement supérieur à 7,5. On constate que le taux
de chômage avait en moyenne augmenté à partir des années 1981 par
rapport aux années antérieures.

* Graphique médiane

CHO
6
Distance above median
2 0 4

0 2 4 6
Distance below median

Figure 1 – Graphique médiane

4
• Le premier et le troisième quartile de la variable CHO sont :
Q1= 4,85 et Q3=11,25

* Mesure de la dispersion
• L’étendue de la variable CHO est égale à 10,8

• La variance de la variable CHO est égale 13,70513

• L’écart-type de la variable CHO est égale 3,702044

* Paramètre de forme
• LE coefficient d’asymétrie de Fisher(skewness)est égal à -0,2545367. Une
asymétrie négative est estimée pour le taux de chômage. La distribution
est asymétrique étalé à gauche de la moyenne.

* Paramètre d’aplatissement(kurtosis)
• Le coefficient d’aplatissement(Kurtosis) de la variable CHO est égal à
1,782306.
Un aplatissement positif estimé pour le taux de chômage. La distribution
présente un pic moins plat et des extrémités plus épaisses par rapport à
la distribution normal. On constate un regroupement d’outliers (valeur
aberrantes ou distante des autres valeurs).

• Representation graphique

* Boite à moustache
La première moustache à gauche indique le taux de chomage le plus
bas atteint entre les années 1971 à 1990 qui est de 1,7
La deuxième moustache à droite indique le taux de chomage le plus elévé
entre 1971 à 1990 qui est de 12,5
L’étendu dans cette série statistique est de 10,8 Il y’a 10,8 d’ecart entre
le taux de chomage le plus élévé et le plus bas.
Le prémier quartile est de 4,85 ie qu’au bout des 20 années,le taux de
chomage sur 5 années est de 4,8

* Histogamme de CHO

La distribution est asymétrique étalé à gauche de la moyenne.En

5
2 4 6 8 10 12
CHO

Figure 2 – Boite à moustache de CHO


.15
.1
Density
.05
0

2 4 6 8 10 12
CHO

Figure 3 – Histogramme de CHO

générale le taux de chomage est relativement élevé

6
* Evolution de CHO

12
10
8
CHO
6
4
2

70 75 80 85 90
Année

Figure 4 – Evolution de CHO

Le taux de chomage connait une evolution croissante entre les années 1971
à 1983,reste stationnaire entre 1983 à 1984,et décroit de 1985 à 1990

7
1.2 Analyse descriptive de CRO
2. Taux de croissance

* Mesure de la position
• La moyenne de la variable CRO est 2,59.
Le taux de croissance en Belgique entre les années 1971 et 1990 était en
moyenne égale à 2,59.
• La médiane de la variable CRO est 2,45
• Le premier et le troisième quartile de la variable CRO sont :
Q1=1,1 et Q3=4,2

* Mesure de la dispersion

• L’etendue de la variable CRO est égale à 7,4.

• La variance de la variable CRO est égale à 4,544105.

• L’écart-type la variable CRO est égale à 2,131691

* Paramètre de forme

• Le coefficient d’asymétrie de Fisher (skewness)de la variable CRO est


égal à -0,1946188.
Une asymétrie négative est estimée pour le taux de croissance. La dis-
tribution est asymétrique étalé à gauche de la moyenne.

* Paramètre d’aplatissement(kurtosis)

• Le coefficient de la variable CRO est égal à 2,168262.


Un aplatissement positif est estimé pour le taux croissance. La distri-
bution présente un pic moins plat et des extrémités plus épaisses par
rapport à la distribution normal. On constate un regroupement d’out-
liers (valeur aberrantes ou distante des autres valeurs).

* Représentation graphiques

8
* Boite à moustache

-2 0 2 4 6
CRO

Figure 5 – Boite à moustache de CRO

La première moustache à gauche indique le taux de croissance du


PIB le plus bas entre les années 1971 à 1990 qui est de -1,5 La deuxième
moustache à droite indique le taux de croissance du PIB le plus élever
entre 1971 à 1990 qui est de 5,9. Le bord gauche de la boite est le premier
quartile de la série qui est de 1,1 au bout des 20 année sur 5 année Le
troisième quartile est de 4,2 au bout des 20 sur 15 année le taux de
croissance du PIB est inférieur à 4,2. L’écart interquartile est 3,1 au

9
bout des 20 années sur 10 année le taux de croissance du PIB se tient
dans un intervalle de 3,1.

10
.2
.15
Density
.1.05
0

-2 0 2 4 6
CRO

Figure 6 – Histogramme de CRO

La distribution est asymétrique étalé à gauche de la moyenne.En


générale le taux de croissance est relativement élevé

11
* Evolution de CRO
Le taux du croissance du PIB evolue en dent de scie d’annéé en année

6
4
CRO
2
0
-2

70 75 80 85 90
Année

Figure 7 – Evolution de CRO

12
1.3 Analyse descriptive de INF
3. Inflation
* Mesure de la position

• La moyenne de la variable INF est 5,79.


Le taux d’inflation en Belgique entre les années 1971à 1990 était en
moyenne égale à 5,79.

• La médiane de la variable INF est 5,4


• Le premier et le troisieme quartile de la variable INF sont :

Q1=4,15 et Q3=7,15

* Mesure de la dispersion
• L’étendu de la variable INF est égale à 10,8.

• La variance de la variable INF est égale à 7,705158.

• L’écart-type est égale à 2,602913

* Paramètre de forme
• Le coefficient d’asymétrie de Fisher (skewness) de la variable INF est
égal à 1.09252.
Une asymétrie positive est estimée pour taux d’inflation. La moyenne
est alors supérieure à la médiane alors la distribution est étalée à droite
de la moyenne.

* Paramètre d’aplatissement(kurtosis) Pour la variable INF son coefficient


est égal à 3,978248. Un aplatissement positif est estimé pour le taux
d’inflation. La distribution présente un pic moins plat et des extrémi-
tés plus épaisses par rapport à la distribution normal. On constate un
regroupement d’outliers (valeur aberrantes ou distante des autres)

13
* Representation graphique

* Boite à moustache

2 4 6 8 10 12
INF

Figure 8 – Boite à moustache de INF

La première moustache à gauche indique le taux d’inflation le plus bas


entre les années 1971 à 1990 qui est de 1,8 La deuxième moustache à droite
indique le taux d’inflation le plus élever entre 1971 à 1990 qui est de 12,6.
L’étendu dans cette série statistique est de 10,8.IL y a 10,8 d’écart entre
le taux d’inflation le plus élevée et le taux d’inflation le plus bas. Le bord
gauche de la boite est le premier quartile de la série qui est de 4,15 au
bout des 20 années sur 5 année le taux d’inflation est inférieur à 4,15 Le
troisième quartile est de 7,15 au bout des 20 sur 15 année le taux d’inflation
est inférieur à 7,15. L’écart interquartile est de 3 au bout des 20 années sur
10 année le taux d’inflation se tient dans un intervalle de 3.

14
* Histogramme

.2
.15
Density
.1.05
0

2 4 6 8 10 12
INF

Figure 9 – Histogramme de INF

La distribution est asymétrique étalé droite de la moyenne.En générale


le taux d’inflation est relativement bas

15
* Evolution de INF

12
10
8
INF
6
4
2

70 75 80 85 90
Année

Figure 10 – Evolution de INF

Le taux d’inflation est croissante de 1971 à 1774 et décroit en moyenne


entre 1975 à 1990

16
1.4 Analyse descriptive de CPR
4. Taux de consommation privée
* Mesure de la position
• La moyenne de la variable CPR est 62,76.
• Le taux de consommation privée par rapport au PIB en Belgique était
en moyenne égale à 62,76 entre les années 1971 et 1990.
• La médiane de la variable CPR est 62,6
• le premier et le troisième quartile de la variable CPR sont :
On a Q1=61,05 et Q3=64,7
* Mesure de la dispersion
• L’étendue de la variable CPR est égale à 5,8.
• la variance de la variable CPR est égale à 3,766737.
• Pour la variable CPR, son écart-type est égale à 1,940808
* Le coefficient d’asymétrie de Fischer (skewness)est égal à 0,0770367.
Une asymétrie proche de zéro est estimée pour le taux de consommation
privée la moyenne est alors très proche de la médiane. Les observations se
répartissent de manière quasi uniforme autour de la moyenne la médiane
et le mode.
* Paramètre d’aplatissement(kurtosis)
• Pour la variable CPR son coefficient est égal à 1,660096. Un aplatisse-
ment positif est estimé pour le taux de consommation privé. La distri-
bution présente un pic moins plat et des extrémités plus épaisses par
rapport à la distribution normal. On constate un regroupement d’out-
liers (valeur aberrantes ou distante des autres).

17
* Representation graphique

* Boite à moustache

60 62 64 66
CPR

Figure 11 – Boite à moustache de CPR

La première moustache à gauche indique le taux de consommation pri-


vée le plus bas entre les années 1971 à 1990 qui est de 59,8 La deuxième
moustache à droite indique le taux de consommation privée le plus élever
entre 1971 à 1990 qui est de 65,6. L’étendu dans cette série statistique est de
5,8 IL y a 5,8 d’écart entre le taux de consommation privée le plus élevée et
le taux de consommation privée le plus bas. Le bord gauche de la boite est
le premier quartile de la série qui est de 61,05 au bout des 20 sur 5 années
le taux de consommation privée est inférieur à 61,05 Le troisième quartile
est de 64,07 au bout des 20 sur 15 année le taux de consommation privée
est inférieur à 64,07. L’écart interquartile est 3,65 au bout des 20 années
sur 10 année le taux de consommation privée se tient dans un intervalle de
3,65.

18
* Histogramme

.25
.2.15
Density
.1
.05
0

60 61 62 63 64 65
CPR

Figure 12 – Histogramme de CPR

Les observations se repartissent de manière quasi uniforme autour de la


moyenne.En générale le taux de consommation privé égal à la moyenne

19
* Evolution de CPR

66
64
CPR
62
60

70 75 80 85 90
Année

Figure 13 – Evolution de CPR

Le taux de consommation privée est ascendant de 1971 à 1982 et connait


une baisse progressive de 1982 à 1990

20
1.5 Analyse descriptive de INV
5. Taux d’investissement
* Mesure de la position
• La moyenne de la variable INV est 19,46.
• Le taux d’investissement en Belgique était en moyenne égale à 19,46
entre les années 1971 et 1990.
• La médiane de la variable INV est 20,45. A partir des années 1981
le taux de d’investissement est inférieur à 20,45. On constate que en
moyenne à partir des années 1981 le taux d’investissement avait baisser
comparativement aux années antérieures.
• le premier et le troisième quartile de la variable INV sont : Q1=16,75 et
Q3=21,65.
* Mesure de la dispersion

• L’étendue de la variable INV est égale à 7,1.


• la variance de la variable INV est égale à 6,775158.
• L’écart-type de la variable est égale à 2,602913.
* Le coefficient d’asymétrie de Fischer (skewness)

• Pour la variable INV son coefficient est égal à -0,3264258. Une asymé-
trie négative est estimée pour le taux d’investissement. La moyenne est
inférieure à la médiane alors la distribution est étalée à gauche de la
moyenne.
* Paramètre d’aplatissement(kurtosis) :Pour la variable INV son coeffi-
cient est égal à 1,486694.

21
* Representation graphique

* Boite à moustache

16 18 20 22 24
INV

Figure 14 – Boite à moustache de INV

La première moustache à gauche indique le taux d’investissement le plus


bas entre 1971 à 1990 qui est de15,6 La deuxième moustache à droite indique
le taux d’investissement le plus élever entre 1971 à 1990 qui est de 22,7.
L’étendu dans cette série statistique est de 10,8 IL y a 10,8 d’écart entre le
taux d’investissement le plus élevée et le taux de chômage le plus bas. Le
bord gauche de la boite est le premier quartile de la série qui est de 16,75
au bout des 20 années sur 5 année le taux d’investissement Le troisième
quartile est de 21,65 au bout des 20 sur 15 année le taux d’investissement
est inférieur à 21,65. L’ écart interquartile est 4,9 au bout des 20 années sur
10 année le taux d’investissement se tient dans un intervalle de 4,9

22
* Histogramme

.25
.2.15
Density
.1
.05
0

16 18 20 22
INV

Figure 15 – Histogramme de INV

La distribution est asymétrique étalé à gauche de la moyenne.En géné-


rale le taux de croissance est relativement élevé

23
* Evolution de INV

24
22
20
INV
18
16

70 75 80 85 90
Année

Figure 16 – Evolution de INV

Le taux d’investissement baisse considérablement de 1971 à 1985 et


connait une croissance de 1985 à 1990

24
2 Statistique inférentiel
2.1 Analyse des corrélations
Analyses des corrélations(Calcul du coefficient de détermination) (ob-
servations=20)

Table 1 – Tableau de corrélation

• Toute variable est en relation avec elle-même et son coefficient de cor-


rélation est égale à 1.
* Corrélation entre les variables CHO et CRO. Le coefficient de corrélation
entre le taux de chômage et le taux de croissance du PIB est de -0.
4507.Une corrélation négative est estimée entre le taux de chômage et
le taux de croissance du PIB. Une augmentation du taux de chômage
entraine une baisse du taux de croissance du PIB en Belgique.
* Corrélation entre les variables CHO et INF. Le coefficient de corréla-
tion entre le taux de chômage et le taux d’inflation est de -0.5229. Une
corrélation négative est estimée entre le taux de chômage et le taux d’in-
flation. Une augmentation du taux de chômage entraine une baisse du
taux d’inflation en Belgique.
* Corrélation entre les variables CHO et CPR.
— Le coefficient de corrélation entre le taux de chômage et le taux de
consommation privée est de 0.9418. Une corrélation positive forte est
estimée entre le taux de chômage et le taux de consommation privée.
Une augmentation du taux de chômage entraine une augmentation du
taux de consommation privée en Belgique.
* Corrélation entre les variables CHO et INV
— Le coefficient de corrélation entre le taux de chômage et le taux d’in-
vestissement est de -0.9139. Une corrélation négative forte est estimée
entre le taux de chômage et le taux d’investissement. Une augmentation
du taux de chômage entraine une baisse du taux d’investissement en
Belgique.
* Corrélation entre les variables CRO et INF

25
— Le coefficient de corrélation entre le taux d’inflation et le taux de crois-
sance du PIB est de -0. 1480.Une corrélation négative est estimée entre
le taux d’inflation et le taux de croissance du PIB. Une augmentation
du taux d’inflation entraine une baisse du taux de croissance du PIB en
Belgique.
* Corrélation entre les variables CRO et CPR Le coefficient de corrélation
entre le taux de consommation privé et le taux de croissance du PIB
est de -0.5605. Une corrélation négative est estimée entre le taux de
consommation privée et le taux de croissance du PIB. Une augmentation
du taux de consommation privé entraine une baisse du taux de croissance
du PIB en Belgique.
* Corrélation entre les variables CRO et INV
— Le coefficient de corrélation entre le taux d’investissement et le taux de
croissance du PIB est de 0.3630. Une corrélation positive est estimée
entre le taux d’investissement et le taux de croissance du PIB. Une
augmentation du taux d’investissement entraine une augmentation du
taux de croissance du PIB en Belgique.
* Corrélation entre les variables CPR et Le coefficient de corrélation entre
le taux de consommation privé et le taux d’inflation est de -0.4466. Une
corrélation négative est estimée entre le taux de consommation privé et
le taux d’inflation. Une augmentation du taux de consommation privé
entraine une baisse du taux d’inflation en Belgique.
* Corrélation entre les variables CPR et INV
— Le coefficient de corrélation entre le taux de consommation privée et le
taux d’investissement est de -0.9030. Une corrélation négative est esti-
mée entre le taux de consommation privée et le taux d’investissement.
Une augmentation du taux de consommation privée entraine une baisse
du taux d’investissement en Belgique.
* Corrélation entre les variables INF et INV Le coefficient de corréla-
tion entre le taux d’inflation et le taux d’investissement est de 0.5045.
Une corrélation positive est estimée entre le taux d’inflation et le taux
d’investissement. Une augmentation du taux d’inflation entraine une
augmentation du taux d’investissement en Belgique.

2.2 Tests d’Hypothèses

26
Table 2 – Tableau de corrélation

La variable CHO suit une loi normale car p-value égale 0,30510>0,05
La variable CRO suit une loi normale car p-value égale 0,78557>0,05
La variable INF ne suit pas une loi normale car p-value égale 0,03516<0,05
La variable CPR suit une loi normale car p-value égale 0,15365>0,05
La variable INV ne suit pas une loi normale car p-value égale 0,01178<0,05

27
2.3 Régression linéaire
Hypothèse :
Entre le taux de chômage et taux de croissance du PIB. Les hypothèses
formulées sont :
H0 : le taux de croissance du PIB explique le taux de chômage.
H1 : le taux de croissance du PIB n’explique pas le taux de chômage.

Table 3 – Tableau de régression entre CHO et CRO

La p-value est de 0,018<0,05 ;le taux de croissance du PIB n’explique


pas le taux de chomage

28
Hypothèse :
Entre le taux de chômage et le taux d’inflation. Les hypothèses formulées
sont :
H0 : le taux d’inflation explique le taux de chômage.
H1 : le taux d’inflation n’explique pas le taux de chômage

Table 4 – Tableau de régression entre CHO et INF

La p-value est de 0,018<0,05 ;le taux d’inflation n’explique pas le taux


de chomage

29
Hypothèse :
Entre le taux de chômage et taux de consommation privée. Les hypothèses
formulées sont :
H0 : le taux de consommation privée explique le taux de chômage.
H1 : le taux de consommation privée n’explique pas le taux de chômage.

Table 5 – Tableau de régression entre CHO et CPR

le taux de consommation privée n’explique même un peu pas le taux de


chômage.

30
Hypothèse :
Entre le taux de chômage et taux d’investissement. Les hypothèses formulées
sont : H0 : le taux d’investissement explique le taux de chômage. H1 : le
taux d’investissement n’explique pas le taux de chômage.

Table 6 – Tableau de régression entre CHO et INV

le taux d’investissement n’explique pas le taux de chômage.

31
Hypothèse :
Entre le taux de croissance du PIB et taux d’inflation. Les hypothèses for-
mulées sont : H0 : le taux d’inflation explique le taux de croissance du PIB.
H1 : le taux d’inflation n’explique pas le taux de croissance du PIB

Table 7 – Tableau de régression entre CRO et INF

La p-value est de 0,533>0,05 ;le taux d’inflation explique le taux de


croissance du PIB.

32
Hypothèse :
Entre le taux de croissance du PIB et taux de consommation privée. Les
hypothèses formulées sont :
H0 : le taux de consommation privée explique le taux de croissance du PIB.
H1 : le taux de consommation privée n’explique pas le taux de croissance
du PIB .

Table 8 – Table de régression entre CRO et CPR

La p-value est de 0,010<0,05, le taux de consommation privée n’explique


pas le taux de croissance du PIB .

33
Hypothèse :
Entre le taux de consommation privée et taux d’inflation. Les hypothèses
formulées sont :
H0 : le taux de consommation privée explique le taux d’inflation.
H1 : le taux de consommation privée n’explique pas le taux d’inflation

Table 9 – Table de régression entre INF et CPR

La p-value est de 0,048<0,05,le taux de consommation privée n’explique


pas le taux d’inflation

34
Hypothèse :
Entre le taux d’investissement et taux d’inflation. Les hypothèses formulées
sont :
H0 : le taux d’investissement explique le taux d’inflation.
H1 : le taux d’investissement n’explique pas le taux d’inflation

Table 10 – Table de régression entre INF et INV

La p-value est de 0,023<0,05,le taux d’investissement n’explique pas le


taux d’inflation

35
2.4 Régression linéaire multiple

36
La valeur P pour chaque terme teste l’hypothèse nulle.
Régression linéaire avec CHO la variable dépendante. Les hypothèses rete-
nues sont : H0 : Les variables indépendantes expliquent le taux de chômage.
H1 : Les variables indépendantes n’explique pas le taux de chômage.

Table 11 – Régression linéaire multiple entre la indépendante CHO et les autres

Nous avons P = 0,085>0,05 donc la statistique du test est supérieure


à la p-value. Nous acceptons l’hypothèse H0. On a R-carré=0,91 , la ré-
gression détermine la distribution des points de la variable CHO. On a
R-carré ajusté=0,89, le modèle possède des valeurs prédictives. A l’issue
des résultats, on peut dire que en général le taux de croissance du PIB, le
taux d’inflation, le taux de consommation privé et le taux d’investissement
affectent l’évolution du taux de chômage entre les années 1971 à 1990. En
particulier le taux de consommation privée n’affecte pas le taux de chômage
car sa p-value est inférieur à 0,05.

37
La valeur P pour chaque terme teste l’hypothèse nulle. Régression li-
néaire avec CRO la variable dépendante. Les hypothèses retenues sont :
H0 : Les variables indépendantes expliquent le taux de croissance du PIB.
H1 : Les variables indépendantes n’explique pas le taux de croissance du
PIB.

Table 12 – Régression linéaire multiple entre la indépendante CRO et les autres

Nous avons P = 0,023<0,05 donc la statistique du test est inférieure à


la p-value. Nous rejetons l’hypothèse H0. On a R-carré=0,56, la régression
détermine à moitié la distribution des points de la variable CRO. On a R-
carré ajusté=0,44, le modèle possède des valeurs prédictives. A l’issue des
résultats, on peut dire que en général le taux de chômage, le taux d’inflation,
le taux de consommation privé et le taux d’investissement n’affectent pas
l’évolution du taux de croissance du PIB entre les années 1971 à 1990.
En particulier le taux de chômage explique très significativement le taux
croissance du PIB. Et le taux d’investissement explique mieux l’évolution
du taux de croissance du PIB que taux d’inflation. Contrairement au taux
de consommation qui n’a aucun effet sur lui

38
La valeur P pour chaque terme teste l’hypothèse nulle. Régression li-
néaire avec INV la variable dépendante. Les hypothèses retenues sont : H0 :
Les variables indépendantes expliquent le taux d’investissement. H1 : Les
variables indépendantes n’explique pas le taux d’investissement.

Table 13 – Régression linéaire multiple entre la indépendante INV et les autres

Nous avons P = 0,015 < 0,05 donc la statistique du test est inférieure à
la p-value. Nous rejetons l’hypothèse H0. On a R-carré=0,8669, la régres-
sion détermine la distribution des points de la variable INV. On a R-carré
ajusté=0,8314, le modèle possède des valeurs prédictives. A l’issue des ré-
sultats, on peut dire que en général le taux de chômage, le taux d’inflation,
le taux de croissance du PIB et le taux de consommation privée n’affectent
pas l’évolution du taux d’investissement entre les années 1971 à 1990. En
particulier le taux d’inflation explique significativement l’évolution du taux
d’investissement. Contrairement au taux de chômage, au taux de croissance
du PIB qui expliquent peu l’évolution du taux d’investissement.Et au taux
d’investissement qui n’a aucun effet sur elle car sa p-value est inférieur à
0,05.

39
La valeur P pour chaque terme teste l’hypothèse nulle. Régression li-
néaire avec CPR la variable dépendante. Les hypothèses retenues sont :
H0 : Les variables indépendantes expliquent le taux de consommation pri-
vée. H1 : Les variables indépendantes n’explique pas le taux de consomma-
tion privée.

Table 14 – Régression linéaire multiple entre la indépendante CPR et les autres

Nous avons P = 0,000 < 0,05 donc la statistique du test est inférieure à
la p-value. Nous rejetons l’hypothèse H0. On a R-carré=0,9267, la régres-
sion détermine la distribution des points de la variable CPR. On a R-carré
ajusté=0,9071, le modèle possède des valeurs prédictives. A l’issue des ré-
sultats, on peut dire que en général le taux de chômage, le taux d’inflation,
le taux de croissance du PIB et le taux d’investissement n’affectent pas
l’évolution du taux de consommation privée entre les années 1971 à 1990.
En particulier le taux d’inflation explique significativement l’évolution du
taux consommation privée. Contrairement au taux de chômage, au taux de
croissance du PIB au taux d’investissement qui n’a aucun effet sur lui car
leur p-value est inférieur à 0,05.

40
La valeur P pour chaque terme teste l’hypothèse nulle. Régression li-
néaire avec INF la variable dépendante. Les hypothèses retenues sont : H0 :
Les variables indépendantes expliquent le taux d’inflation. H1 : Les variables
indépendantes n’explique pas le taux d’inflation.

Table 15 – Régression linéaire multiple entre la indépendante INF et les autres

Nous avons P = 0,607>0,05 donc la statistique du test est supérieure à


la p-value. Nous acceptons l’hypothèse H0. On a R-carré=0,4630, la régres-
sion détermine a moitié la distribution des points de la variable INF. On a
R-carré ajusté=0,3198, le modèle possède peu de valeurs prédictives. A l’is-
sue des résultats, on peut dire que en général le taux de croissance du PIB,
le taux de chômage, le taux de consommation privé et le taux d’investisse-
ment affectent l’évolution du taux d’inflation entre les années 1971 à 1990.
En particulier le taux de consommation privée et le taux d’investissement
explique mieux l’évolution du taux d’inflation ; comparativement, au taux
de chômage et au taux de croissance du PIB.

41
3 Analyse de donnée
3.1 Réalisation d’un ACP

42
Corrélation des variables :

Table 16 – Valeurs Propres (matrice de correlation.) et stat. associées

— Valeurs Propres (matrice de corrélation) et stat. associées — Va-


riables actives seules — Saturations, contributions et qualités de représen-
tation des variables — Représentation des individus dans le premier plan
factoriel

43
Table 17 – Composantes principales

44
Table 18 – Saturations, contributions et qualités de représentation des variables

45
Table 19 – Représentation des individus dans le premier plan factoriel

Figure 17 – Representation des variables

46
Figure 18 – Representation des individus

Figure 19 – Representation des individus

47
6. Etude du tableau des valeurs propres

• A quoi correspond la somme des valeurs propres ? La somme des valeurs


propres est égale à 5. Dans le cas d’une ACP normée telle que celle qui
est effectuée ici, cette somme est égale au nombre de variables. Cette
valeur correspond également à la variance du nuage des individus.
• On choisit de n’étudier que les deux premières composantes principales.
Justifier ce choix en analysant le tableau des valeurs propres. On peut
choisir de ne s’intéresser qu’aux valeurs propres dont la contribution
à la variance est supérieure à la moyenne. Ceci revient à étudier les
composantes principales correspondant à des valeurs propres supérieures
à 1. Or, seules les deux premières valeurs propres vérifient cette propriété
sur l’exemple fourni.
• Etude du tableau des corrélations Quels sont les variables les plus for-
tement corrélés entre eux ? Les corrélations les plus fortes sont celles
correspondant aux coefficients de corrélation les plus proches de 1 ou -1.
Ici, le coefficient de corrélation dont la valeur absolue est la plus proche
de 1 est celui qui relie CPR et CHO.
• Etude des qualités de représentation dans le premier plan principal Quel
est la variable le moins bien représenté par le premier plan principal ?
Quel est la variable le mieux représenté ? 20 observations et 5 variables
Variance expliqué par la première composante 0.7271 Variance ex-
pliqué par la second composante 0.1918 Variance totale expliqué 0.9189
Les qualités de représentation des variables dans le premier plan factoriel
sont obtenues en additionnant les résultats des deux colonnes "Cos2" du
tableau relatif aux variable. Le sujet le mieux représenté est INF, avec
une qualité de représentation de 0,9885, le plus mal représenté est CPR,
avec une qualité de 0,2615.

48
4 Classification ascendante hiérachique (CAH)
et K-means
4.1 Classification ascendante hiérachique (CAH)
Principe de la méthode CAH : La classification ascendante hiérarchique,est
une méthode de classification itérative, ou l’on commence d’abord par re-
groupé les deux individus les plus proches en utilisant euclidienne créant
ainsi une classe comprenant ces deux individus.Ensuite ce sont les deux
classes les plus proches qui sont regroupés,grâce à un indice d’agrégation :
l’indice Ward,appelé aussi critère d’agrégation suivant la perte d,inertie mi-
nimale.On poursuit,jusqu’à ce que tous les individus soient regroupés.Ces
regroupement successive produisent un arbre binaire de classification «den-
dogramme» ;,dont la racine correspond à la classe regroupant l’ensemble des
individus.Ce dendogramme représente une hiérarchique de partition .On
peut alors choisir une partition en tronquant l’arbre à un niveau donné. En
réalisant la Classification ascendante hiérachique sur nos données on obtient
le dendogramme ci-dessous

49
Dendrogram for _clus_3 cluster analysis

50 40
L2 dissimilarity measure
20 30
10
0

1 2 3 6 4 5 7 8 9 10 20 19 11 12 13 15 14 16 17 18

Figure 20 – Dendogramme

Après savoir representer le dendogramme nous allons maintenant deter-


miner le nombre optimale de classe qu’il nous faut :

50
Figure 21 – Duda Hart index

La figure Represente l’indice de Duda-Hart qui est le rapport entre la


distance moyenne intra classe et la distance moyenne inter classe.En se ba-
sant sur cet indice nous décidons de realiser une partition en quatre classes

51
Figure 22 – Scree plot of eigenvalues

Figure 23 – score variable (pca)

52
Figure 24 – component loading

Figure 25 – scree plot

53
Figure 26 – biplot

54
4.2 K-means

55
Figure 27 – Répresentation des classes en terme de distance

En réalisant une partition des observations en 4 classes par la méthode


des k-means on obtient la répartition suivant :

56
Figure 28 – Répresentation des classes sur le premier plan factoriel

Par la suite nous allons chercher à caractériser chaque classe obtenue.


La figure 3 présente les centres des différentes classes obtenues. Nous uti-

Table 20 – Centre des classes

liserons ces centres en tant qu’individus représentatifs des classes. Suite à


cela nous obtenons les quatre classes suivantes :

Classe 1 : Composée des années 71 72 73 74 75 et 76, elle regroupe les


individus présentant un taux de croissance, d’investissement et d’inflation
nettement supérieur aux autres classes. Cette classe représente 30% de la
période observé.

Classe 2 : Composée des années 77 78 79 80 et 90, elle regroupe les


individus représentant des caractéristiques moyennes comparées aux autres
classes. Cette classe représente 30% de la période observée.

57
Classe 3 : Composée des années 81 82 83 84 85 et 86, elle est caractéri-
sée par un taux de chômage et un taux de consommation privée très élevée.
Cette classe représente 30% de la période observée.

Classe 4 : Composée des années 87 et 88, elle regroupe les individus


présentant un taux d’investissement et un taux d’inflation très faible. Cette
classe représente 10% de la periode observée.

58
Deuxième partie
Partie B
5 Exercices
5.0.1 Exercice 1
A.Le présent projet est étude sur la base de données conjoncturelle de la
Belgique.
Le tableau ci-dessous présente l’évolution du taux de chomage.

Présentation de la base de données.


Nous utiliserons cette base concernant les données conjoncturelles de le Belgique
entre 1971 et 1990

Année CHO CRO INF CPR INV


71 1.7 3.7 5.6 60.3 22.1
72 2.2 5.3 6.2 60.2 21.3
73 2.2 5.9 7.2 60.6 21.4
74 2.3 4.1 12.6 59.8 22.7
75 4.2 -1.5 12.1 61.2 22.5
76 5.5 5.6 7.6 60.9 22.1
77 6.3 0.5 7.5 61.9 21.6
78 6.8 2.7 4.4 61.6 21.7
79 7.0 2.1 4.5 62.8 20.7
80 7.4 4.3 3.8 62.9 21.1
81 9.5 -1.0 4.7 65.2 18.0
82 11.2 1.5 7.1 65.6 17.3
83 12.5 0.4 5.6 65.2 16.2
84 12.5 2.2 5.2 64.9 16.0
85 11.8 0.8 6.1 65.5 15.6
86 11.7 1.4 3.9 64.2 15.7
87 11.3 2.0 2.3 64.5 16.0
88 10.2 5.0 1.8 63.1 17.7
89 8.6 3.6 4.6 62.4 19.3
90 7.6 3.2 3.0 62.4 20.2
Ce tableau se compose de 20 individus qui représentent les années étudiées(en
ligne de 1971 à 1990)ainsi que les 05 variables suivantes (en colonne)

59
• CHO : taux de chomage
• CRO : taux de croissance du PIB,
• INF : taux d’inflation,
• CPR : taux de consommation privée (rapport de la consommation privée
au PIB),
• INV : taux d’investissement (rapport de la formation brute de capital fixe
au PIB)

5.0.2 Exercice 2
On considère le tableau X suivant de type (3,2) suivant :
 
2 3
X= 4 5

6 1
1. Donner le tableau des années centrées réduites (normée).
2. Donner la matrice des corrélation Γ.
3. Diagonaliser la matrice γ. On note λ1 et λ2 ses valeurs propres avec λ1 >λ2 .
4. Déterminer les axes factoriels. Donner le vecteur unitaire ui de chaque axe
Fi .
5. Vérifier que ces axes sont perpendiculaire.
V
6. Écrire la matrice diagonale des valeurs propres et calculer sa trace et
V
vérifier que tr( )=tr(Γ).
7. Calculer les composantes principales et les facteurs principaux.
8. Dessiner le nuage de points projeté sur le premier axe. Calculer la représen-
tation globale sur le premier axe, et la contribution de chaque individu sur
le premier axe.

5.0.3 Exercice3
Soient une v.a. exponentielle X de paramètre λ et la v.a. Y dont la densité condi-
tionnelle fY /X=x par rapport à X = x est égale à 1[x,x+1] .

1. Déterminer la loi de (X, Y ) et son support. Calculer E(Y /X = x), E(Y ),


E(Y 2 /X = x), E(Y 2 ).
2. Déterminer la densité de Y .
3. Soit la suite Tn = n1 ni=1 (Yi − 21 ).Déterminer la variable aléatoire vers laquelle
P

la suite (Tn )n∈N converge en probabilité, les Yi étant de même loi que Y .
4. Quelle est la loi limite de la suite définie par Wn = √1n ni=1 (Yi − λ1 − 12 )
P

60
6 Corrections
6.0.1 Exercice 2

On considère le tableau X suivant de type (3, 2) suivant :


 
2 3
X = 4 5
 

6 1

1. Donnons le tableau des données centrées réduites (normées).

• Calculons la moyenne de chaque colonne :

• Première colonne : 2+4+6


3
=4

• Deuxième colonne : 3+5+1


3
=3

• Soustraction de la moyenne de chaque correspondant dans le tableau :

* Premiere colonne :    
2−4 −2

 4 − 4
 =  0 
 

6−4 2

* Deuxième colonne :    
3−3 0
5 − 3 =  2 
   

1−3 −2

On trouve donc  
−2 0
Y = 0 2


2 −2
Y étant la matrice centrée
• Calculons l’écart type de chaque :

* Première colonne :
s √
q (−2)2 + (0)2 + (2)2 2 2
V (X) = = √
3 3

61
* Deuxième colonne :
s √
q (0)2 + (2)2 + (−2)2 2 2
V (X) = = √
3 3

• Divisons chaque valeur pour l’écart type de la colonne correspondant :

− 2√√2 2 0
 
 3 
2
Z=

 0 √
2√ 2


 3

2 2 
− 2√ 2

√ √
2√ 2
3 3

Ainsi le tableau des données centrées réduites(normées) est :


 √ 
− 6 0
 2 √ 
Z= 6
 √0

2√ 
6 6
2
− 2

2. Donnons la matrice de corrélations Γ


1
Γ = Z T Z avec p = 3
p

 √ 

6

6
! − 6 0
1 − 0  2 √ 
Γ= 2 √ 2√  0 6 
p 6 6  √ 2√
0 2
− 2 6 6

2
− 2

!
1 − 12
Γ=
− 21 1
3. Diagonalisons la matrice Γ.On note λ1 et λ2 ses valeurs propres avec λ1 >λ2
!
 1 − λ − 12

Γ − λI =
− 21 1 − λ


  1 − λ − 12
det Γ − λI =
−1 1 − λ

2
    
1 3 3 1
det Γ − λI = 2
−λ 2
− λ d ou λ1 = 2
et λ2 = 2

62
• Déterminons les vecteurs propres :
! ! !
1 − 12 x1 3 x1
ΓX1 = λ1 X1 ⇒ =
− 21 1 x2 2 x2

1 3
1 − 2 x2 = 2 x1
x
 − 1 x1 + x2 = 3 x2
2 2

donc v1 = (1, −1)


! ! !
1 − 12 x1 1 x1
ΓX2 = λ2 X2 ⇒ =
− 21 1 x2 2 x2

1 1
1 − 2 x2 = 2 x1
x
 − 1 x1 + x2 = 1 x2
2 2

donc v2 = (1, 1)
Nous pouvons
! donc déduire la valeur de la matrice de passage qui est
1 1
p=
−1 1
• Diagonalisons
Γ = pDp−1
!
3
2
0
D= 1
0 2
!
1
− 21
En calculant l’inverse de p nous avions p−1 = 2
1 1 Alors
2 2
! ! !
3 1
1 1 2
0 2
− 12
Γ= 1 1 1
−1 1 0 2 2 2

4. Déterminons les axes factoriels et donnons le vecteur unitaire ui de chaque


axe Fi .
* Déterminons les axes factoriels Fi

F1 =vecteur propre v1 = (1, −1)

F2 =vecteur propre v2 = (1, 1)

* Déterminons les vecteurs unitaires ui


ui = ∥FFii ∥

63
F1 2
√ √
2

u1 = ∥F1 ∥
=( , − ) car ∥F 1∥ = 2
√2 √ 2 √
F2 2 2
u2 = =
∥F2 ∥
( 2 , 2 ) car ∥F 2∥ = 2
5. vérifions que ses axes sont perpendiculaires
les axes sont perpendiculaires si u1 .u2 = 0
√ √ √ √
2 2 2 2
u1 .u2 = ( ,− ).( , )
2 2 2 2
√ √ √ √
2 2 2 2
=( ).( ) + (− ).( )
2 2 2 2

1 1
− =0
u1 .u2 =
2 2
Comme le produit scalaire est nul alors les axes sont perpendiculaires.
6. Ecrivons la matrice diagonale des valeurs propres Λ et calculons sa trace et
vérifie que
tr(Λ) = tr(Γ) !
3 3 1
2
0
Λ= 1 alors tr(Λ) = + =2
0 2 2 2

!
1 − 21
Γ= alors tr(Γ) = 1 + 1 = 2
− 12 1
Donc tr(Λ) = tr(Γ)
7. Calculons les composantes principales et les facteurs principaux
• les composantes principales :
Les composantes principales ci sont les variables définies par les axes princi-
paux (représentant donc la projection des données Z centrées réduites dans
ce cas ; sur les axes principaux ) : ci = Zui avec ui =ieme vecteur unitaire
=ieme axe principal
c1 = Zu1
 √   √ 
− 6 0 √
2
! − 3
 2 √   √2 
= 6 2√ = 3
 √0 −

6
2√
6

− 2 √2 
2 3
2
− 2

Ainsi :
 √ 
− 3
 √2 
c1 =  3
−√2 
3

64
c2 = Zu2
 √   √ 
− 6 0 √
2
! − 3
 2 √   √2 
= 6 √2 = 3
 √0
 
2√  2  2 
6 6 2 0
2
− 2
Ainsi :
 √ 
− 3
 √2 
c2 = 
 2
3 

0
• Les Facteurs principaux :
Les facteurs principaux sont déterminés par les vecteurs propres de R.
Il y en a donc d=2 qui sont :
di = √cλi i

d1 = √c1
λ1
 √ 
− 3
 √2 
− 3   √ 
 √2 
− 2
3  √2 
d1 = √ 3 ⇒ d1 = 
−
2
2 √2 
2
d2 = √cλ2 2
 √ 
− 3
 √2 
 3   √ 
− 6
 2 
0  √2 
d2 = √1 ⇒ d2 =  6 
2
 2 
0
8.Dessiner le nuage de points projeté sur le premier axe.Calculer la repré-
sentation globale sur le premier axe, et la contribution de chaque individu
sur le premier axe

* Dessinons
√ le√nuage de points projeté
u1 = ( √22 ; −
√ 2
2
)
2 2
u2 = ( 2 ; 2 )

65
Figure 29 – Nuage de points des individus

* Calculons la représentation globale sur le premier axe :


IEK
I
= λ1 +λ
P2n+...+λn
λj j=1
3 3
3
= 3
2
+ 12
= 2
2
= 4
2

* Calculons la contribution de chaque individu sur le premier axe :


(ck )2
cont(i) = Pi λik ; P our tout i ∈ {1, 2, 3} et k ∈ {1, 2, 3}
• Pi = poids des individus et cont(i)= contribution

(c11 )2 ( −2 3 )2 1
cont(1) = P1 λ1
,donc AN : cont(1) = 3 = 6
√ 2
(c2 )2 ( −2 3 )2 1
cont(2) = P2 λ11 ,donc AN : cont(2) = 3 = 6
2
√ 2
(c3 )2 3 2
cont(3) = P3 λ11 ,donc AN : cont(3) = 3 = 3
2

6.0.2 Exercice3
1. Déterminons la loi de (X, Y ) et son support :

Nous savons que fX,Y (x, y)=fX (x).fY /X=x (y/x)

fX,Y (x, y)=λ exp(−λx) 1R+ (x).1[x,x+1] (y)

ou 
λe−λx ,x ≥ 0 et x ≤ y ≤ x + 1
fX,Y (x, y) =
0 sinon
— Calculons E (Y/X=x)
R
E(Y /X = x)= R yfY /X=x (y/x)dy
1
fY (y) = (x+1−x) .1[x,x+1] (y) ; alors (Y /X = x) −→ U ([x; x + 1])
x+x+1
E(Y /X = x)= 2 d’ou R(Y /X = x)= 2X+1 2

66
— Calculons E(Y )
E(Y )=E(R(Y /X = x))

= E( 2x+1
2
)

= E(x + 12 )

1
= R(x) + 2

= λ1 + 21 ; X −→ e(λ)
d’ou E(Y ) = 2+λ

— Calculons E(Y 2 /X = x)
X −→ U ([a, b])
E(X 2 ) = V(X) + E(X 2 )

(b−a)2 (a+b)2
= 12
+ 4

4b2 +4a2 +4ab


= 12

b2 +ab+a2
= 3

(x+1)2 +x(x+1)+x2
E(Y 2 /X = x) = 3

3x2 +3x+1
= 3

1
d’ou E(Y 2 /X = x) = x2 + x + 3

— Calculons E(Y 2 )
E(Y 2 ) = E(E(Y 2 /X = x))

= E(x2 + x + 13 )

1
= E(x2 + x) + 3

1
= E(x2 ) + E(x) + 3

67
2 1 1
= λ2
+ λ
+ 3

3λ2 +λ+2
d’ou E(Y 2 ) = 3λ2

2. Déterminons
R
la loi de densité Y :
fY (y) = R fX,Y (x, y)dx

λe−λx 1R+ (x)1[x,x+1] (y)dx


R
= R

λe−λx 1[x,x+1] (y)dx car R ∩ R+ = R+


R
= R+

On n’a 0 ≤ x ≤ y ≤ x + 1 =⇒ 0 ≤ y − x ≤ 1

=⇒ −1 ≤ x − y ≤ 0

=⇒ y − 1 ≤ x ≤ y

fY (y) = R+ λe−λx 1[y,y+1] (x)dx


R

— Si 0 ≤ yR ≤ 1 =⇒ y − 1 ≤ 0
fY (y) = 0y λe−λx dx car R+ ∩ [y − 1, y] = [0, y]
fY (y) = 1 − e−λy

— Si y ≥ 1R =⇒ y − 1 ≥ 0
y
fY (y) = y−1 λe−λx dx car R+ ∩ [y − 1, y] = [y − 1, y]

= [−e−λx ]yy−1 = e−λy + e−λ(y−1)

d’ou

1 − e−λysi 0 ≤ y ≤ 1
fY (y) =  −λy
e (−1 + e−λy ) si y ≥ 1

3. Déterminons la variable aléatoire vers laquelle la suite (Tn )n∈N converge en


probabilité :

E(Yi − 21 ) = E(Yi ) − 1
2

= ( λ1 + 21 ) − 1
2

68
P
donc E(Yi − 21 ) = 1
λ
alors (Tn ) −→ T avec T = 1
λ

1
(Yi − 12 ) = 1
P P
n n
(Zi )

P
d’après la loi faible des grands nombres Zn −→ E(Z1 ) = E(Y1 − 12 ) = 1
λ
P 1
Zn −→ λ

1
La suite (Tn )n∈N converge vers λ

Pn
4. Déterminons la loi limite de Wn = √1 − 1
− 12 )
n i=1 (Yi λ


Posons Vi = Yi − E(Yi ) =⇒ Wn = n(Vn − E(Vi ))
)
Les Vi convergent en loi vers la loi normale N (0, V(Y
n
)
Vn −E(Vn ) L L
V (Vn )
−→ N (0, 1) =⇒ Vn − E(Vn ) −→ N (0, V(Vn )) et

L )
comme V −→ N (0, V(Y
n
)
√ L
n(Vn − E(Vn )) −→ N (0, V(Y )) et
√ L
n(Vn − E(Vn )) = Wn =⇒ Wn −→ N (0, V(Y ))
Donc Wn converge en loi vers la loi normale N (0, V(Y )).

69

You might also like