You are on page 1of 8

Université De Bretagne Du Sud Ecole Nationale Supérieure D'ingénieurs De Bretagne-Sud

Compte Rendu : Travaux Pratique « Statistique uni variée et bivariée »

Réalisé par  AL ECHCHEIKH EL ALOUI Adnane Année Universitaire 2010/2011

 Ludovic Billot

Encadré par

1

1. Les données On va saisir une table qui fournit les caractéristiques de cylindre, de vitesse, de poids et de largeur de 24 modèles de voiture.

modele

cylindre vitesse loids largeur

modele={'Honda Civic';'Renault 19';'Fiat Tipo';'Peugeot 405';'Renault 21';'Citroën BX';'BMW 530i';'Rover 827i';'Renault 25';'Opel Omega';'Peugeot 405 Break';'Ford Sierra';'BMW 325iX';'Audi 90 Quattro';'Ford Scorpio';'Renault Espace';'Nissan Vanette';'VW Caravelle';'Ford Fiesta';'Fiat Uno';'Peugeot 205';'Peugeot 205 Rallye';'Seat Ibiza I';'Citroën AX Sport'} cylindre=[1396;1721;1580;1769;2068;1769;2986;2675;2548;1998;1905;1993;2494;1994;293 3;1995;1952;2109;1117;1116;1580;1294;1461;1294] vitesse=[174;180;170;180;180;182;226;222;226;190;194;185;208;214;200;177;144;149;135;1 45;159;189;181;184] >>Poids=[850;965;970;1080;1135;1060;1510;1365;1350;1255;1120;1190;1300;1220;1345;12 65;1430;1320;810;780;880;805;925;730] largeur=[166;169;170;169;170;168;175;175;180;177;171;172;164;169;176;177;169;184;162; 155;156;157;161;160]

Concaténation des variables quantitatives donnee=[cylindre vitesse Poids largeur];

2

2. Statistique descriptive commande mean >> moyenne=mean(donnee) moyenne = 1.0e+003 * 1.9061 0.1831 1.1108 0.1688 std >> ecarttype=std(donnee) ecarttype = 527.9087 25.2154 230.2912 7.6537 >> mediane=median(donnee) mediane = 1.0e+003 * 1.9285 0.1815 1.1275 0.1690 >> quantile50=quantile(donnee,0.50) quantile50 = 1.0e+003 * 1.9285 0.1815 1.1275 0.1690 >> interquartile=iqr(donnee) interquartile = 568.0000 25.0000 407.5000 12.0000

description M = moyenne (A) renvoie les valeurs moyennes des éléments le long de différentes dimensions d'un tableau. (pour que la valeur soit plus explicite on multiplier 1.0e+003 * 1.9061 )

median

median(donnee)renvoie les valeurs médianes des éléments le long de différentes dimensions d'un tableau. Qui permet de partager chaque tableau en deux parties

quantile

Il décile les éléments On remarque que les valeurs sont équivalentes

iqr

1) La représentation par histogramme La première opération est de déterminer le nombre de classes de l’histogramme.

>> k=1+3.3*log10(24) (Sturges)

3

hist(cylindre,k)

hist(vitesse,k) classe modale  180

hist(poids,k)

hist(largeur,k)

Une représentation par box-plot La distribution est décomposée en 4 zones de même effectif 25%, (la médiane est en rouge)
230 220 210 200 190 180 170 160 150 140

3000 2800 2600 2400 2200 2000 1800 1600 1400 1200 1

1

4

boxplot(cylindre) le quart des voitures de cylindre faible est moins que le dernier quart

boxplot(vitesse)

185
1500 1400 1300

180

175
1200 1100 1000 900

170

165

160
800 700 1

155 1

boxplot(poids)

boxplot(largeur) le moustaches est symétriques

Il ya une valeur "atypiques", c'est-à-dire une valeur extrêmement différentes des autres et on remarque un plus rouge dans boîte à moustache de cylindre Dans ce cas on peut supprimer cette valeur Calcul des indices d’asymétrie et d’aplatissement Le récapitulatif des résultats obtenus: Cylindre Asymétrie Aplatissement 0.4632 2.5135 Vitesse -0.0394 2.4670 Poids -0.0958 1.7753 Largeur -0.1179 2.3667

5

3. Régression linéaire Calcule des covariances >> cov(donnee) ans = 1.0e+005 * 2.7869 0.0923 1.1002 0.0286 0.0923 0.0064 0.0285 0.0007 1.1002 0.0285 0.5303 0.0139 0.0286 0.0007 0.0139 0.0006 >> corrcoef(donnee) ans = 1.0000 0.6933 0.9049 0.7091 0.6933 1.0000 0.4914 0.3632 0.9049 0.4914 1.0000 0.7909 0.7091 0.3632 0.7909 1.0000 Il y'a une symétrie par rapport à la diagonal, et la valeur 1 est normal car une variable corrélée à ellemême donne, et cov(X,X)=var(X) Si on a une valeur proche de 1 c-a-d il ya une corrélation fort On remarque que le poids et la cylindrée sont plutôt des variables fortement corrélées Coefficients de détermination de variables x=corrcoef(donnee) >> x.^x ans = 1.0000 0.7757 0.9136 0.7837 0.7757 1.0000 0.7053 0.6922 0.9136 0.7053 1.0000 0.8307 0.7837 0.6922 0.8307 1.0000 On voit une forte corrélation entre le poids et la cylindrée, ainsi qu’une faible corrélation entre la largeur et la vitesse.

6

Donner les diagrammes de dispersion de deux variables fortement corrélée entre cylindre et le poids

Le diagramme de dispersion de deux variables moyennement corrélée (entre largeur et poids)
185

180 Honda Civic Renault 19 Fiat Tipo Peugeot 405 Renault 21 Citroën BX BMW 530i Rover 827i Renault 25 Opel Omega Peugeot 405 Break Ford Sierra BMW 325iX Audi 90 Quattro Ford Scorpio Renault Espace Nissan Vanette VW Caravelle Ford Fiesta Fiat Uno Peugeot 205 Peugeot 205 Rallye Seat Ibiza I Citroën AX Sport 700 800 900 1000 1100 poids 1200 1300 1400 1500 1600

175

largeur

170

165

160

155

7

Le diagramme de Dispersion faiblement corrélée entre vitesse et largeur :

185 Honda Civic Renault 19 Fiat Tipo Peugeot 405 Renault 21 Citroën BX BMW 530i Rover 827i Renault 25 Opel Omega Peugeot 405 Break Ford Sierra BMW 325iX Audi 90 Quattro Ford Scorpio Renault Espace Nissan Vanette VW Caravelle Ford Fiesta Fiat Uno Peugeot 205 Peugeot 205 Rallye Seat Ibiza I Citroën AX Sport

180

175

largeur

170

165

160

155 130

140

150

160

170

180 vitesse

190

200

210

220

230

Faire une régression linéaire des deux variables les plus fortement corrélées :

polyfit(poids, cylindree, 1) : Détermination des coefficients de la droite polyfit(poids, cylindre, 1) ans = 2.0744 -398.2186 lsline : Tracé de la droite des moindres carrées
3000 2800 2600 2400 2200

cylindre

2000 1800 1600 1400 1200 1000

700

800

900

1000

1100 1200 poids

1300

1400

1500

1600

8