Professional Documents
Culture Documents
Ludovic Billot
Encadr par
1. Les donnes On va saisir une table qui fournit les caractristiques de cylindre, de vitesse, de poids et de largeur de 24 modles de voiture.
modele
modele={'Honda Civic';'Renault 19';'Fiat Tipo';'Peugeot 405';'Renault 21';'Citron BX';'BMW 530i';'Rover 827i';'Renault 25';'Opel Omega';'Peugeot 405 Break';'Ford Sierra';'BMW 325iX';'Audi 90 Quattro';'Ford Scorpio';'Renault Espace';'Nissan Vanette';'VW Caravelle';'Ford Fiesta';'Fiat Uno';'Peugeot 205';'Peugeot 205 Rallye';'Seat Ibiza I';'Citron AX Sport'} cylindre=[1396;1721;1580;1769;2068;1769;2986;2675;2548;1998;1905;1993;2494;1994;293 3;1995;1952;2109;1117;1116;1580;1294;1461;1294] vitesse=[174;180;170;180;180;182;226;222;226;190;194;185;208;214;200;177;144;149;135;1 45;159;189;181;184] >>Poids=[850;965;970;1080;1135;1060;1510;1365;1350;1255;1120;1190;1300;1220;1345;12 65;1430;1320;810;780;880;805;925;730] largeur=[166;169;170;169;170;168;175;175;180;177;171;172;164;169;176;177;169;184;162; 155;156;157;161;160]
2. Statistique descriptive commande mean >> moyenne=mean(donnee) moyenne = 1.0e+003 * 1.9061 0.1831 1.1108 0.1688 std >> ecarttype=std(donnee) ecarttype = 527.9087 25.2154 230.2912 7.6537 >> mediane=median(donnee) mediane = 1.0e+003 * 1.9285 0.1815 1.1275 0.1690 >> quantile50=quantile(donnee,0.50) quantile50 = 1.0e+003 * 1.9285 0.1815 1.1275 0.1690 >> interquartile=iqr(donnee) interquartile = 568.0000 25.0000 407.5000 12.0000
description M = moyenne (A) renvoie les valeurs moyennes des lments le long de diffrentes dimensions d'un tableau. (pour que la valeur soit plus explicite on multiplier 1.0e+003 * 1.9061 )
median
median(donnee)renvoie les valeurs mdianes des lments le long de diffrentes dimensions d'un tableau. Qui permet de partager chaque tableau en deux parties
quantile
iqr
1) La reprsentation par histogramme La premire opration est de dterminer le nombre de classes de lhistogramme.
hist(cylindre,k)
hist(poids,k)
hist(largeur,k)
Une reprsentation par box-plot La distribution est dcompose en 4 zones de mme effectif 25%, (la mdiane est en rouge)
230 220 210 200 190 180 170 160 150 140
3000 2800 2600 2400 2200 2000 1800 1600 1400 1200 1
boxplot(cylindre) le quart des voitures de cylindre faible est moins que le dernier quart
boxplot(vitesse)
185
1500 1400 1300
180
175
1200 1100 1000 900
170
165
160
800 700 1
155 1
boxplot(poids)
Il ya une valeur "atypiques", c'est--dire une valeur extrmement diffrentes des autres et on remarque un plus rouge dans bote moustache de cylindre Dans ce cas on peut supprimer cette valeur Calcul des indices dasymtrie et daplatissement Le rcapitulatif des rsultats obtenus: Cylindre Asymtrie Aplatissement 0.4632 2.5135 Vitesse -0.0394 2.4670 Poids -0.0958 1.7753 Largeur -0.1179 2.3667
3. Rgression linaire Calcule des covariances >> cov(donnee) ans = 1.0e+005 * 2.7869 0.0923 1.1002 0.0286 0.0923 0.0064 0.0285 0.0007 1.1002 0.0285 0.5303 0.0139 0.0286 0.0007 0.0139 0.0006 >> corrcoef(donnee) ans = 1.0000 0.6933 0.9049 0.7091 0.6933 1.0000 0.4914 0.3632 0.9049 0.4914 1.0000 0.7909 0.7091 0.3632 0.7909 1.0000 Il y'a une symtrie par rapport la diagonal, et la valeur 1 est normal car une variable corrle ellemme donne, et cov(X,X)=var(X) Si on a une valeur proche de 1 c-a-d il ya une corrlation fort On remarque que le poids et la cylindre sont plutt des variables fortement corrles Coefficients de dtermination de variables x=corrcoef(donnee) >> x.^x ans = 1.0000 0.7757 0.9136 0.7837 0.7757 1.0000 0.7053 0.6922 0.9136 0.7053 1.0000 0.8307 0.7837 0.6922 0.8307 1.0000 On voit une forte corrlation entre le poids et la cylindre, ainsi quune faible corrlation entre la largeur et la vitesse.
Donner les diagrammes de dispersion de deux variables fortement corrle entre cylindre et le poids
180 Honda Civic Renault 19 Fiat Tipo Peugeot 405 Renault 21 Citron BX BMW 530i Rover 827i Renault 25 Opel Omega Peugeot 405 Break Ford Sierra BMW 325iX Audi 90 Quattro Ford Scorpio Renault Espace Nissan Vanette VW Caravelle Ford Fiesta Fiat Uno Peugeot 205 Peugeot 205 Rallye Seat Ibiza I Citron AX Sport 700 800 900 1000 1100 poids 1200 1300 1400 1500 1600
175
largeur
170
165
160
155
185 Honda Civic Renault 19 Fiat Tipo Peugeot 405 Renault 21 Citron BX BMW 530i Rover 827i Renault 25 Opel Omega Peugeot 405 Break Ford Sierra BMW 325iX Audi 90 Quattro Ford Scorpio Renault Espace Nissan Vanette VW Caravelle Ford Fiesta Fiat Uno Peugeot 205 Peugeot 205 Rallye Seat Ibiza I Citron AX Sport
180
175
largeur
170
165
160
155 130
140
150
160
170
180 vitesse
190
200
210
220
230
Faire une rgression linaire des deux variables les plus fortement corrles :
polyfit(poids, cylindree, 1) : Dtermination des coefficients de la droite polyfit(poids, cylindre, 1) ans = 2.0744 -398.2186 lsline : Trac de la droite des moindres carres
3000 2800 2600 2400 2200
cylindre
700
800
900
1000
1300
1400
1500
1600