You are on page 1of 117
UNIVERSITE DE LILLE III PREMIERE ANNEE - HISTOIRE TELE-ENSEIGNEMENT per Aziz EL KaciMi ELEMENTS DE STATISTIQUE DESCRIPTIVE Publié comme livre en version bilingue (Frangais et Arabe) aux Editions Maghrébines collection Arabisation et connaissances ANNEE UNIVERSITAIRE 1983-1984 AVANT-PROPOS Beaucoup de disciplines scientifiques, expérimentales (chimie, physique, biologie, médecine etc.) ou humaines (sociologie, économie, histoire, géographie etc.) ont de plus en plus besoin des méthodes statistiques et ne sauraient s’en passer la plupart du temps. Pas mal d’hypoth®ses scientifiques trouvent leurs origines dans des études statistiques et ceci motive fortement la mise en ceuvre de leur vérification. Un cours de géographie ou d’histoire quantitative a besoin d’étre épaulé par un cours de statistiques (étude de la démographie, de la répartition des richesses, de l’évolution des prix & une certaine époque etc.). Ce cours se veut dans ce sens ; il constitue, sans prétention aucune, une introduction aux méthodes élémentaires de la statistique descriptive. J'ai essayé de multiplier les exemples et les exercices et d’en donner une solution détaillée (pour certains d’entre eux). J’espére qu'il pourra rendre service aux étdudiants des filitres susmentionnées. Toute critique portant aussi bien sur le contenu que sur la forme sera la bienvenue ! Lille, Avril 1984 Aziz EL Kacimt CONTENU CHAPITRE | 1 - Définitions 2- Séries classées' |. 3 - Représentations sraphig 4 Fréquence 5 - Exercices .. 6 - Effectifs et fréquences cumulés CHAPITRE Il Valeurs moyennes 1- Médiane 2 Moyenne 3 - Exercices « CHAPITRE III Paramatres de dispersion 1- Variance . 2- Beart-type . 3 - Exercice résolu - CHAPITRE IV Indices 1- Indices élémentaires .. 2- Indices du cottt de la vie 3 - Exercice résolu ....... CHAPITRE V Concentration 1 - Géméralités ............-.000-- 2- Fonction et courbe de concentration 3 - Exemples . CHAPITRE VI Séries doubles, ajustement et corrélation 1- Séries doubles .... 2- Moyennes marginales . 3- Ajustement « 4-Exemple . : 5 - Exercice résolu... CHAPITRE VII Séries chronologiques 1- Généralités . 2- Analyse 3 - Exercice CHAPITRE VI Exercices résolus Rolo CHAPLURH T GENERALITES SUR LES SERIES STATISYIQUES I-DEFINITIONS Toute étude statistique suppose 1a donnée d'une population. Par exemple : = La population de la France, = Liensemble des éléves d'un lycée, - Une colonnie de micro-organismes. Les élements de cette population sont appelés individus, Toute propriété des individus de cette population est appelée caractére. Un caractére peut @tre : ~ Qualitatif (couleur, sexe,...) ~ Quantitatif (Age,Taille,...). Une étude statistique est en fait 1'étude d'un caracttre de 1a popula- tion considerée,Souvent le nombre d'individus est trés grand voire méme Anfini,Ceci complique 1'étude.Pour ce faire on se restreint & une partie S de cette population qu'on appelle échantillon et qu'on suppose assez representatif, Dens 1a suite on supposera que le caractére est quantitatif.on a alors la: I,I-Definition : Une série statistique est une correspondance qui & chaque individu &ssocie une valeur de son caractére. Exemple: Soit P 1a population de 1a France,La correspondance qui & chaque habitant associe son revenu definit une série statistique. Une série statistique est souvent representée par un tableau + Individus %, Vali du PAC a a 7 ffectifs total et partiel Le nombre d'individus d'un échantillon est appelé effectif total. “Le nombre d'apparitions d'une valeur du caractére est appelé effectit partiel de cette valeur. Si on note x,,+++,%, les valeurs du caractére d'une série statistique avec les effectifs partiels respectifs n,,+...n, ,on peut representer cette série par un tableau du type suivant: Valeurs or x, Effectifs partiels Ry ny Ke Evidemment toutes ces séries statistiques peuvent @tre representées graphiquement.Nous allons donner britvement les representations graphiques les plus utilsées.Nous nous limiterons & le faire sur des exemples. 1,3,Representations graphiques. I.3,I.Diagramme on batons. La serie statistique stiivante donne le nombre dtenfants par ménage dans un échentillon de 262 ménages Se Ee 0 enfants . 52 ménages Ie . 80 2 - . 60 = 3 . 4 e 4 - Is - 5 oe 16 - 6 - eeeeee seseeeel4 = 7 - . seeneeeT2 = 8 6 | La courbe obtenue en joignant par des segments de droite les extré- | mités des batons est appelée le polygéne des effectifs. Diagpanme & secteursiOn construit un cerele et on partage le disque | antérieur en secteurs dont les aires sont proportionnelles aux effecti?s partiels. Si on reprend le série statistique précédente on obtient le diagramme suivant + Fig 1.2, Les séries statistiques que l'on vient de considerer sont dites & valeurs isolées.Elles sont utili: nombre des valeurs du caractire n'est pas grand.Dans le cas contraire on introduit un autre type de series statistiques : SERIES CLASSERS. Commengons par un exemple-Supposons que 1'on vouille étudier le distribution des salaires mensuels de I00 emploxés d'une grande entreprise.Le nombre étant relativement grand,on ne considerera pas chaque salaire isolément mais on constituera des intervalles de variation des selaires qu'on appelera des classes et qu'on pourra representer de le fagon suivante : Clasoes de j 1 salaires(en NF) |3500 & 4500 | 4500 & 5500 | 5500 & 8000 | plus de 8600 t—- t Befectifs \ i | partiels 48 | 21 | IT | 8 20 Dine manidre générale une série statistique clessée peut se representer & l'aide d'un tableau du type suivant (qui est le méme d'ailleurs que le-tableau 2.1 ) : ciasses | (x,, x{-[x,, el ihe earl Bffectits partiels 22 Ltintervalle [x,, x,. et ouvert & droite est appelé classe et le nombre n, correspondant jq[t'on prenara générelonent térné & gauche (voir tableau 2.2 ) est l'effec#if de cette classe, Les nombres + eneriry iar aar 74 et e 2 sont appelés respectivement 1'étendue et le centre de 1a classe(x, , x, ,7|+ \ une série classée est naturellement associée une série & valeurs 4solées qui est la série des centres des differentes classes.Ainsi le série des centres associée & 2.1 est donnée par le tableau suivant : Centres des classes 4000 5000 6750 9250 Effectifs 48 ar 7 8 Remargue : La dernibre classe de cet exemple n'a pas a étendue.On convient généralenent de prendre comme. étendue celle de la classe qui précbde. Ii arrive aussi que 1a premitre classe considérée n'ait pas d'étendue, Dans ce cas on prendre celle de le classe qui suit. on verra que 1a série des centres d'une série classée est largement utilieée dans 1a pratique. 3-DIFFERENTES REPRESENTATIONS GRAPHIQUES D'UNE SERIE CLASSEE Consiatrons une série classée dont les classes sont [ xj, X4,7[ et Les effectifs partiels nj od 1'indice i varie de Ia ks 3.T-Diagranne en escalier.0n trace un repbre dont 1"axe des abscisses represente les classes et l'axe des ordomées les effectifs partiels. Classes x, x, Xz reves Xe gat 3.2rHistogranme des effectifs.On considdre toujours un repére et on trace des rectengles qui ont comme largeur 1'étendue de 1a classe mesurée sur L'axe des abscisses et dont les aires sont proportionnelles aux effectifs partiels, Representons par exemple 1a serie classée 2.1 par un histogramne des effectifs : Fig 3.2 classes IE: 050 Important :Les hauteurs des differents rectangles ne sont pas proportionn- NAA 3500 4500 5500 ‘000 elles aux effectifs partiels (sauf si les classes ont la méme étendue)mais les aires doivent 1'@tre, Regardons par exemple comment on a construit les rectangles de 1'histogra- nme ci-dessus. Les 2 premitres classes ont la méme étendue,donc dire que les air sont proportiomnelles revient & dire que les hauteurs le sont.0n peut done choieir 48 mm pour la hauteur du I°" rectangle et 27 mm pour le second.Four 1e 3°™* on novers H sa hauteur.On a alors les relations de proportionnalité 48 . Tooo H . 2500 48 IT Dtoli l'on tire : He 6,8 m On fera 1a méme chose pour constuire le dernier reotangle en comparant son aire A celle du 2°"° par exemple. 2,3-Pyramide des Ages.C'est une representation qui est souvent utilisée pour ullistrer 1a xépartition des ages d'ume population suivant le sexe.Blle se presente us la forme suivante + Ages peer Sexe masculin KZA. KLEE LLNS} Pig 3.3 Bffectifs Effectifs 4-FREQUENCE, 4,1-Série A valeurs isolées .Soit 1a série & valeurs isolées: od ny y My, s++ 4 My sont les effectifs particis respectivenont des valeus Xj) Xp reer Me On appelle fréquence de lave] x, ple nombre £, defini par 1'égalité: est leffectif totol. % Mer! ose Be une afrée classée.0n definit de 1a méme manitre 1a fréquence de 1a classe Tquton note a tégalité + ; [x axyyz[auton note aussi t, par 1'égalite 1 ‘ On verifie aisement aussi bien pour ume série A valeurs isolées que pour une série classée que 1a somme des fréquences est toujours égale & I, En effet on a: tpt igh te n, ates N he On peut aussi obtenir une distribution des frequences de 1a méne manigre qu'on a.une distribution des effectifs.0n la represente par un tableau : ciesses | [xy wee | Lape Ree f Frequences auquel on peut associer un diagramme en escalier et un histogremme des tréquences. Reprenons le tableau 2,1 mais en considbrant cetteifois-ci 1e distribution des frequences.0n obtient slors + Clesses de salaires(en NF) | 3500 & 4500 | 4500 & 5500 |5500 & 8000 | plus de 8000) Fréquences 0,48 0,27 0,17 9,08 5-BKERCICES. 5.I-Exercice resolu.Le tableau suivant’ donne le produit national brut par habitant de 50 pays africains (tiré de "Dossiers et Documents Le Monde" He TO8 Gu mois de Fev 1984) + PNB par habitant(en dollars) Nombre de pays (Bffectits) Woins de 1000 39 000 & 2000 ? 2000 & 3000 2 3000 & 4000 2 Tab 5.2 ° Les PNB a 3 pays ne sont pas comptés : Celui de la Iibye qui est de 8640 dollars et ceux de la Guinée Aquatoriale et de 1a Somalie qui ne sont pas connus. a)Donner la distribution des fréquences. d)fracer l'histogramme des fréquences associé, Solutions a)Par definition la fréquence d'ume classe est égale au rapport de Lieffectif partiel de cette classe & l'effectif total.On caleule succe- ssivement ces rapports et on obtient le tableau ¢ Tad 5.2 PNB par habitant(en dollars) Fréquences Moins de 1000 33 20,78 50 1000 & 2000 +e 0,4 3000 2000 & 3000 & 4000 =1- b)Toutes les classes de cette série ont 1a méme étendue et par consé- quent on peut choisir les hauteurs des differents rectangles de 1'histo- gramme des fréquences proportionnelles aux frequences.0n choisira I mm | comme unité representant une fréquence de 0,0I.Ceci nous donne le diag- ramme + Fréquence Fig 5.1 0,78 NUQAAT ear vy 0 1000 2000 3000 4000 .2-Exercices suppl émentaires. 5.2,T-Soit la série des nombres : I0,10,11,13,13,13,17;20,25,26,33,33,33,33,46,53,56,595 a)Mettre cette série sous forme d'une série classée dont les classes ont une étendue égale A I0. b)Donner 1a distribution des effectifs et tracer 1thistogpanme associé, ¢)Donner 1a distribution des frequences et tracer 1'histogramne associé. -II- 5.5.2-Le tableau suivant domne la repartion.de 1a population immigrée en Prance (aux alentours de l'année 1974 )tiré de "Les immigrés" CEDETIM Age Hommes $ Fenmes é moins de 19 366840 22,66 344330 32,92 De Oa 64 1105760 68,32 555120 53,08 65 et plud 145740 9,02 146220 13,98 Tab 5.3 Tracer la pyramide des Ages associée & cette statistique et inter- preter les resultats. EFFECTIFS BT FREQUENCES CUMULES. Soit x; 5 «++ » %, wne série & valeurs isolées telle que xp effectifs partiels tous égaux & I. Ntimporte quelle série statistique & veleurs isolées du type (I) se rambrie A une série du type x, ¢ xp¢ <% avec des effectifs partiels tous égauxa I. Dans ce cas la Médiane sera par definition la valeur qui partage la série en 2 séries qui ont le méme effectif total.Suivant que x est un nombre pair ou impair on va calculer explicitement 1a médiane. i) kK impair ive, stéorit gomie suit: k= 2r~I .La série se met alors sous la forme Xz seere% pg 1X eX yy ee Xo la médiane eS? alors le nombre M = x,, + ii)k paiz.on peut 1'écrire sous 1a forme k = 2r .0n écrit alors la série ‘ppt Dans ce cas pour la médiane on prend généralement = —2—E a LL.I-Bxemples. | A)Soit 1a série 23,23,34,45 5454454474747 168,68 Elle a II = 6,2- I termes.Par consequent sa médiane est égale PM Serme ceded Mm 456 | | au 6 | si)Soit Ja shrie 47,47,56,59 ,68,20,87,87-Elle a 6 = 2:4 termes, Sa médiane est done Ml ye = 63,5. 1,2-Cas atune serie classée.Commengons par regarder les calculs sur un exemple.Soit 1e série classée donnée par le tries cisvant t Classes Bffectifs partiels To & 20 2 20 & 30 r 30 & 40 5 40 a 50 2 Tab J.D Dang ce cas ott toutes les classes ont la méme étendue on peut determiner 1a médiane graphiquement.Pour ce, donnons .d'abord 1a distribution des offectits cumlés de cette série + Classes Bffectifs cumiés Io & 20 2 20 & 30 3 0 30 & 40 8 : 40 & 50 To gab T.? et tragons 1'histogramme ~16- Effectifs Fig Ir cml és . Nel0--—--+ -—-~ ————~ 10 20 20 ait eto) 50 Classes tes deux I°T°Sne donnent pas la moitié de l'effectif total et les 3 1°75 donnent un effectif superieur A cette moitié.La médiane est done dans 1a classe {30 , 40[° Pour 1a determiner on procéde par interpo- lation proportionnelle.Ceci suppose que 1a distribution des valeurs de 1a série dans 1a ctasse {30 , 40[ est uniforme (cer a priori i1 nty @ aucune raison pour qu'il y alt plud de valeurs proches de 30 que de 40). Les triangles OAB et 0'A"B! sont semblables.Iis ont dono leurs edtés homologues proportionnels.Ceci nous donne + eS clest-a-dire A= 0A" AR, oat A‘Br AtBt Diautre part OA' = 10 , AB= 5-352 et AIBt=B-3=5. En remplagant les differentes expressions par leurs valeurs respectives on obtient OA = 4 et done M= 30+ 4" 34. -IT- Si l'histogranme des effectifs cumulés est tracé d'une maniére precise on determine la médiane en lisant directement l'abscisse du point B dont ltordonnée est égele & 1/2. Dans le cas général d'une série statistique on supposera que les étendues sont toutes égales. Bffectits cumulés Pig 1.2 A-T 441 *a2 -I8- Comme précédenment on artégarité; OL = AB, Oat ANB? Dtoi 1ton deduit OA.= OA". AE:y .Diautre part on a°; Oat = et AB = N/2 ~ N,_ ‘4-r¢ = X47 %, 7) AIBN, = on obtient finalement oa = e,. 3/2 ~ My; (1.1) Remarque : On peut montrer facilement que cette formile donnant la médiane reste valable lorsque les étendues ne sont pas égales.Par contre la determination pranhique directe ne (test plus.Bn effet ler hauteurs n'étant plus proportionnelles aux effectifs cumulés on ne peut plus repérer N/2, 1.3-Quantiles.0n a va que la médiane est une valeur qui partage le série en 2 séries qui ont le méme effectif.De 1a méme fagon on défi- nit les quartiles Q, , Q, » Q, comme étant les valeurs qui partagent la série en 4 parties qui ont toutes le méme effectif.Ainsi soit la série + yr < HC seg avec des effectifs partiels tous égaux a I (on a wu au II quion peut toujours se ramener & ce cas pour une série & valeurs isolées bien-sir).0n a alors : Bien-sfr Q> ntest rien dtautre que 1a médiane.Q, et Q, sont appelés ~I9- le premier et le troisitme quartiles.Le nombre Q, - Qy est Ltinter- quartile.I1 donne une idée de 1a fagon dont 1a série est ételée autour de la médiane, Les deciles Q, , sont des valeurs qui partagent 1a série 9 en 10 parties qui ont toutes le méne effectif.Le nombre Q, - Qz est Liintertestie et joue le méme réle quel tinterquartil >. De mani’re analogue on definit les quantiles d'ordre p comme Gtant les valeurs Oy y+++, Q,, qui divisent 1a série en p parties ayant toutes le méme effectif. Pour determiner graphiquement les quantiles d'ordre p d'une série classée (ayant des classes de mme étendue)on proctde de 1a méme fagon que pour 1a mediane mais en choisissant lee points atordonnées 2 on pourra & titre d'exercice celowler le 1°? et 2e J quartite la série 2.1 du chap I, 2-MOYENNE.Un étudiant passe un examen en 5 matibres et obtient les notes suivantes : os) 3 coefficients 2 2 u 2 Pour savoir son niveau il calewle $videmmens 12 "mcyenne" de Bes note! x x Ze 42013 +1612 + 3-17 + 2.9,5 TO,4. De 3 On peut interpreter ces notes comme @tant Ja série statistique & valeu- rs isolées 7,13, 12,12 , 9,5 (valeurs) els) 2, 2,°1, 3 , 2 (effectits par A laquelle on attache La valeur 10,4 et qui permet de dire si cet étudiant est ou non recu A son examen, Ceci se généralise au cas d'ume série statistique A valeurs isoldées quelconque, on appelle moyenne arithmétique de cette +e (@2 ge sttr* est Nu lieffectif total de la série, Avant de passer au cas d'une série classée on va donner quelques propriétés de la moyenne arithn&tique. 7 —Considérons une serie X obtient une nouvelle série Y en ajoutent & chaque terme de X 1a constante a,clest & dire jue ¥ lonnée per 3 y= Vek ph Be a est donnée per : YyrKyt Bo pera, emt 8 ™ ™ ~2I- Par definition la moyenne arithmétique de ¥ est le nombre : ny(xyte) + eee + my (m ta) N En developpant on obtient: (agg mya) tone + Cit 18) ¥ ee x xyt vee 7 (22) ¢ 2 We See Bea. N N La moyenne de la série Y est donc obtenue en ajoutant le constante a A celle de la série K, on peut remarquer que la moyenne dtune série dont toutes les valeurs sont égeles A une méme constante est elle aussi égale A cette constante,La verification est immediate et est laissée eu lecteur comme exercice. —Soient K et ¥ deux séries : x Tyree Ty * dont les valeurs respectives ont les mémes effe- Mae ctifs partiels.on note Z = X+¥ la somme de ces deux séries c'est A dire la série dont les termes sont les sommes respectives des termes de X et Y. on peut 1'écrire done : Caleulons sa moyenne arithmé@tique. =22- n(x, + ¥y) + eet a(x + HD " W on developpe Cage toe Dp Cay ee + W N = ctest-A-dire : La moyenne arithmétique de deux séries ayant les mémes effectifs part- dele est dgale & la somme des moyennes des deux séries. ~Considbrens toujours une serie X x, 5 +++» X, ot miltiplions sere By toutes ses valeurs par une méme constante a.Calewlons ia moyenne arith- n metique de cette s@rie.On a en notant P cette moyenne : ny (exp) + eee + 8 (ax,) N on met a en facteur commun et on obtient: (2.4) Be ‘i * 2 Bek ¥ Si on miltiplie toutes les valeurs d'une série par une méme constante la moyemne de la série est aussi mal ipliée par cette constante pour donner 18 moyenne de 1a nouvelle série obtenue. En raison de la commutativité de 1'addition des nombres reels le moyenne arithmétique d'une série ne dépend pas de l'ordre dans lequel on éorit ses termes, -23- Moyenne arithnetique d'une série classée, Pour une série classée on définit sa moyenne comme étant celle de la série des centres essociée.Plus précisement soit [xzyXof vee [He%yr! np tee et notons le centre de 1a classe [ Fiat! von obt- dent ainsi la série A valeurs isolées : Par définition on pose : RyCyt vee + Moy (2.5) = avec Ne nyt seem, « Exempli Le tableau suivant donne une estimation de la population de 27 pays européens + Population Nombre de pays (en millions) * Woins de 5 7 5 & 0 joa 15 e 5k 2 : a a a - 25 A 40 : 40 a 55 t 55 a 70 es Tab 2,7 -24- Cette statistique est tirée de"Dossiers et Documents Le Monde" N° 108 du mois de Fev 1984). La population de 1'URSS n'est pas comptée dans le tableau,Elle est de 270 millions.La compter nous oblige’ introduire une classe d'une grande éten~ due relativement aux autres alors que ce niest vraiment vas nécessaire pour comprendre 1a méthode de calcul, Calculons 1a série des centres.0n obtient alors la série & valeurs isolées : 2,5 7,5. 12,5 17,5 22,5 32,5 47,5 62,5 (valeurs) ig ge ee (effectifs) En utilisant le formile (2.1) et on designant par B 1a population moyenne on aura: Bo Te2s5 + THT)5 + 3612,5 + 2677,5 +2422,5 + 2032,5 41.47, 543. 62,5, 27 ceci donne P= 3g,06 Millions ha. Le calcul de la moyenne arithnétique risque quelquefois d'étre un pew lourd quand on le fait A la main,Pour ce on’le ramine & celui d'une série nlus simple en effectuant un changement de variable. Soit x, x, wie série & valeurs 1425 et posons pour tout ol x, et e sont des nombres reels queleonques mais @ non uul.Geei nous donne une nouvelle série 2 2, set «DE manthve équivalente ona: x, = e@.2,+%, « 2 1 i * %o On peut done considerer la série X comme 1a somme de 2 séries qui sont : Ba serie ¥ O%, et 18 sénte dont tone Len tomes sont égaux & x, .Cette dernitre a pour moyenne arithmétique x,.Pour Y on applique la formile (2.4) et on obtient ¥ = e,%.D'ol finalement : =25- (2.6) B= eke x, a ° Comme exemple dtapplication on prend X = P (Tab 2.1). on applique done ce changement de variable A 1a série du Tab 22T en prenant x, = 22,5 et ¢= 5 par exenple .La série que l'on obtient sera -4 -3 -2 -IT 0 2 5 8 (valeurs) 7° 7 +3 2 2 2 1 3. (etfectizs) Gette série est obtenue on retranchant 22,5 a tous les termes de la séric 2,5 7,5 12,5. 17,5 22,5 32,5 47,5 62,5 et en divisant ensuite per 5.La forme (2.6) étant vraie pour tout x, et tout e non nul évidenment ces deux valeurs de fagon & simplifier au maximum on choi: le série. La nouvelle série obtenue.a done pour moyenne = = Tiled) 470 (03) 430 (22), #20 (nL) 4200 4202 41.5 4348. o 99 27 Drow 5.(-0,89) + 22,5 = 18,06 .On retrouve ainsi le resultat obtenu par la méthode directe, Autre expression de la moyenne arithmétique, Soit X une série statistique a val isolé z wee eurs isolées peers Byyeee My On Sait que la moyenne arithmetique de cette série s ow encore : + (27) =26- AUTRES MOYENNES.J1 existe d'autres moyennes que le moyenne arithmétique et qui sont d'un usage en statistiques, Donnons briévenent 1a definition e quelques-unes dtentre elles: =Moyenne gbombtique. Séit x, , ++. , %, une série statistique & 3% par definition 1a moyenne géométrique de cette série est le nombre : valeurs isolées. "Trt (2.8) (on suppose x, positif pour tout i) Par exemple 1a moyenne géométrique de le série 3 Tt I2 (valeurs) 2 IT 3. (effectits) est donnée par : C/2 at ap . o V3*.mt12? = qrto72 = 7,45 Pour calouler 1a moyenne géonbtrique 11 est souvent plus commode de calculer LogG.Plus précisement on a : Lont = Loge =~ + (2,9) Par exemple pour la série ci-dessus on 2 : Log} +I,Logii + 3-Logt2 2,,0986 + I.2,3978 43.2,4849 _— 7? = 2,082, En cherchant le nombre reel G dont le logarithme neperien vaut 2,0082 on trouve G = 7,4505.Ce qui correspond auresultat par le calcul direct. Ltavantage de passer & une série de logarithmes est évidemment de ramener -2T- Le calcul d'une moyenne géorbtrique 2 celui d'une moyenne arithmetique. -Voyenne_harmonique.0n se domne toujours une série : Rye Bee La moyenne harmonique de cette série est le nombre H éefini par la rela- tion + : (2.10) on suppose bien-sfir que x, est non nul pour tout i = Tyeveyk Le nombre H ntest pas défini d'une manibre explicite;il est préférable ae calculer atabord le membre de droite.Par exemple pour la série : 3 IZ 12 (valeurs) 2 I 3 (effectifs) ~28et L 13 132 132 yelest-2-dire H= 5,954. 133 Evidenment dans le cas dtune série. clessée la moyenne géométrique et 1a moyenne harmonique sont celles de 1 série des centres associée. 3-MODE.On appelle mode d'une série statistique & valeurs isolées ov classe modale dans le cas dtune série classée,la valeur de 1s série,ou la classe,qui a le plus grand effectif. Par exemple le mode de la série : 3334 12 13 13 13 est 1a valeur 3 ow 13. Cet exemple montre que certaines séries nenvent svoir plusieurs modes ow plusieurs classes modales si 1a série est classée. ~28- EXERCICES | T) Soit 1a série A valeurs isolées x, , x, (valeurs) x; et x, positifs, I I (effectifs) . on designe part, ¢ , H respectivement les moyennes arithmétique,géome= trique et harmonique, Demontrer la double inégalité + Heogk a On considére 1a statistique suivante : | In) | Tab 2.2 Tealettre cette série sous forme d'une série classée dont les classes ont une étendue yale & IO. 2°-Construire 1'histogramme des effectifs cumulés + 3e-Calculer 1a médiane de cette série statistique.Calculer le 1° et 163 °° quartiles. 4°-Calouler la moyenne arithnétique de cette série en effectuant un changement de variable (Prendre x,«155 et © = 10). III) Bracer 1'histogramme des effectifs de 1a série + i Classes {10 , 20f {2 , 40f [40 , 70l Bffectifs 6 20 15 partiels Expliquer comment vous faites le construction des différents rectangles. SOLUTIONS I) Si x, = x, = 2 on @ imnediatenent + eae — pment eee cin eee eee ee tet 2 2 | ~ 2 ~ a ce qui donne Haas. Dod: R=G=H. Supposons x, et x, @istincts . Pour comparer 2 réels positifs il suffit de comparer leurs carrés,0n a suceessivement : (x + x)? eee , Ea etde —=— +— on tire 4 Hox . (x, + x5)? = 4x, xt %2 12 Calculons = 4% = 2,2 2,2 7 (ap + x5 + 2yXy) - AxpXy XI + Xp - 2xp%p 7 z ~30- Cette dermitre quantité est toujours positive car efest un carré.0n en aeauit ¥% 6? > 0 et done F>G. C.Q.F.D. Calculons maintenant la difference : Hy (ept%y)? = docks’ 2urleae| Oxy x)" He viv on met x,x, en facteur au numérateur;on obtient 2 2 ( (pty) "= 44%) re ae oe + (x, 4x,)? Ceci montre que G°- x est toujours positif et done G > H. C.Q.F.D. II) T8-On remarque que les valeurs de cette série sont comprises entre 130 et 180.Nous a@llons done constituer les classes de la fagon suivante : Classes Bffectits partiels Tab 2.4 Tl y a5 classes dtétenduo égale & I0. ~3I- 2°-0n caloule dtabord les effectifs cumlés des differentes classes.0n & le tableau suivant ; Classes Effectifs cumlés (130 , 140 6 [x40 , 150 [ a {150 , x60f 39 {x60 , z70f 46 [x70 , zeol 50 Tab 2.5 on trace 1'histogramme correspondant en choisissant les hauteurs des rectangles proportionnelles aux effectifs cunulés puisque on est dens le cas of les classes ont la méme étendue : Bagaceat® Classes “326 je-11 ffectif total de cette série estégal & 50.La mo: i de lleffectis N/? = 25 est dans 1'itervalle associ fe Alaclasse [150 , 160 .Pour calculer 1a médiane ean I,°: 150 a) 160 ona ctest a dire N= 150 Diol on deduit + 760-150 150 + gh = 150 + 2,22 = 152,22. Pour calouler le 1°* et 1e 3°" quartiles Q, et Q, on considére le I/4 et les 3/4 de 1effectif total qui sont respectivene N/4 = 12,5 et 31/4 = 37,5.Paisons 1e calcul par exemple de Q, (celui de Q, se fait dtune man: Bre analogue) : Te nombre 3N/4 est dans 1"intervalle de 1a clesse [150 , r6o[ . En procédant comme pour Ia médiane on obtient (voir Fig 2.2) OA ANB cucot 3 aire Ghoae = tie eis Teo- 150 ~ 39 = ar Ce qui donne Q, = 150 + 10,16,5 = 159,16 . Faire attention pour le céleul de Q, car N/4 = 12,5 est dans 1'intervalle assacié & 1a classe [140 , 150 [ ~33- 42-La série des centres est 1a série a valeurs isolées : 135 145 155 165 175 (Valeurs) 6 5 18 7 4 (effectifs partiels) Si on designe par x, 12 terme général de cette série,on obtient on effectuant le changement de variable : ~ x, x, 7 155 @ oe ume nouvelle série & valeurs isolées : “2 I ° Pi r (valeurs) 6 I5 Ie 7 4 (effectifs partiels) et qui a comme moyenne arithnétique : 6.(-2) + 15 Ze = 0,24. On en deduit : = eek + X= T0.(-0,24) + 155 = 152,6 « rIr) Notons h,,hy et hy les hauteurs des différents rectangles de 1'histo- gramme des effectifs vespectivement associés aux classes [10 , a{ , sc de ces nett gore : 2, 40{ et (40, 70f . oo (2% = To)h, » Sp = (40 = 20)hy et 8, = (70 - 40)hy « Les aires: S, , S, et 8, doivent ttre proportionnelles aux effectifs partiels 6 , 2 et I5 ,ctest & dire: 8, 8 8, —t 2 —2 = 4 = atoh on tire 1es relations : 6 oa) 2 = ORF ob hy = nye. P ple on doit pré finalement 1'histogramme suivant : -35- CHAPLTRE III PARAMBTRES DE DISPERSION Considérons les series statistiques suivantes + KR: 2 4 9 TG IT | y:7 9 9 I TO . es effectifs partiels sont tous égaux A I aussi bien pour X que pour Y. 1 est facile de voir que ces deux séries ant 1a n@re moyenne arithnetique X= T= 9 ct la méme médiene aussi MW, = My = 9 +Si on intérpréte ces deux séries comme les notes de deux étudiants X et Y,on dira que Y est plus régulier que X.La moyenne et 1a médiane -plus généralement les valeurs moyennes-sont donc insuffisantes pour donner "certains renseignements” sur la série,I1 faut introduire d'autres paramttres qui permettent de mesurer la dispersion d'une série autour de sa moyenne.Ctest ce que nous allons faire dans ce chapitre. T,VARTANCE. On remarque que Var(X) > 0 et ce n'est rien d'autre que 1a moyenne arithmgtique de le série (2, -D*, w , (,-D? . oe I. 2-Bxemple.Caleulons les variances des séries X et Y ci-dessus,0n peut résumer les calculs dans le tableau suivant : =36- x 2 4 9 IT Bffectifs | I I I I x, -f 7-5 0 4 8 Y a 9 9 TO T Effectifs ae I a ay 3 Yar -2 ° 0 I r G@-DF fe 0 0 oF On en deduit donc Ver(X) BOE sao ne Once Lonsed = 30,8. Var(x) = 2 00+ Sete 3,2. On voit donc sur cet exemple que plus la variance est grande, plus 1a série est dispersée autour de le moyenne. Le cas o& Var(X) est égale & 0 signifie que chaque terme de la série (x -D?, a + (a, - ne est nul et done pour tout 4 yk on axe & yctest-R-dire que la série est constente, -37- L.3-Définition, Soit [x,, x,[ , n, ’ « une série classée,0n appelle variance de cette série la variance de la série des centres des classes. on peut done toujours supposer que la série est & valeurs isolées tout le long de ce chapitre. | Iad-Quelques propriétés et rbgles de caleul. IedsTnAutre expression de Le variance. Par d6finition on a: | var() = 2 (ap(xy - D7 wee ma, DD) « | | 7 On developpe chaque terme (x, ~ Z) 2 2 eset xteetnx, ON 2 ee og Dette, Ae ¥ v K or ona: xt g-02 Moyeme ae x2. W . Dow on deduit : (7.2) Var(X) = Moyenne(x*) ~ 28? 4 & Cette formile nous donne une fagon de calculer la variance d'une -38- Exomple dtapplication. Reprenons le série: KX: 2 4 9 13 IT (valeurs) Iorr om (eztectifs) * La serie X° est obtenue A partir de X en élevant toutes ses valeurs au carré 2 4 16 Br 169 289 (valeurs) I It r I (effectifs) Dtok : ez 44 16 + 81 + 169 + 289 = 01,8 5 et par consequent ver(x) = © -#% 2 17T,8- er — =30,8. Pour calculer la variance on pourra se servir aussi bien de la formule I,I que I,2smais évidenment suivent le type de problémes i1 faut choisir celle qui facilite le calcul. L mori dtés de 1a variance, on considtre toujours une série X du type (I) (voir p.35).Soit a un nombre reel.Calewlons Var(X + a).Posons Z=X+a Ona: Var(2) = Yoyenne arithmétique de (Z ~ 2°. or Z = Moyenne arithnétique de (K+ a) = R + a dtaprés la forme (2.2) du Chap IZ (voir p.22).D" var(Z) = Woyenne arithmétique de (K+ a+ ¥ - a)? = Moyenne arithmétique de (X - 2)? = Var(X) dtaprés 1a remarque qui suit la definition I.I . (voir p.35).0n a done = Var( X + a) = Var(X) (1.3) Posons maintenant P = aX ,0n a alors: =39- var(2) = Ver(aX) = Moyenne arithmétique de (ex - ax)? . or a = a F.Dtoh Moyenne arithmétique de (aX - a %)° = voyemne’arithmétique de 1a série a2(x - X)?.ptaprés 1a formule (2.4) (voir p.22) on a: 2 Moyemne arithnétique de a@(x - X)° = a°(ioyenne arithnétique de (x - ¥)? .wt einatement on obtient le resultat + var(ak) = a°Var(x) (1.4) Ie4.3-Caloul de Ja variance par changement de variables Soient x, et e30 deux nombres reels .Posons pour tout 1 =I , x7 %, Ceci est Squivalent & x, = 22, + X,- par (1.3) (p.38) on a: Var(eZ + a) = Var(eZ).Ce qui est aussi égal a e*Var(z) (forme T.4 ci-dessus).On a finalement: Yar(x) = e*Var(2) (1.5) Exemple d'applications Calculons ie variance de 1a série classée de 1'exercice II p.28.Sa série des centres est donnée & la page.33 + X 135 145 .155 345 IT5 6 ae 18 7 4 Bn effectuant le changement de variable : x, > 155 To on obtient une nouvelle série Z -2 -I 0 I 2 (valeurs) 6 15 Ie 7 4 (effectifs) =40- On calcule done 1a variance de Z en suivant les étapes rassemblées dans le tableau : 2. BCART-TYPE Veleurs 2 +I I 2 Befectifs 6 Is 18 1 4 2 4 I ° I 4 Moyenne de 2 = O22) + 15.(-1) + 18.04 7-24 42 2p og 50 Moyenne de 22 = ct +15. T + 10.0% 7.1 404° Jy 94 | 50 DtoB + 2 52 7 Var(z) = Moyenne de 2° - 2 = 1,24 ~ 0,0576 = 1,1824 et done + Var(X) = 1o°Var(z) = 100 . I,1824°= 178,24. Souvent pour mesurer 1a dispersion d'une série autour de sa moyenne on utilise une autre grandeur apn yue et qui est aéfinie par arégerité : om V Var (x) (6). Par exemple pour les séries quton a wnsidééee 8 Te p e235 one: Var(x) = 30,8 e+ Varl¥) = 1,2 et done : oO) = \/ 30,8 = 5,54 o(y) 2 \/ 1,2 =1,09. ore BXERCICE RESOLU om considdre les deux séries statistiques suivantes donnant la répartition en fonction de 1'&ge de la population espagnole en 1960, Les domées ont été obtenues % partir de deux échantillons de 10000 personnes de chague sexe. Classes Hommes, Fenmes + oa 5 To4r 943 5 & Io 948 2s * To a I5 903 833 15 & 25 | 1565 1484 25 835 1600 15ST 35 8 45 1305 45 855 55 4 65 855 926 65 a 75 104 936 TS-Donner Ja distribution des effectifs cumlés et calculer 1'Age médian resculin. Qe~Calculer 1'Age moyen pour : “Le sexe masculin, 3eaCalouler Le variar veg da ghacune de ces deux series, SOLUTION. T®-Rappelons que l'effectif cumulé d'une classe est égal A la some de l'effectif de cette classe et ceux de toutes les classes qui la précé- dent.On a ainsi : Classes Effectife cumlés Effectifs cumilés sexe masculin sexe feminin oad To4T 943, 5 ato 1989 1768 To 215 2892 2607 T5 a 25 4457 4085 25k 35 6057 5636 | 35 4S 1358 6987 45 255 844I 8138 55 a 65 9296 9064 65 a5 Tooco T0000 On voit donc que 1'age médian masculin tombe dans 1a classe [25 , 35[ . Wotons le Wy, .Pour le calculer on peut utiliser la formule (I.I) (voir p.18) W/2 - Ny. I =x, +e, T “ns tN, -N a 7 Maer o& dans le cas qui nous interesse on a : 35 - 2 = 10 Wy = 6057 Nyy = 4457 et 8/2 = 5000 On obtient en repportant toutes ces valeurs dans la formule ci-dessus : =43- M, = 25 + To 2000 = M57. ay39 | 6057 ~ 4457 2°aPour 1!Age moyen m @tabord les séries des o et ¥ vont avoir les mémes valeurs puisque elles proviennent des m@mes classes.Par contre elles ntauront pas les mimes off Classes | effectifs | offectits x meseulins | fexinine oas To4r 943 2,5 2,5 6,25 5 a Io 948 825 7,55 7,5 56,25 To & I5 903 833 12,5 12,5 156,25 15 & 25 1565 1484 20 20 400 | 25 8 35 Té00 1551 30 30 200, 35 8 45 1301 1351 40 40 600 | 45 855 Tos3 Ist 50 50 2500 | 55 a 65 255 926 60 60 | 3600 | 65 & 75 704 936 70 70 4900 on aura alors : €= 30,70 et Y= 32,78. Le lecteur est invité & faire le calcul en détail. 3°-0n sait que : var(x) = x = ¥ et = Var(y) = y*~ En utilisant le tableau ci-dessus on trouve: x? 21358,36 et yee 1513,10 done =44= Var(K) = 358,36 - (30,70) = 415,87 Var(Z) = 1513,10 -(32,78) = 438,57 On en deduit : oH) =\/ 415,87 = 20,39 o(t) = V 438,57 = 20,94 . On remarque quten moyenne 1a population feminine est un peu plus vieille que 1a population masculine, leis les dispersions sont praticu- ement les mimes. “45= CHAPITRE IV LES INDICES on besoin souvent de mesurer les variations dans le temps d'une ow plusieurs variables statistiques.Par exemple si le prix de l'essence est: = P, = 2,80 F a 1'époque 0, 4,70 F 8 1*époque I> Ce rapport nous dit’ que le prix de L'essence & 1'époque I est 1,67 fois plus élevé qu'& 1"époque 0,1 mesure done les variations du prix de 1'ess~ pogue de ref ence par rapport & 1'époque 0 qu'on appelle ence Bien-str on peut faire 1e nme chose en prenant 1'époque I comme époque de reférence.Dans ce cas on obtient + P, 2,80 ? 0,59 ot '?. 4,70 Le nombre P,,, est appelé indice élémentaire . 1/9 D'une manire générale on considtre une grandeur G qui varie dans le temps.0n appelle alors indice éiémentaire de GA 1'époque I par rapport & 1'époque 0 le nombre : (0.2) Nous nous limiterons dans ce chapitre & 1'étude des indices des prix et des quantités et qui permettent de mesurer 1'évolution du coft de certains biens de consommation. -46- I. INDICES ELEMENTATRES I.I-Indices élénentaires des prix. Considtrons un article et supposons que son prix est : 1 ss Ee & 1'époque 0, -P, & L"époque I. (1.2) Le nombre? ,. est appelé 1"indice élénentaire au prix de cet article & 1'époque I par rapport & 1"époque 0. on definit de fegon analogue : Cette fois-ci on a choisi 1'époque I comme Spoque de reférence.On verifie facilement la relation : Proosr = 2 (3) Généralement on exprime cet indice en pourcentage, I.I.I-Exemple. Le litre de leit coftait : = 0,38 F en 1950 (époque 0) = 0,41 F en 1958 (époque I). on a alors 0,42 Pp. _brix du lait en 1958 _ tO “Prix dulait en 1950 = 0,38 BES correspond & 108% « 1,1, 2-Renarques i)LMindice Snentaire du prix & we époque par rapport A elle-méme est égal A T.En effet on a: Pog t—2 = 2] ou ro0s Ga) -aT- 44)En considérant cette fois-ci les prix P,P, et P, d'un article respectivement aux époques 0, Tet 2 ona: = PryoePoyt|) (165) Un article cofte : en 1973 (époque 0) en 1975 (époque I) en 1980 (époque 2). 300 1,36 (1368) . 220 P. = — > =1,22 (12a) et P 1/0 * Teg 2/T Povo = Pryo *Poyt 7 192207436 =1,65 (265K) « Le lecteur pourra aisément constater que pour multiplier les indices il évitera de prendre les expressions en pourcentage. I.1.4-Exercice, Le prix d'un article était Py = 270 F en 1982 et L'indice élémen- taire du prix de cet article en 1982 par rapport & 1975 est I70%. Calculer son prix P, en 1975. des quantités, I.2-Indice élémentair on definit de manitre analogue que ce qui préeéde 1'indice é1émen- taire des quantités. Si Q) designe 1a quantité d'un produit & 1"époque de reférence 0 et Gy & 1'époque I on pose (1.6) On vérifie facilement que cet indice posséde les mémes propriétés que ltindice élénentaire des prix. a Quand on veut voir comment évolue le coflt de la vie dans le temps on caleule son indice.Pour cele on choisit plusieurs biens de consomm ation par exemple le pein,la viande,le lait,le sucre,les vétenents,le ticket de bus etc... Dans ce paragraphe nous donnerons quelques exemples d'indices permettant de mesurer cette variation du colt de 1a vie. On supposera quton a N articles - qu'on nv nératera de I jusqu’ N - gont : i)Les prix sont : P & 1*époque 0 P: 1 ° an A 1"époque I ii)Les quantités sont : QreeesGh & 1"époque 0 r Ms 0g QraeeesQp & 1"époque T Le numero du bas indique 1'époque.Celui du haut indique l'article. 2.INDICES DU COUT DE LA VIE. 2.I-Indice global des prix. On definit 1'indice global des prix de ces articles & 1"époque I par rapport & 1époque 0 comme étant le rapport : ae Tout Le lone de ce peregraphe 1 somation J porte aur 4.of yeoesK 2.1,1-Exemple. Considérons les prix des 4 produits suivants & 2 époques diftérentes + -49- 1962) ej 10) 3 2,50 1,30 on caloule 1!indice global des prix Tgp = APL 2O tH , Wyse (asa). 6 + 2,20 +1,80+T Ir 2,2-Moyenne avithmétique des indices. a On caleule 1'indice éLémentaire Pro du prix de chaque article et on fait leur moyenne arithmétique + | Tyo * > "yo (eee po Reprenons l'exemple 2.I.I et calculons 1"indice élémentaire du prix de chacun des produits considérés + X= i2- 1,66 (1668) Phyo tgs Ts = 1,36 (136%) 3. 2,50 eo) yo * ore 1,38 (138%) Pro = a 1,30 (130%) Ce qui donne en appliquant le forme (1.8) + =50- = 21,66 + 1,36 + 1,38 + 1,30) = 1,42 (1426). L'indice global des prix et le moyenne arithnétique des indices élément: es presenvent un inconvinient majeur : Ils ne tiennent pas compte de 1Minportance de chaque bien de consommation par report aux autres.Pour cela on introduit d'autres indices donnant des informations plus précises que celles que l'on peut obtenir & l'aide des indices gue lton vient de voir. Indice pondéré Pour faire epparattre 1 mportance de chaque bien de consommation par rapport aux eutres on pondre par sa quantité.0n obtient alors les indices suivants : i)Indice de Laspeyres qui se calewle en pondérant les prix par les quantités & 1'époque de reférence : 57 ate! oi (1.9) | Tao * Fa oe, | 2 | 4i)Indice de Paasche.I1 se caleule en pondérant les prix par les (1.10) Mais on peut trés bien pondérer par la moyenne arithmétique de la quantité & 1"époque O et 1e quantité & 1"époque T.Dans ce cas on ay ore 4ii)Indice de Marshall. ty opt w+ DF r/o = 5 2_(% + HEH | En faisant la moyenne géométrique des indices de Laspeyres et de t (I.II) . Paasche on obtient un nouvel indice connu sous le nom de : iv)indice de Fisher. P L P Ole Tryo"Tt/o ise DS nipi int ? Doar Dope to (SSH (1.12) . 2-97 2 Comme pour les indices élémentaires,1"indice de Fisher verifie le té de réversitilité du temps,ctest a dire : bo gP a? Tryo*Fo/t (1.13). 3.EXERCICE RESOLU, Le tableau suivant donne les prix et les quantités de 3 produits & 2 époques différentes : Tab 3.1 1972 (époque 0) 1980 (époque T) Produit A 4 GQ) Prix P} Quentités Gy pl ot 2 I qe 6 15 T 2 5 3 8 m 3 6 9 13 18 ooo T®,Calouler 1'indice global rendant compte de 1'évolution de ces biens de consommation. 2°,Calouler les indices de : ~Laspeyres, ~Paasche, Marshall. Bn deduire 1"indice de Fisher. on prendre 1972 comme époque de reférence. Solutioi I°,0n caleule 12 somme YG. off t varie de T 3 3.0m obtient : 2%) = 1245415 = 32 De méme on a De D'oh, en sppliguent la formule (1.7) 15 +8413 = 36 36 r Liyo =3re 1125 (112,58) 2°-Pour traiter cette question on aura besoin de calculer les différentes expressions qui interviennent dans les Zormules (1.9) , (I.J0) et (I.II). on résumere tous ces calculs dans le tableau suivant : “53+ r : i Z ii ini ini ipi i iy pi i, olypi 1 | ae Po | SPE a5 | OPT | (25 + QD)RS | (Q5+ Qp)PT | | | I 12 90 84 os 156 195 | 2 65 To4 55 88 Ta 192 3 135 TIT 270 234 405 351 \ Total 272 3II | 409 427 68r 738 Tab 3.2 Ceci nous donne =: a 7 IT “Indice de Lespeyres = Ij, = Srp = Ts (1148) « “Indice de Paasche = Thy. =-45g "1104 (Z046) « : a ot 8. wIndice de Marshall = 11). =[g7 = 1,08 (1088) « Per definition 1"indice de Fisher est le moyenne géométrique des indices de Laspeyres et de Paasche,on obtient en appliquant la forme (112) 7 P wIndice de Fisher = Ijo.= 1,1 4 = 1,09 (109%) “54- CHAPITRE V La CONCENTRATION T.GBNERALITES ET DEFLNITIONS, on considére une série statistique classée : [ays aal s+ Lays eqrl (classes) avec 2,9 0 pour w * tout 1°21, ...,k+I (effectifs) te my re centre de ta ctasse [Os Syl + On suppose que le caractdre mesuré par cette serie est additif, clest-A-dire que la somme de deux valeurs a un sens,Par exemple ~on peut additionner le revenu,le saleire,etc... -on ne peut pas additionner 1'8ge,la taille, ete. Pour chaque alasce om peut considérer : son effectif partiel, “l'importance du carectére (nstion que l'on va preciser). 2 nes Aenx points de vue on peut associer ‘deux representations grephiques -L'histogramme des effectifs cumulés qu'on a deja étudié, wun histogranme qui décrit 1"importance du caractére cumilé de chaque classe. Ces deux representations nous pernettent de caloule: nla médiane (valeur qui partage 1a série en deux series ayant toutes les deux le méme effectif total), ~une valeur qui partage la série en deux séries dont le carac- tere a la méme importance aussi bien pour l'une que pour l'autre. os Cette derni’re valeur est appelée la médiale.Son écart & 1a médiane est perfoi: utilisé pour faire l'analyse de 1a concentration. ~Caracthre. On reprend la série classée (I). I.I.I-Definition, [te nomore n,x on appelle caractire de 1a classe av On peut dresser un tableau donnant le caractére de chaque classe ainsi que le caractére cumlé : Classes centre 5 effectif 0, | caractére caractére ~ cumul & (er 782 [ x ny nq*y ByXT (eal a pone : : : “ Lee Sea aa Bret Tad 1.1 I,2-Calcul de la médiale. On calcule 1e caractére cumulé de chaque classe (voir Tab I.1) et on note C le caracttre total.La médiale est alors la valeur qui partage la série en deux séries dont chacune a un caractére total égel & 0/2.La médiale tombe dans une classe [aj, aj47[+On prockde par interpoletion proportionnelle comme pour 1a médiane, 56+ Caractire cumul Fig I. My Paar Clesses Pour tout ieI,. sk on note C, le caractire cumlé de la classe [ey + Syygl sotest a aize : (1.0). On a alors les relations de proportionnalité : o/2 ~ 0, OF _ =F L 8 ort gIFr =¢. -I Dtob l'on deduit : (1.2). “5T- T.3-Un_exomple de calcul de la médiale, on considére 1a statistique suivante donnant 1a production mondiale de b1é en 1982.(Source :Perspectives de 1'alimentation, 26 mai ¥, A.0.,Rome). Production en Nombre de pays millions de tonnes oa to 19 Io & 20 4 20 & 40 2 40 a 60 1 60 & 80 2 Tab 1.2 Galculons 1econtre,le caractére et le caractére cumilé de chaque classe de cette série : Classe centre effectif caractére caractére cumlé x Ry 4X cy { 0,201 5 19 95 5 . fro,zol | 15 4 60 155 : f20, aol 30 2 60 215 feo,60l | 50 I 50 265 fo, eof 0 2 T40 405 Tab 1.3 58 Le caractre total est C = 405.Done C/2 = 202,5.La médiale tombe dans 12 classe [20 , 40[ .0n applique alors 18 forme (1.2) avec dans le cas qui nous interesse : ae” Cy = 215 Oy_y = 155. om obtient + 202)5 - 155 ot tinatement + 215 = 155 % = 20 + (40 - 0). My, = 35,83). 2.FONCTION ET COURBE DE CONCENTRATION. on reprend les notations du paragraphe I ,c'est-A-dire on con- siddre une série classée : fos eof vee [Mer Marl (Chases) n, 7 ny (Bffectits) avee * her pour ie, et 2 La fonction de concentration est l'application qui & tout x; associe le nombre : =59- 2.1, 2-Bxemple. Determinons 1a fonction de concentration dans le cas de 1'exemple 1,3.En utilisant le tableau I.3,on caleule 1a concentration pour tout .0n obtient : Centre | Préquence | caractére | caracttre | concentration x; cumlée F, nx, | cumié 4 4 4 5 0,67 5 9 0,23 (23%) 15 0,82 60 155 0,38 (38%) 30 0,89 60 215 0,53 (53%) 50 0,92 50 265 0,65 (65%) 0 I 140 405 I (Zoos) Tab 2.1 2.2-Courbe de concentratio 2.2.T-Constructio Considérons 12 correspondance qui & la fréquence cumulée F, de re ctasse [2;, ajyfassocie 1a concentration : x, er 7 c et portons dens un repre orthonormé F, en abscisse et da,x/e sot en ordonnée.On odtient un ensemble de points & 1'interieur du carré OAHD de c6té égal A (voir Pig 2.1). ~60- Concentration Fréouence cum ée Pig 2.1 Si le nombre de classes est assez grand,ces points seront assez nombreux et on peut considérer qu'ils determinent pratiquement une courbe,On ltappelle 1a courbe de Tor Le rapport de l'aire de la region du carré notée § A celle du triangle OAB est appelé Indice de concentration ou indice de Cink. On le note : ) - Mze ae s hire de OAB (te caractére "Un se 1it "mu" ) (2.0). ~61- 2.2, 2-Remarques i)Ltaire de S étant toujours inferieure ou égale & celle du triangle OAB,1"indice est donc un nombre compris entre 0 et I. 44)Si D+ 0 ,ltaire de S est mille et donc 1a courbe deLorentz se confona avec 1e segment O3,Ceci signifie qu'un point quelconque sur cette courbe © son abscisse égale & son ordonnée.On en deduit donc que pour tout i=I,...,k on a: on divise le nunérateur et 1e dénominateur par N= ny + vee + Oye ny, ngX, a 2 s%s wey + c La relation (2,2)devient alors : tee + Bex pour tout i = A eter. 62 La I°°° ggalité donne fA = fyx, et en simplifiant par f; on yA = fpy 1 obtient A= x; On remplace x, par A dans 14 2°"* égalité.Cette vient alors : fA + tox, fk Sete f,+—= A A A A on peut done énoncer 1a proposition : i. L'indice de concentration est nul tous les termes de la série des centres sont égaux . Dans oe cas on dit qu'il nty a pas de concentration ii)si O = I on ait qu'il y © concentration totale, Dans ce cas a courbe de Loventz est soft le segment AB soit le_segment OA, La série des centres x1,%5, «+. ie stant croissante,il en est de n@me de 1a série P,P, ++. ,F,, des fréquences cumulées.on en deduit que pour PF domé 1e nombre (qui ntest rien dtautre que via la remarque ii)) est unique,et donc sur 1a courbe de Lorentz il nty a qu'un seul point pour lequel l'abscisse soit égale A I,et ctest le point B.Le premier cas ne peut done se presenter.La courbe de Lor- entzest confondue avec le segment OA,Ce nest done pas une courbe continue puisque le point B n'est pas sur OA, Toutefois on peut con~ siderer que 1a courbe de Lorentz est constituée par le segment 0A et le segment AB, ~63- Pig 2.2 Pig 2.3 Concentration Concentration ° oO BR Fréquence’ 2 Absence de eee Concentyation Cumlée concentration Q =0 totale 0 =T iv)Deux séries statistiques peuvent avoir le méme indice de concentration,ia Tig 2.4 donne un exemple de deux courbes de Lorentz gui délimitent avec le segment OB deux portions du carré OABD ayant des aires égales, Concentration Ces deux courbes sont symétriques par rapport A liaxe AD. rréquence cum ée Fig 24 ~64- 2.2,3-Caloul de 1tindice de Gini. Considérons toujours une série statistique de type (I).on a Ja série des fréquences cumutées Fy sFoseeesFy, son lui rajoute une"fréquence” F.= 0 pour 1a commodité au ealcul.On pose : ta concentration de la valeur x, . On @ vu que les points P, dont les abscisses (respectivement les ordonnées) sont F, (resp h,) permettent de construire 1a courbe de Lorentz de cette série, Pour calouler 1"indice de Gini on doit calculer 1'sire de S,Pour cela il suffit de caleuler celle de S' (1e complementaire de 9 dens le triangle OAB) .Si on construit la courbe de Lorentz en joignant les points P, par des segments de droite,on voit que ltaire de 3! est 1a somme des aires des trapézes P,P, |.P!.,P! .Or l'aire dtun traptze de ce type est : (Pea + PlazPasn) -PEPL aT - rem ctest-a-dire Mais Py oo Fy= f. ar Faar et Aire de S = 0,5 - Aire dest =5- DA, ter ot tinatosent = | yer Fc es Si Cette relation permet donc de calewler 1"indice de Gini. Bees Concentration Préquence cum ée Fig 2.5 Dans 1a partie qui suit nous donnerons quelques exemples sur lesquels on fers "analyse de la concentration en calculant les ifferents paranbtres : Médiale ,fonction de concentration ,courbe de Lorentz et indice 42 Cini ete... 3 EXEMPLES. 3.I-Exemple ot la concentration est presque totale. Une famille. constituée de Io personnes (4 filles,4 garcons, 1a mre et le pére) s' st partagée une sonme de IOO00F d'une manitre 3s inégale : -50OF pour chaque fille, ~100F pour chaque garcon, ~400F pour 1a nbre, 90007 nour le pire. On peut considerer qu'on a une série & valeurs isolées ~66- 250 XpeT00 x4 400 — x4=9000—(Valleurs) ned nor nigel nye (Bffectifs) Calculons dtabord les différentes valeurs dont on aura besoin. On dresse le tableau suivant : Tab 3.1 | x | 7 £4, Concentration notée hy 50 | 4 |0,4]0,4 | 20 20 0,02 Too | 4 0,4]0,8 | 40 60 0,06 400 | I Jo,zlo,9 | 40 I00 0,I | gooo | I jo,z|z 900 ooo I | } i)Gourbe de Lorentz On porte les F; en abscisses et les h, en ordomnées.0n obtient alors 1a courbe suivante + Concentration ‘hy Pig 3.1 h 1 1 | Courbe de Lorentz r I f ! | t \ ~6T- ii)Indice de concentration de Gini Pour caleuler cet indice on applique la formule (2.3) p.64. On aura : O= I - (0,02.0,4 + 0,08.0,4 + 0,16.0,I + I,2.0,7). d = 0,834. Ltindice 0 est voisin de I,le concentration est presque totale, chose & laquelle on peut stattendre d'ailleurs puisque le pare stest accaparé pratiquement la totalité de le somme, 3.2-Autre exemple d'analyse de 1a concentration. On reprend le tableau de l'exemple de la page.23 qui donne la répartition de la population de 27 pays européens.On le compldte en caloulant les différents paramtres qui pernettent de faire L'analyse de la concentration, centre 2,x, |e, cumaé | Concentration = aq [Oy Comal “ne 2,5 7 | 0,26 0,26] 17,5 | 37,5 0,036 15 7 | 0,26|0,52) 52,5 | 70 0,143 12,5 3 | 0,12]0,63] 37,5 | 107.5 0,220 11,5 2 | 0,07}0,70] 35, 14245 0,292 22,5 2 | 0,07|0,77| 45 |: 187,5 0,384 32,5 2.] 0,07}0,84) 65 252,5 0,517 405 1 | 0,05]0,89]. 47,5 | 300 0,655 62,5 3 | o,r|z | zer,5 | 487.5 I Tab 3.2 ~68- Dans cet exemple nous ferons ltanalyse de 1a concentration de deux fagons différentes : ~Bn calculant 1'indice de Gini, en calculant 1'écart entre 1a médiane et la médiale, 4)Galoul de le médiane. Lteffectif total est 1 et done N/2 =13,5.La médiane tombe done dans 1a classe [5 , 10[ .on applique alors le formule (1.2) peI8 avec : a, = 5 (noté x, dans 1a formie) ey= 5; Nyx I4 et By y= 7+ on obtient + y= 5+ (10-5), 2229-7 7 9,64 « 44)Caloul de la médiale, Le caractdre total est ¢ 487,5.D'ok C/2 = 243,5.De la méme maniére 1a médiale se calcule par la formule (1.2) p.56 avec : 5. a7 = 40 Cy = 252,5 0,1 =I87,5« i Ones 243,75 - 187,5 = 25 + (40 = 25), 23:75 ~ T6709 my oS M, = 37,98. (1a méddale tombe dans 1e classe [25 , 4ol ). Aii)Courbe de Lorentz. On construit la courbe de Lorentz en portant les PF; en abscisses ét les h, en ordonnées (voir Tab 3.2).0n obtient alors : ~69- Concentration hy 0,5}-— = =~ MW, (0,83) A Préquence cumul ée iv)Indice de Gini, On applique 1a forme (2,3) p.64 qui stéerit dans le cas qui nous interesse ici : Oat [ayey + (ay + Byty + eee + (hy + By)tQ] 2y=0,036 hy=0,T43 90,220 hy 20,364 hg=0,577 hy=0,615 higeT et =0, 292 £,=0,26 fp90,26 £520,1T £40,07 3 £0 ,05 £,00,07 £,=0,07 £, 5! £,0,1T . 8 on obtient finalement : V = 1 0,48 = 0,52 (528) La concentration est done moyenne. =10- v)Galeul de la médiale & l'aide de 1a courbe de Lorentz. On peut remarquer que les concentrations sont obtenues en divisant les Leper te caracttre total C.T1 en results que las concentrations hy sont respectivement proportionnelles A ces caracttres cumlés,Donc la mé@iale sera"l'abscisse"du point de 1a courbe de Lorentz dont 1'ordonnée est égale 4 0,5.Bn fait elle sera donnée en "pourcentage".I1 faudra done reconvertir aprés. Pour le cas qui nous interesse on lit graphiquement 1'absciese éu point K et on trouve 0,83.0r on sait que 0,77 correspond & 25 et 0,84 correspond & 40.En faisant une interpolation propo rtionnelle on trouve que 0,83 correspond & : 25 4 15,0283 - 0,77 0,84 = 0,77 = 37,85 .Ce qui est & peu prs le resultat trouvé en ii). vi)On peut aussi pour faire ltanalyse de 1a concentration calculer 1'écart entre la médiane et 1a médiale.On aura : Wy ~My = 37,98 - 9,64 = 28,34. On voit done que cet écart est relativement important “par rapp- ort"& 1a plus grande valeur de la série. vii)La courte de concentration de Lorentz nous ait par exemple que 83% des pays européens (sans 1'URSS) se partagent 50% de 18 population totale européenne (sans 1'URSS évidemment). -T1- CHAPITRE VI SERIES DOUBLES AJUSTEMENT CORRELATION 11 arrive quelquefois que deux séries statistiques mesurant deux caractéres X et ¥ d'un échantillon d'une méme population soient liées par une relation dans le sens que les valeurs de Ltune peuvent @tre obtenues & partir de celles de l'autre A Ltaide tune correspondance.0n dira que X et Y sont dépendantes.Nous escayerons dans ce chapitre de préciser le sens de cette "depen- dance" et de la calculer du moins approximativenent. Quitte & passer A 1a série des centres on pourra toujours supposer que les séries considérées sont A valours isolées. ‘T.SERIES_DOUELES. I, T-Bxemples on étudie 1e poids et 1a taille notés P et T de 100 éléves pris au hasard dans un lycée,Gna obtenu les données euivantes + ? | T50cm 155 160 Tes r70 2 50 Kg 3 5 4 3 2 IT 55 5 7 7 8 T 34 60 6 6 4 6 8 30 65 4 5 3 2 5 19 18 23 1s 1g 22 00 Tab I. ~T2- La case de 12 3°™colonne et 1a 2°™*iigne represente 1e nombre d'éléves qui ont un poids de 55 Kg et une taille de 160 em ctest-a- ame dire 7.0n note cette valour no,.Clest 1'effectif artic! de 1a > valeur du caractbre poids et 1a 3°"? valeur du caractare taille. on peut stinteresser uniquement au caractére poids.Par exemple le nombre 'éléves ayant un poids égal & 55 Kg et une taille quel- conque est 34,Ceci figure sur la derniére colonne,On note ce nombre 4.Ctest 1) etif marginal de 1a 2°™° veleur au carectére poids,Il s'obtient en faisant le somme de tous les termes de 1a 2°™° ligne.on a: = nyt a, att Bogt see + Mog De-la méme maniére on peut se restreindre au caractére taille.La me valeur 23 de le der slaves mes~ Ligne donne le nombre a! urant 155 om (avec un poids quelconque).De maniére analogue n 5 me stobtient en faisant 1a somme de tous les termes de 1a 2°™° colonne: 2 02 = Brot Naot + + Type valeur du cara On Gira que n > est 1'effe cttre taille. T,2-Quelques définitions, L'exemple que l'on vient de considérer est typique de ce quton appelle une série double ou & deux dimensions(parce qu'on étudie deux caracttres sur un méme échantillon). 1.2.1 resentation. On peut résumer tout dans un tableau semblable au Tab I.I : -B- sss vee | yy |] Befectiz narginal x, Myplees Byy eee | Oy Bffectit marginal Tab 1.2 ~ Xzse00s%y sont les valeurs du caractdre X, ~ ¥rseee0¥1 sont les valours. du caractare ¥ est Lteffectif partiel du couple (x,,yj) otest-d~dire le nombre d'individus de 1'échantillon pour lesquels les carac- teres-K-et-Y-valent- respectivement et yy (resp n_, ) Leffectif marginal de x, (resp de y5) ise le nombre d¥individus pour lesquels X (resp ¥) vaut x, (resp y,) et qui est tel que: (1.2) “T4- on gardera les notations de cette partie tout le long de ce chapitre, 1.2, 2-Fréquences partielles et marginales. fréquence marginale de 1e valeur on definit la fréquence partielle du couple (x,,y,) eb la 3 (resp y; ) par les égalités + fréquence partielle (1.3.0) 5 (1.342) 6 1 2 8; et ‘jer I (1.4.2) 6 ia Celeulons par exemple les fréquences partielles et marginales couples de valeurs de la série double donnée par Je Tab (I.I) : 2 E50) 155 Het GOs 165 eset 70M8 lc) 50 55 0 65 0,03 0,05 0,04 0,03 0,02 | 0,17 0,05 0,07 0,07 0,08 0,07 |] 0,34 0,06 0,06 0,04 0,06 0,08 || 0,30 0,04 9405 0,03 0,02 0,05 | 0,Z9 0,16 0,23 0,18 0,179 0,22 | T Ted 1.2 2.3-Bffectifs et fréquences cum és, On appelle effectif cumilé du couple de valeurs (x,,j) 1e nombre @"individus Nj de 1'échantillon pour Lesquels le caractére X est infériour ou égal & x; et 1e caractbre ¥ est inté ou égal & y,.0n L'exprime en fonction des effectifs partiels par 1a relation : (1.5)My5 ae agg = (azrtese4pg)4 (Bort Ang, teeet (ny pteeem, 5) ey 23 ar 43 La fréquence partielle cumilée de (x,,y,) est détinie comme suit + (2.6) « Si i=k (resp j21) one: Ny x ae (reap Ny, a) et dans ce cas on pariera ateffectif manginal cumlg de y, (resp de x, ).0n le notera alors N , (resp N, De méme on @ 1a fréquence cumulée d'une valeur x, ou ys qui se caloule de mani’re analogue.0n se contentera de le faire sur L'exemple qui suit . 1.2. 4-Consi dro! le Tab I,2,Par exemple + ca fréquence cumilée Fy5 de (55,155) : On fait 1a somme des fréquences de tous les couples (P3,7j) pour lesquels Ps¢55 et 15¢ 155 «Ces couples sont (50,150), (50,155), (55,150) et (554155). ~T6= Ce qui donne : Poy = 0,03 + 0,05 + 0,05 + 0,07 = 0,2. ~La fréquence marginale cumilée de 1a valour P, = 60 est 1a Somme des fréquences de tous Les couples (P;,25) pour lesquels Pi 60,ctest-a-dire : F 3, = 0,17 + 0,34 + 0,30 = 0,81 . 2, MOYENNES WARGTNALES.. 2, 1-Definition, Les moyennes marginales X et ¥ sont les moyennés arithmétiques de X et ¥ respectivenent.Blles se calculent en fonction des valeurs de chacune des séries X et Y¥ mais en considérant les effectifs narginaux: var(x) var(¥) G,-b?, Jel Oo -\VrarGy et ot) =\Vver . ~T1- 2, 2-Bxemple, Les moyennes marginales de la série double de 1'exnple I.I sont : B 2 17.50 + 34.55 + 30-60 + 19065 _ B = Tied + Dh OS = 57,55 50 + 23,155 + 18.160 + 19.165 + 22.170 100 Le caleul des variances est laissé en exercice. = 160,2 . Dans la suite on se donnera une série double (X,Y) formée de deux séries simples X et ¥ dont les valeurs x, et y, sont nunérotées de la méme maniére de 1 aN. Nous allons étudier le lien qui peut exister entre X et Y. 3. AJUSTEMENT LINEAIRE,. CORRELATION. on peut representer chaque couple de valeurs (x,,3,) par un point mM, dans le plen.On oht‘ent un ensemble de points qu'on appelle un mage de points (Voir Pig 3.1 ). Fig 3.1 On se propose alors de chercher la courbe-qui soit 1a plus proche possible de tous les points M, .Lui imposer d'@tre tres proche tun point peut 1'éloigner d'autres points.T1 stagit done de trou- ver un "juste milieu". ~18- La recherche d'une telle courbe est ce qu'on appelle 1'ajustement de ce muage de points, Ajustement non Linéeire Ajustemont linéaire Fig 3.2 Fig 3.3 he choix de ln courbe n'est pas facile,encore moins son calcul. Nous nous contenterons de traiter le probléme dans le cas dtune tajustement est Linéas droite.on dira que 3.T-Droite de Mayer. Considerons les N points My dont les coordonnées sont x,ot ¥y On appelle point moyen du mage defini par ces points le point ¢ dont les coordomnées sont les moyennes arithmétiques X et Y. On peut ranger la série double S de telle sorte que la série des abscisses soit croissante (celle des ordonnées ne le sera pas foreément).On partage alors $ en deux séries doubles S$; et S) ayant toutes Jes deux le méme eftectif total (plus ou moins un terme).on notere G, et G, les points moyens associés & S, et S$, vespectivement, 3,Z.1-Defini tion. La droite de Mayer associée & 8 est le droite definie par les points G et G, Cette droite permet dtajuster le mage de points associé A S. on vérifie qu'elle passe per le point moyen G+ ~19- 3.1. 2-kxomple. Considerons ‘la série double suivante : 8 = {(2,3) (3,6) (2,4) (4,7) (445) 6,8) yf On partage S en deux series Sy et 8, en choisissant les 4 prem- fers termes pour S, par exemple.Les points moyens de Sy et Sp sont alors G, = (3,5) et Fig 3.4 Cherchons 1'équation de cette droite.On remarque que les points Gz ot Gp ont des abscisses distinctes.L'équation de 1a droite G,¢, est done de la forme Yearsd Gn. Pour determiner a et b il suffit d'exprimer le fait que cette droite passe par Gy et Gp,clest-A-dire que les coordomnées de ces points vérifient cette équation wee Sarda 5 f +b-6. On en deduit : azt/2 eb b= 7/2. Finalement GyGp a pour équation : Y¥ = I/2(K +7). Ltajustement par 1a droite de Mayer n'est pas satisfeisant et est peu utilisé dans la pratique,Nous ajusterons plutst per la droite des moindres carrés que nous allons introduire dans la partie qui suit, 3.2-Droite des moindres carrés, 3.2.T-Position du probléme. Considbrons les N points M, dans le plan et notons D 1a droite cherchée.La distance de ly & D est la mesure du segment Mjlly ob Hy est le pied de 1a perpendiculaire & D passant par M, (Voir Fig 3.5). Le calcul de cette distance eat relativenent compliqué.On caleulera plutét la dis tance "verticale” de M, 2 D.Notons Ky le point de Fencontré dé Det de 1a droite a'équation X et supposons que i Ltéquation de D est de la forme : Yeakeb. est alors le nombre Lo distance de My & Ky a= faxy+r-yl - Nous chercherons done 1a droite D de telle sorte que 1a some : = soit minimale, ~B1- Une telle droite D est appelée 1a droite des moindres c: ow droite de regression de Y en X. 3.2, 2-Bxistence et unicité de Tout revient & montrer que a et b existent et sont uniques et rendent U minimale, Reprenons 1a quentité : i » us )o (ax +d-¥4)*. Ltexpression de U est alors un polynéme du second degré en a : un Ad - ope +¥ avec A positif . ‘Le nombre a cherché est la racine de 1a dérivée de U consi- dérée comme fonction de a.0n a: 7 Ut(a) = 2Aa- 2B et done U'(a) = 0 si et seulement si : ee » ~82- (3.3) 6 Si on considdre cette fois-ci U comme un polynéme du second degré en b,um calcul analogue & celui que 1'on vient de faire donne : rs H I veg (yy - ax) “Th fat qui ntest rien dtautre que : GA + on remarque done que le point moyen G = (Z,Y) est sur le droite des moindres carrés, Les équations (3,3) et (3.4) donnent finalement : (3.5) Fig 3.5 -83- Divisons le numérateur et 1e dénominateur du second membre de (3.5) par N.On obtient slors : . - BW, -Y (3.6) on voit que le dénominateur ntest ri X.Le numérateur + i> x z wae (x, - By, - Y) est un parembtre associé & (X,Y) et qu'on appelle 1a covariance de X et Y.0n 1a note Cov(X,¥). La formle (3.6) s'écrit alors.: Gov(X,¥) G.7) a= Verte) La covariance a le signe de a,Elle peut @tre positive ou négative contrairement & la varience.On peut aussi 1'exprimer sous la forme suivante : Cov(x,¥) (3.8) 6 3.4-Corrélation linéaire, On appelle coSfficient de corrélation de X et ¥ le nombre + Cov(X,¥) = (3.9) oo) “84+ montre que r posséde les proprités suivantes (les détails et les dénonstrations sont laissés au lecteur en exercice) : i) ra toujours le signe de Cov(X,¥), ii)r est compris entre -I et +I 444) [rl= 1 si et seulement si la-droite des moindres carrés passent par tous les points M, et dans ce cas on a: ax +8 pour tout i= I,.. Si r= 0 ive Cov(X,¥) = 0 ,on dit que X et Y ne sont pes corrélées, Nous allons reprendre les calculs que nous venons de faire sur un exemple sinple.Ceci nous pernettra de mieux comprendre les différentes étapes par lesquelles nous sommes passés. 4 BKENELE, Considérons 1a série double : Gy = { (2,3) G4) eo} Pour fixer les idées commengons par tracer cette droite n'im- porte comment pour le moment + Fig 4.1 ~85- Cette série définit um nuage de points My ,My et M.0n ca~ leule 1a sonme des carrés des distances M,K,.0n obtient + U = (2a + b -3)% (at d- 4)% (4a4 d- 8)? . On developpe U et on 1'écrit sous forme d'un polynéme du second degré ena: U = 2922 = 2(50 = ob)a + (3 = d)% (4 = b)% (8 = 0)? = 292% - 9(50 - gb)e + 3° - 30d + 89. on caleule 1a dérivée de U par rapport Aa: Uta) = 2(298 - (50 - 9b)) qui stannuie pour eee (4.0) . 29 Diautre part on a : Re3 et Y=5etdonc S=3atb (442). Tl suffit done de résoudre le systéme linéaire en a et » formé par les équations (4.1) et (4.2) ,ctest-A-dire + 29a + 9b = 50 qui donne @ = 5/2 et b= .-5/2. lia droite des moindres carrés a done pour équation : y=$@-v. Le lecteur pourra construire cette droite & titre dtexercice, a5 5.EXERCICE RESOLU, Le tableau suivant indique 1a production interieure brute par secteur au Maroc de 1970 & 1976 (en Millions de DH) Année Agriculture et PEche x Industrie et Mines Y 1970 197T 972 1973 1974 1975 1976 Tab 5,1 Source : Secrétariat a'Btat chargé du Plan et du aévélopp- ement Régional. On considére la P.I.B agricole et 1a P,1,B industrielle comme deux séries.statistiques X et ¥ et on se propose dtétudier la corrélation qui peut exister entre elles. Te-Calouler Var(x) , Var(¥) , Cov(X,Y) et le cSefficient de corrélation vr de K et Y. 2°-Donner 1a droite de regression de Y en X. ~87- SOLUTION, on caloule les moyennes arithmétiques X et Y.0n trouve : E=5,22 et Y= 4,21 et on compléte le tableau 5.J de le facon suivante : Année ye XY zoo | 3,72 ]3,37 | 73,83 32,53 rorx | 3,95 [3,53 | 15,60 3,94 rs72 | 4,09 [3,7 | 6,72 15,42 x973 | 3,65 | 408 | 33,22 34,89 3914 | 13,39 | 4,44 [379,29 65,74 3975 | 3,66 | 4,92 [33,39 11,97 | ists | 4572 |5,43 | 76,97 22,37 Tab 5.2 Te- on en deduit + 38,45 - 6,22)? = 11,20 Y= 18,28 - (4,21)? = 0,55 Gow(KY) = EP” xgry- LY = 23,26 - 21,97 = 1,29 et par conséquent + -88- wn 2 COE Y) THT Vi1,20-0,55 = 0,51 La corrélation est assez apparente, Elle est de 1a forme Y= ak +b avec a a fovlK,¥) __ 1,29 Var(X) 11,20 = 0,11 b2¥ - k= 4,21 - 0,11 + 5,22 = 3,66 ctest-a-dire Y= 0,llx + 3,66. -a9- CHAPITRE VIZ SERIES CHRONOLOGIQUES Considbrons le tableau suivant donnant le nombre 4'émigrants en France des départements d'0utre-Mer (Martinique, Guadeloupe, Réunion et Guyane) de 1962 & I97I. Année | 1962 63 64 65 66 67 68 69 70 TE Total | Ioo4 209T 4532 7006 78II 7962 7514 8398 8807 9165 Tab 0.0 Souree : Bilan dtactivités 1971 du BUMIDOM (Bureau pour le dévéloppement des Migretions Intéressant les Département a'outre | Mer). on peut interpreter cette série comme une suite dtobservations 4)T964 il y.a. eu 4532 émigrants, 44)1968 11 y a eu 7514 émigrantsetc... On diva quton a une série chronologiaue. Nous allons introduire cette notion d'une fagon plus précise et Stu¢ier ses proprietés et applications. ‘1, GENERALTYES, IL. I-Définition, os On eppelle série chronologique une série statistique dont les valeurs sont obtenues & partir dtobservations ordonnées dans le temps.Par exemple “La production annuelle de bié , =90- ~Le taux annuel dtinflation, ~La production annuelle de pétrole etc... sont des séries chronologiques. on notera une telle série Y, qui est la valeur prise par le caractére ¥ A l'instant t.Par exemple pour la série ci-dessus on a: Pour t = 1962 4 = Joos quion note ¥, t = 1963 2091 eantS + = 1971 = 965 "= Yig Une série chronologique est une fonction du temps,done peut ire repesentée graphiquement par une "courbe" (stil y a suffis- amment de points) + Pig IL Lranalyse des séries chronologiques permet de prévoir certaines variations & différents niveaux.Ce qui justifie leur utilité I, z-Mouvements des séries chronologiques. | | | | @& rend leur interét incontestable. | | ~9I- Tis. sont au nombre de quatre. T.2.IelMouvement séculaire, U1 stétend sur une période de temps assez longue.On stinté- resse beaucoup plus aux variations globales.Ceci est representé on trait interrompu sur la Fig I.I.0n parlera alors de tendance séoulaire, Exemple : Série chronologique correspondant % 1a population mondiale de I800 & 1980. 1,2, 2-Mouvement_saisonnier. Crest un mouvement pendant une période reletivement courte généralement dtune année.Dans 1a série ce mouvement correspond & des événements périodiques dtannée en année. Mxemple : Nombre de vacanciers sur les routes au mois de juiliet. 1.2.3-Mouvement cyclique, ermédiaire entre le mouvement séoulaire Ctest un cas et le mouvement saisonnier.Son étendue est généralement de 1a décennie, Exemple : Baisse de 1a production dtacier etc... 1.2, 4-Nouvement_eléatoire, Ce sont des mouvenents qui sont d0s au hasard et qu'on ne peut contréler,.Iis introduisent des"discontinuités" dans 1" évo~ lution dtun phénombne, Exemple : Tremblement de terre,gréve,resultat inattendu a" élections ete. =92+ 2. ANALYSE, Analyser une série chronologique c'est étudier les mouve- ments qui 1a composent. Nous presenterons dans ée paregraphe quelques néthodes aui nermettent de faire cette analyse. 2,IeMoyennes mobiles. On se donne une série chronologique ¥ = (yyy+++,¥y On appelle moyenne mobile dtorare k,la suite des moyennes arithmétiques + YyteeetT ear, | UsteNiae x k x TaexeT te 79N see IE = : k On remarque done que 1a moyenne mobile est constituée de N-k+T valeurs, Reprenons la série chronologique donnée par le tableau (0.0) P.89.Elle est constituée de TO termes: et donc sa moyenne mobile Gtordre 4 aura 7 termes dont le premier et le deuxiéme sont : yy, = HOO + 209 + 4532 + 7006 _ a658 Teg aera 4 2091 + 4532 + 7006 +78II —=—__Amoemrmt =F 5360 4 ees. Quand les valeurs de 1a série chronologique sont obtenues par des observations annuelles,mensuelles ou sur une période quelconque on parlera de moyenne mobile sur k années,k mois ou k périodes. =93- L'intérét de la moyeme mobile est de"régulariser" les val- eurs de la-série chronologique. 2,2-Estimation de la tendance séculaire. Si on porte le temps en abscisse et Y en ordonnée on peut representer 1e série chronologique par un ensemble de points dans le plan.On pourra done estimer la tendence en procédant & un ajustement généralement lineaire par exemple par 1a méthode des moindres carrés,notion qui a déja été introduite et étudiée au chapitre qui préctde. on peut aussi utiliser la moyemme mobile. Regardons comment on procéde conerétement sur u Reprenons le tableau (0.0) « t L 23 4 5 6 7 8 9 To (temps) a Too4 291 4532 7006 78II 7962 7514 4398 8807 9T65 (obsefvation eu temps t) Tab 2.1 Calculons le moyenne mobile dtordre 3.0m trouve une nouvelle série & 8 valeurs en remplagant cheque yy par + + * Veet 3 5 on obtient alors le tableau suivant : -94- Yen* Je Meet fab 2.2 Par exemple la premiare moyenne mobile 2542 est obtenue en faisant la some des 3 premi&res valeurs de 1a colonne 2 et en divisant ensuite par 3. Xe Fig 2.1 La courbe en trait interrompu indique la tendance séculaire obtenue & l'aide des moyennes mobiles dlordre 3. ~95- on peut remarquer que dans 1'exemple que l'on vient de treiter on eomis le premier et le dernier termes de ia série. Si on avait utilisé la définition de 1a moyenne mobile telle quielle a été donnée en 2,1 page 92 on aurait omis les deux érniéres valeurs de la série.Dans la pratique on peut prendre ltune ou l'autre des définitions de la moyenne mobile.Les deux sont pratiquement les "mémes". 2.3-Coéfficient saisomnier, on détermine le tendence séculaire & l'aide de 1a moyenne mobile ou la néthode des moindres carrés suivant le cas considéré (Gvidenment on choisira celle qui stadapte mieux au probleme). On obtient pour chaque valeur yy une valeur ajustée quton notere y® .Le goéfficient saisonnier & l'instant % est alors le rapport de 1s valeur observée yy A 1a valeur ajustée yf ve (2.2) Gre 2.4-Desaisonnalisation. On Aivise chaque observation initiele par le coéfficient saisonnier moyen 6G, (soyenne des coéfficients saisomiers de la m@ne époque caleulée sur des années différentes).Plus précisément 1a valeur deseisonnalisée y? de y, est définie par : (2.3) « -96- 3. EXERCICE RESOLU, On suppose que les livreisons trimestrielles d'une certaine marchandise de 1976 & 1960 sont données par le tableau suivant (en milliers de tonnes) : amée | 1°? 0rimestre 3 ors | genes r9"6 140 142 44 mar IST 142 rat mat 149 1978 150 150 152 152 1979 153 155 158 158 ‘7980 Teo Tos 165 166 Tab 3.1 Te-Estimer la tendance séculaire p “La méthode des moyennes mobiles, “ha méthode des moyennes échelennées (que lon va introduire). 2e-ajuster cette série chronologique par la droite des moindres carrés. 32-Galculer les coéfficie: s saisomniers. SOLUTTC I-Rappelons que 1a moyenne mobile ordre 3 est dounée par: vr + ¥o +33 Yot yy + Vy BC » Qe . 3 3 ~J18* Vist ¥20 yew 5) ~97- Dans le cas qui nous intersse ici on a N= 20, : Calculons par exemple Yzz : yz est le valeur de Y eu 3°"° ‘trimestre de l'année 1978,0n aura ainsi : Yop = 2452+ IL y50,55, 3 On rassemble tous ces calculs dans le tableau 3,2. i + % Woyenne mobile | I 140 | 2 142 3 148 4 ax 5 342 6 zat | 1 ret 8 149 9 150 To 350 im 152 12 152 B 153 4 155 ced 158 | 16 158 7 160 : Fr 163 | 19 1b5 . : 20 106 Tab 342 ~98- Pour fixer umn peu les idées tragons un graphique representant 1a série chronologique. eat (i TA 20) Pig 3.1 Les moyennes échelomnées se calculent en faisant 1a moyenne sur les quetres trimestres d'une mime année.Le calcul est aéerit ci-dessous : + Ye Moyenne échelonnée 1976 T 140 = ne 14I,75 3 148 4 T4r 1977 5 142 6 zat 146,25 7 I47 8 14g 1978 9 50 To 150 5r Ir 152 r2 152 4979 13 153 4 155 5 158 ne) To 158 1980 I7 I60 Is 163 ‘163,50 19 65 20 166 -100- 2e-Ajustement par 1a méthode des moindres carrés. Cette droite des moindres carrés @ une équation de le forme + : Yeat +b od a et b sont donnés par les formules (3.5) et (3.4) page 62, c'est A dire : v 2, te 7M 2,8 xe I (3.1) : Iei t joue le réle de X et prend les valeurs 1,...,20; b-F-ab (3.2) Nous rassemblerons les différents calculs dans le tableau (3.4). En utilisant ce tableau on calcule successivement : paeetoeteo eemeiOrs) et 2 = 110,25 20 20 3 tyy = 32785 cm 2870 En portant toutes ces valeurs dans 1'expression (3.1) on trouve : a= 1,33 et done b = ¥ - at = 151,70 - 1,33.10,5 = 137,73 . L'équation de 1a droite des moindres carrés est finalement : isst + 13773 o TO (3.3) A -101- On choisira de faire le calcul des valeurs ajustées en utilisant 1'équation (3.3).0n obtient le tableau (3.4) dans lequel on @ aussi inseré les coéfficients saisonniers Q,. t Ye tye t ve @, (en ¥) 1 sao | 140 1 139,06 2 saz | 284 4 140,39 | 3 144 432 9 141,72 4 14. | 564 a6 143,05 5 42 | 710 25 144,38 6 aa7_ | 882 36 148,71 7 1a7_| 1020 49 147,08 8 aaa | 1192 64 148,37 8 iso | 1350 at 148,70 | 10 150 | 1500 200 151,03 \ 1. 152 | 1672 121, 152,36 | 12 asa | 1824 144 153,69 | 13 153 .| 1989 169 155,02 14 ass. | 2170 196 156,35 a5 188 | 2370 225 157,68 16 iss | 2528 256 159,01 7 iso | 2720 289 160,34 1s 16s | 2034 324 161,48 a9 aes | 3135 361 163,00 20 ise | 3320 400 164,33 : Tab 3.4 On constate que les coéfficients saisonniers sont trés voisins de 1 (i.e de 100%).Ce qui signifie que 1a série chronologique étudiée est pratiquérient 1a fonction linéaire du temps donnée par (3.3). -102- CHAPTTRE VIII BXERCICES RESOLUS Dans ce chapitre nous donnons ue correction détaillée pour certains exercices ayant été proposés & différentes sessions d'examen deStatistiques de 1'Unité 01103 A l'Université de Lille III. Il est bien clair que ce chapitre ne renplira sa fonction que si 1'étudiant manifeste eu préalable sa volonté de resoudre chaque exercice avant de consulter sa solution. Session de Juin 1974. Exereice On donne 1e tableau suivant traduisant ue correspondence entre deux séries X et Y, X ] 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000} ¥ | 174 218 263 309 356 404 453 503 554 605 658 711 766 821 877 934 1°-Representer graghiquenent cette correspondance. 2e-Dites pourquoi on peut considdrer comme valable un ajustenent linéaire, 3e-Chercher la éroite d'ajustement par les moindres carrés en domnant son équation. Solution Considrons un repere constitué de deux axes réctangulaires dans lequel on portere les valeurs de X en abscisses et celles de Y en ord~ omnées,Chaque couple de valeurs (x,y) aéfinit un point dans ce repare. Par exemple le point A a pour abseisse x = 650 et pour ordomnée y = 554. On obtient 1e nuage de points suivant : -103- 1°-Representation graphique, 554, ee Tooter h 650 Fig 1.1 22-0n remarque que tous les points obtems sont presque alignés,Ceci justifie fortement un ajustement linéaire que nous allons déterminer. 3°-Ajustement par la méthode des moindres carrés, L'équation de la droite des moindres carrés est de 1a for- me: Ye aX+ deToi a = SOM) op pa T- a (Voir p62). Var(X Pour déterminer a et b il suffit done de calouler X , Var(X) et Cov(Z.¥). Rappelons. que Var(X) = et Cov(X,Y) = - EL. Nous résumons tous les calculs dans le tableau suivant : De 1a m@me maniére on a Var(X) = © =104- wx 62500 43500 g0000 65400 122500 92050 160000 123600 202500 160200 250000 202000 302500 249150 360000 301800 422500 360100 490000 423500 562500 493500 640000 568800 722500 651100 810000 738900 902500 833150 1000000 934000 Im utilisant ce tableau on trouve : 625 et Y= 537. Xr 1,01 537 - 1,01.625 = -95,81. Cov(x,¥) = XY - E.¥ =390046 -335625, 2 - ¥ = 444375 -390625 = 53750 4421. e-1'équation de 1a droite des moindres carrés : 95,81 -105- Session a'Octobre 197. Exercice, on considere le tableau : EK | x, xy wee yg X40 Bn vue d'ajuster la correspondance ainsi définie & une droite on apréparé les calculs suivants : Posent z, = x, - 50 et w=, - 70 ona obtem : Sua,--n , D098 amy Les sommes ) étant prises pour i variant de 1 20. 7153 et Y2f =0369. 1e-Calculer les moyennes de Z et W.En déduire celles de X et Y. 20-Déterminer 1'équation de la droite des moindres carrés donnant un ajustement linéaire entre X et ¥. Solution 1e-Bn utilisant le relation 2:6 p.25 avec esl on voit que : X=Z+50 et Y= W+ 70. pm oy, ons Fa Settee 2,05 of Hee = Be 1,95. Diok : K= Z+ 50 Y= -2,05 + 50 = 47,95 I +70 = 1,95 + 70 = 71,95. 20-La droite des moindres carrés a pour équation : Gov(x,¥) veered avec a =U ot oa T-ak. on sait que Var(X) = Var(K + 50) = Var(z) = 2°- 2. Done : Var(x) = 2362 - (-2,05)? = 418,45 - 4,2025 = 414,25 -106- Avant de calouler Cov(X,¥) démontrons d'abord la proposition + Si a et b sont des constantes réelles on a : Cov(X+a,¥+b)=Cov(X,Y). Bn effet ona: Cov(xea,Yeb)= (Kea) (feb) = (Kea). (Gb) or (X+8)(Y+b) = XY + bX + a¥ sab donc (Kea) (W+b)=EY + UK +e¥ sab. De 1a méne fagon on a: ira) ad) =(E +0). (F +) T+ dF + a, + abe on en déduit donc + Cov(X,¥) = X¥ - ¥.¥ = Cov(+a,Y+b)-Ce qui démontre le proposition, En appliquant cette proposition a X = Z2+ 50 et Y= W+ 70 on obtient + Cov(X,¥) = Cov(Z,W) = 2W -2.0 7153 = “397 7 (-2,05.1,95) =357,65 -3,9975 353,66. Finalement a = 233,856 20,85 et be Fo 71,95 - 0,85.47,95 clest-a-dire b = 31,01 85x + 3101 Ce qui donne 1'équation : | x a0 a

You might also like