Professional Documents
Culture Documents
Plan
IIntroduction et dfinitions
I-Introduction et dfinitions
Dfinitions : la prvision due variable est une dmarche qui consiste utiliser
des mthodes qualitatives ou quantitatives pour estimer lvolution de cette varaible dans les priodes venir. Daprs ces estimations, on planifie La prvision est tape pralable la planification La prvision vise dterminer un vnement partir du regroupement systmatique de donnes quantitatives ou qualitatives.
Etapes de la prvision
Choix dune mthode de traitement stratgique, Rassemblement des donnes et des informations appropries, Elaboration des prvisions, Rvision des prvisions en fonction dautres informations et du jugement du prvisionniste
Scientifique *dcideur Avantage : Approche statistique, utilisation de mthodes quantitatives Support informatique
Davoir une relation entre une ou plusieurs variables explicatives et une variable explique ;
Davoir
une
prvision
ne
dpendant
pas
seulement
du
comportement passe de la variable dintrt, mais aussi du comportement des autres variables ; De faire des analyses sur les effets de certaines variables sur la dintrt Les modles de rgression Le modle de rgression met en relation une variable explique avec une ou plusieurs variables explicatives, La relation peut avoir plusieurs formes : Linaire, Exponentielle, Logarithmique
Pour construire un modle on a besoin : Identifier les variables explicatives Identifier la relation entre les variables
(Formes fonctionnelle) Le modle de rgression met en relation une variable explique avec une ou plusieurs variables explicatives, La relation peut avoir plusieurs formes : Linaire, Exponentielle, Logarithmique
La rgression linaire est une mthode qui permet dtablir un modle mathmatique linaire qui exprime une variable dpendante en fonction dautres variables, dites indpendantes. On sintresse la rgression lorsque on dsire prdire la valeur dune variable connaissant la valeur dune autre variable La RLS permet de vrifier Les variables Y et X sont appeles : Y Variable explique Variable dpendante Variable endogne Variable prdite X Variable explicative Variable indpendante Variable exogne Variable prdicatrice
le modle de rgression simple scrit : Yt= A : est le terme constant du modle B : est la pente de la droite, : est une variable alatoire : rsidu ou erreur N : est la taille de lchantillon Le modle tel quil vient dtre spcifi nest quune caricature de la ralit. En effet ne retenir que X pour expliquer Y est insuffisant. Il existe une multitude dautres facteurs (variables) susceptibles dexpliquer Y cest pourquoi nous ajoutons qui synthtise lensemble des phnomnes explicatifs Y et non lis X. En fai
E quantifie les carts entre les valeurs rellement observes et les valeurs prdites par le modle . dans le modle une quation et deux variables suivant : Yt = a + BXt Et Le terme erreur (rsidu) Et regroupe : Une erreur de spcification ; le fait que la seule variable explicative nest pas suffisante pour rendre compte de la totalit du phnomne expliqu. Une erreur de fluctuation dchantillonnage : dun chantillon lautre les observations et donc les estimations sont lgrement diffrentes. (si on change dchantillon, on peut obtenir un rsultat diffrent) Ce modle est linaire car leffet X sur Y est linaire : AY = B.AX , si AE = 0 Le but est de minimiser lcart ; Pour cela, on fait appel la mthode des moindres carrs ordinaires : Lestimation par la mthode des moindres carrs ordinaires permet de dterminer la droite qui sajuste au mieux aux valeurs observes cette droite est appele droite rgression de Y en fonction de X ou droite des moindres carrs de Y en fonction de X. Ainsi cette mthode repose sur la minimisation des carrs des rsidus Ou encore la minimisation de lexpression : Les hypo H1 le modle est linaire en Xt
H2 : les valeurs Xt sont observes sans erreur H3 : lesprance de t =0 ; E[ dans ce cas le modle est bien spcifier H4 : dans ce cas la variance de lerreur est constante ont dit quon a lhomoscdasticit H5 : E[les erreurs ne sont pas convoles ou encore les erreurs sont indpendantes na pas dinflience sur les erreurs sur
Xt : est la valeur observe de la variable explicative x. Yt : est la valeur observe de la variable explicative y. ^yt : est la valeur thorique, ou ajuste ou encore calcule Et : est lerreur dajustement (ou rsidu) On montre que les coefficients et ^b de la droite de rgression de Y en X sexpriment e fonction des donnes par :
Exemple soit un chantillon de 10 observations concernant les salaris dune entreprise : Xt est le nombre dheures travailles (par salari) et Yt est la quantit de biens produits (par salari). Le directeur des ressources humaines de cette entreprise souhaite tudier la relation qui existe entre la quantit de biens produits par salari et nombre dheures travailles. Xt 10 7 10 5 8 8 6 7 9
n 1
Y 11
X 10
(Yt-Y) 1,4
(X 2 2,8 4
2 3 4 5 6 7 8 9 10
10 12 6 10 7 9 10 11 10 9,6
7 10 5 8 8 6 7 9 10 8
-1 2 -3 0 0 -2 -1 1 2
1 4 9 0 0 4 1 1 4
La droite de rgression est donc : ^Y= 0.75X+3.6 Le nombre dheures travaill agit positivement sur les quantits produites, ce qui est normal. Il y a une production de 3.6 units, qui sexpliquent par linfluence dautres variables. Le coefficient de corrlation : Sert mesurer lintensit de liaison linaire ventuelle entre deux variables. Son objectif est de quantifier la liaison entre X et Y de manire mettre en vidence le sens de la liaison et la force de la liaison.
Trois situations : Si r est proche de 1 : il y a une liaison linaire marque, et les deux variables varient dans le mme sens. Si r gal 0 : il ny a pas de liaison linaire. Si r proche de -1 : il y a une liaison linaire marque, et les deux variables varient en sens contraire.
n 1 2 3 4 5 6 7 8 9 10 Moyenne
Y 11 10 12 6 10 7 9 10 11 10 9,6
X 10 7 10 5 8 8 6 7 9 10 8
(Yt-Y) 1,4 0,4 2,4 -3,6 0,4 -2,6 -0,6 0,4 1,4 0,4
(X-^X) 2 -1 2 -3 0 0 -2 -1 1 2 somme
( 2,8 -0,4 4,8 10,8 0 0 1,2 -0,4 1,4 0,8 21 4 1 4 9 0 0 4 1 1 4 28 1,96 0,16 5,76 12,96 0,16 6,76 0,36 0,16 1,96 0,16 30,4
Coefficient de corrlation Le coefficient de dtermination (test defficacit des ajustements) Cest une mesure du pouvoir explicatif des variables explicatives par rapport la variable endogne Y. Ce coefficient dsign par est un indicateur de la qualit de lajustement ralis. Plus la valeur de est importante plus le modle est correct. On le calcule pour : Evaluer le degr dassociation entre les deux variables Juger la qualit de lajustement par la droite de rgression
B- La rgression linaire multiple Dans la rgression simple, nous avons considr une variable endogne explique par une seule variable exogne. Cependant, il est trs rare quun phnomne conomique ou social puisse etre explique par une seule variable. La rgression linaire multiple permet dtudier la relation qui peut exister entre une variable endogne et au moins deux variables exognes Le modle de rgression linaire multiple peut sexprimer sous la forme :
Yt: litres/mois Xt: temps moy Zt: Isolation 275,3 363,8 164,3 40,8 94,3 230,9 366,7 300,6 237,8 121,4 31,4 203,5 441,1 323 52,5 40 27 40 73 64 34 9 8 23 63 65 41 21 38 58 3 3 10 6 6 6 6 10 10 3 10 6 3 3 10
la
Terme constant
Coefficient de dtermination multiple Coefficient de dtermination multiple Coefficient de dtermination multiple Erreur-type observations
Estimation ponctuelle
Statistique t signification
pour
tester
la
Prvision laide de la rgression multiple Consommation moyenne dune maison qui a 6 pouces disolation dans un mois ou la temprateure moyenne est 30 ^Yt= 562.151-(5.43658)*(30)-(20.0123)*(6) ^Yt+1= 278.9789
Les moyennes mobiles sont des moyennes mises jour au fur et mesure que de nouvelles observations sont disponibles. La moyenne est calcule en utilisant seulement un certain nombre des plus rcents donnes.
Cette mthode donne un poids gal chacune des n dernires valeurs de la srie, et un poids gal zro aux valeurs observes avant.
Chaque nouvelle prvision base sur une moyenne mobile est un ajustement de la prcdente moyenne mobile.
Le choix du nombre de priodes utiliser dans le calcul de la moyenne mobile simple dpend beaucoup des variations attendues dans les donnes : en faisant la moyenne de plusieurs priodes on attnue les
EXEMPLE : nous disposons des informations suivantes concernant lvolution la demande dun produit ALPHA durant 11 mois et nous recherchons une valeur fiable de la demande pour le 12 ime mois priode J 1 Observat ion de la F 2 M 3 A 4 M 5 J 6 J 7 A 8 S 9 O 10 N 11 D 1 2 200 135 195 197 310 175 155 130 220 277 235 0 0 0 5 0 0 0 0 0 0 0
Calcul des moyennes mobiles sur mois mois Janvier Fvrier Mars Avril Mai Juin Juillet priodes 1 2 3 4 5 6 7 observations 2000 1350 1950 1975 3100 1750 1550 1767 1758 2347 2275 Moyenne mobile de 3 mois
8 9 10 11 12
priodes
observations
Moyenne mois
Moyenne mois
mobile de 3 mobile de 5 1 2 3 4 5 6 7 8 9 10 11 12 2000 1350 1950 1975 3100 1750 1550 1300 2200 2770 2350 1767 1758 2347 2275 2133 1533 1683 2000 2440 2075 2025 2065 1935 1380 1915
Moyennes mobiles simple pondres La moyenne mobile pondre permet de donner diffrents poids pour les donnes utilises dans le calcul de la moyenne. On peut de cette manire donner plus dimportance aux donnes plus rcentes afin quelles influencent davantage la prvision que les donnes plus anciennes. Note : la somme des poids utiliss droit tre gale 1. Calcul de la moyenne pondre la fin de chaque mois Mois Demande Mois 22 Mois 23 Mois 24 Mois 25 Moye mobile pondre 20 21 22 23 24 25 120 130 110 140 110 130 0.2*120 0.3*130 0.5*110 0.2*130 0.3*110 0.5*140 0.2*110 0.3*140 0.5*130 0.2*140 0.3*110 0.5*130 118 129 119 126
La mesure de lerreur Il existe cart entre les valeurs prvues et les valeurs rellement observes : le but commun toutes les techniques est de minimiser ces carts. Il est rare que lon russisse prdire exactement le phnomne tudi ( la demande par ex). lerreur de prvision est la diffrence entre la demande prvue et la demande relle. On dfinit lerreur de prvision comme tant la diffrence entre la valeur relle (observe) et la valeur prdite : Et = Ot Pt ; ou Ot reprsente lobservation pour la priode t Pt reprsente la prvision pour la mme priode t
Et : erreur de la prvision pour la Dt : demande relle de la priode t Pt : prvision de la demande qui avait t faite pour la priode t Mesure des erreurs de prvision Quatre mesures de la qualit des prvisions sont souvent utilises : 1-) MAD (Mean Absolute Deviation) : dviation absolue moyenne La dviation absolue moyenne (MAD) est la moyenne des erreurs faites par le modle de prvision sur une priode de temps, sans gard au fait que lerreur soit une surestimation ou une sous-estimation. Lquation suivante montre comment est calcule la MAD. Dt : demande relle la priode t Pt : prvision de la demande qui avait t faite pour la priode t N : nombre de priodes utilis 2-) MSE (Mean Square Error) : Moyenne du carr des erreurs : Avoir de nombreuses petites erreurs, au-dessus et en-dessous de la demande relle et qui sannulent les unes les autres, est | |
probablement le mieux que lon puisse esprer. Leffet des petites erreurs de prvision sur les oprations nest habituellement pas trs grave.
3-) MAPE (Mean Absolute Pourcentage Error) : Pourcentage derreur absolue moyen Plutt que de savoir quun modle de prvision a une erreur moyenne de 26.1 ou une moyenne de carr des erreurs de 688.3, il est parfois plus facile de se faire une ide du modle en utilisant une erreur relative. En effet, une erreur de 26.1 peut tre acceptable dans certains contextes pour une srie dont la moyenne est de 500, mais peu acceptable pour une srie de ayant comme moyenne 50. Exemple ( Prio de Observati demande Prvisi moyen ne mobile de mois 2000 1350 1950 1975 3100 1750 1550 1300 2200 2770 2350 1767 1758 3 erre ur )| Carr de lerre ur | Prvisi on moyen ne mobile de mois 5 erre ur Erreur absol ue Carr de lerre ur
Erreur absol ue
on de la on
B- Moyenne mobile double : La mthode des moyennes mobiles doubles consiste calculer au dpart un jeu de moyennes mobiles simples, et de calculer ensuite une seconde moyenne mobile base sur les valeurs de la premire moyenne mobile double. Exemple : Calculer la moyenne mobile simple sur 4 mois. Blalance dinv 1 2 3 4 5 6 7 8 9 01 11 12 140 159 136 157 173 131 177 188 154 179 180 160 148 156.25 149.25 159.5 167.25 162.5 174.5 175.25 153.25 158.062 159.625 165.937 169.875
Ou Pt : prvision au temps t . Ot : observation au temps t. Pt-1 : prvision au temps t-1 (priode antrieure) Ot-1 : observation au temps t-1
A : facteur de Pour le lissage exponentiel simple : On a besoin seulement de 3 donnes pour appliquer la mthode (il nest pas ncessaire de disposer dune longue sie) : 1) La prvision pour la priode prcdente. 2) Lobservation pour cette meme priode. 3) Facteur de pondration (coefficient) a. Si a 1 , lajustement est important Si a-0 , lajustement est faible Le facteur de pondration a , dterminer Le coeficient a prcise limportance quon donne au pass rcent par rapport au pass ancien. Il varie entre 0 et 1 Ainsi dans le cas des ventes : Plus a est proche de 0, plus il donne limportance aux ventes anciennes. Plus a est proche de 1, plus il donne limportance aux ventes rcentes. La valeur de a est gnral dtermine par lexprience. On cherche dans le pass, pour quelle valeur de a les prvisions correspondent le mieux la ralit. (le coefficient a doit minimiser la dispersion entre les valeurs Le lissage exponentiel simple attribue en gnral, au plus grand poids lobservation la plus rcente, et des poids dcroissants aux valeurs plus anciennes.
Par lissage des observations historiques on parvient liminer leur contenu alatoire et estimer une valeur de prvision Remarque : si pour la premire priode, aucune prvision ancienne nest disponible, on peut dans ce cas utiliser : a-) la dernire valeur observe ; b) une moyenne mobile ou c) une prvision qualitative. Dans le cas de la demande le lissage exponentiel simple est une autre forme de moyenne mobile pondre. A chaque priode, cette mthode ajuste la demande moyenne en proportionde la diffrence entre la dernire demande relle et la prvision correspondante : Application Utilisons les donnes cencernant la demande dun produit ALPHA . Le tableau suivant indique les valeurs calcules
Pour cest trois valeurs, la quelle choisir ? On procde lanalyse du carr moyen de lerreur et lcart absolu moyen pour comparer les rsultats des prvisions obtenues par les 3 valeurs de a : Si a est grand : plus de poids est mis sur la plus rcente donne et moins de proids sur les donnes passes ; ile rsulte une prvision qui rgit rapidement aux changements. Si a
En conclusion Pour les moyennes mobiles et lissage exponentiel, il ny a pas de rgle idale pour dterminer la pondration approprie : Dans la moyenne mobile, on doit dcider et spcifier le nombre dobservations inclure dans la moyenne. Pour le lissage exponentiel, il sagit de choisir une valeur de a. la plupart du temps, on procde exprimentalement, en essayant 2 ou 3 valeurs diffrentes pour voir laquelle, est plus appropri. B- Lissage exponentiel double : Le lissage exponentiel double fonctionne de la meme faon que les moyennes mobiles doublesn sans souffrir des ses deux limitations. Le concept de base implicitement contenu das le lissage exponentiel double est, tout fait, analogue celui La technique du lissage exponentiel double applique une srie chronologique comportant une tendance donne des rsultats fiables Donc, on utilise le lissage exponentiel double quand il y a une tendance VLes techniques simples dajustement
Pour effectuer une prvision, nous pouvons utiliser 3 mthodes diffrentes pour faire lajustement linaire, dterminer lquation de la droite et utiliser pour obtenir la prvision : La pthode des points extrmes La mthode de Mayer ou des points moyens La mthode des moindres carres avant tudi la
Considrations la socit VENDOUT qui dispose des chiffres daffaires des cinq dernires annes : Anne 1 : 2004= 600 000 Anne 2 : 2005= Elle dsir prvoir le Chifrre daffaire de lanne 6, soit lanne 2009 Pour lajustement linaire : On part du principe que les ventes voluent de manire linaire. Il est possible de trouver lquation de la droite. A laide 2004 1 600000 2005 2 605000 2006 3 610000 2007 4 625000 2008 5 630000 2009 X=6 ? ?
A- La mthode des points extrmes Cette mthode, la plus simple, consiste dterminer lquation de la droit partir de 2 points. La procdure suivre est la suivante : Relever les coordonnes des 2 points extrmes (x,y) Utiliser la formule pour dterminer le coefficient directeur de la droite
Remplacer Y , B et X par les leurs valeurs respectives pour un des 2 point extremes et ainsi trouver la valeur de a .
Etablire ue
Dans la mthode des ponts extrmes les variables retenus pour poser lquation sont le premier et le dernier point, soit dans le cas de VENDTOUT : X1 = 1(anne 1) X2 = 5 (anne 5, car cest le dernier point dont il connait le CA) Y1 = ventes de lanne 1 soit 600 000 Y2 = ventes de lanne 5 soit 630 000 Si VENDTOUT navait eu que 4 annes sa disposition : X1 = 1(anne 1) X2 = 4 (anne 4, car cest la dernier point dont il aurait connu le CA) Y1 = ventes de lanne soit 600 000 Y2 = ventes de lanne 4 soit 625 000 On soustrait les deux quations pour trouver B Y2= B*2+a=> Y1 = B*1 + a => 630 000 = 5B +a 600 000 = 1B + a 30 000 = 4B trouver a Soit B= 4 soit B=7500
Il est maintenant facile de prvoir les ventes de lanne 6 en remplaant X par 6 dans lquation dajustement soit :
B- La mthode des points moyens ou mthode de Meyer Cette deuxime mthode est proche de la premire, mais elle utilise comme points de rfrence, les points moyens de faon viter les erreurs dues des valeurs trop grandes ou trop faibles qui peuvent biaiser la tendance. Les tapes de dtermination de la droite sont les mmes que dans la Pour cette technique, les points sont partags en deux groupes et un point moyen est calcul pour chacun des deux groupes. 1- Partage des points en deux groupes Tout dpend du nombre de points dont on dispose. _ si on a 3 points : groupe 1 (2 points) = annes 1 et 2 (1point)= anne 3 _ si on a 4 points : groupe 1 (2 points) = annes 1 et 2 (1point)= anne 3 _ si on a 5 points : groupe 1 (3 points) = annes 1 et 2 (1point)= anne 3 _ si on a 6 points : groupe 1 (2 points) = annes 1 et 2 (1point)= anne 3 _ si on a 7 points : groupe 1 (2 points) = annes 1 et 2 (1point)= anne 3 Dans lexemple de la socit VENDTOUT, il y a 5 points : Groupe 1 (3 points) = annes 1, 2 et 3 ; Groupe 2 (2 points) = annes 4 et 5 2- En dduire lquation de la droite : groupe 2 groupe 2 groupe 2 groupe 2 groupe 2
=2
Y1=
600 000+
O soustrait les deux quations pour trouver B : Y2 = B*2+a=> Y1 = B*1+a 627 000 = 4.5B+a 605 000 = 2B+a Soit B =
O remplace b trouv (9 000) dans lune des deux quations Y1 ou Y2 pour trouver a soit = 587 000. Il est maintenant facile de prvoir e En conclusion : on prsente les rsultats obtenues par les trois mthodes : 1- Les moindres carrs ordinaires : lquation de la droite est : Y= 8 000 *6+590 000