These SMA

Rpublique Algrienne Dmocratique et Populaire
Ministre de l'Enseignement Suprieur et de la Recherche Scientique
niversit des ienes et de l ehnologie rouri foumediene
Facult d'lectronique et d'Informatique

Dpartement d'informatique
rojet de pin d9tudes our l9otention du diplme de wster yption X sntelligene erti(ielle hme
Conception et ralisation d'une plateforme multi-agents pour l'extraction de connaissances dans des entrepts de donnes distribus.
Propos par : Prsent par :
wme rFhse.
Soutenu le 12/06/2011 Devant le jury compos de :
wrF eseuvs o(ne wrF es grisur vyes rsident ixminteur ixminteur
M NECIR M AMANI Mme TAMEN
xfinme X HVSGPHII
Table des matires

sntrodution
I tat de l'art
S
6
I ystme multiEgent et uhh ystme multiEgent
1.1 Introduction . . . . . . . . . . . . . . . . . . . 1.2 Dnition . . . . . . . . . . . . . . . . . . . . 1.3 L'intelligence des agents . . . . . . . . . . . . 1.3.1 cognitif . . . . . . . . . . . . . . . . . . 1.3.2 ractif . . . . . . . . . . . . . . . . . . 1.4 L'interaction . . . . . . . . . . . . . . . . . . . 1.5 Communications et actes de langage . . . . . 1.5.1 actes de langages . . . . . . . . . . . . 1.5.2 Langages de communication des agents 1.6 Mthodologies . . . . . . . . . . . . . . . . . . 1.6.1 Dans quel cas utiliser l'agent . . . . . . 1.6.2 les mthodologies . . . . . . . . . . . . 1.7 FIPA . . . . . . . . . . . . . . . . . . . . . . . 1.8 Application . . . . . . . . . . . . . . . . . . . 1.9 conclusion . . . . . . . . . . . . . . . . . . . . 1.10 1.11 1.12 1.13
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
9 9 10 11 11 12 13 13 14 14 14 15 16 16 17
V W
unowledge hisovery in htses @uhhA
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dnition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . le processus du KDD . . . . . . . . . . . . . . . . . . . . . . . Taxonomie des mthodes de data mining . . . . . . . . . . . . 1.13.1 mthodes de dcouverte : . . . . . . . . . . . . . . . . . 1.13.2 mthodes de vrication . . . . . . . . . . . . . . . . . 1.13.3 supervis et non supervis . . . . . . . . . . . . . . . . 1.14 La place du data mining dans les systmes d'aide la dcision 1.15 Aspirations du domaine . . . . . . . . . . . . . . . . . . . . . 1.16 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
IV
18 18 19 20 20 21 22 22 23 23
ii P ystme disionnel et entrept de donnes
le des mtires
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Le projet dcisionnel . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 limites des systmes d'information oprationnelle(SIO) 2.2.2 Dnition . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Les entrept de donnes . . . . . . . . . . . . . . . . . . . . . 2.3.1 Dnition . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Particularit des Entrepts de donnes . . . . . . . . . 2.3.3 Objectifs des Entrepts . . . . . . . . . . . . . . . . . . 2.3.4 Les composants d'un Entrept de donnes . . . . . . . 2.3.4.1 Les applications oprationnelles sources . . . 2.3.4.2 Prparation des donnes . . . . . . . . . . . . 2.3.4.3 Prsentation des donnes . . . . . . . . . . . 2.3.4.4 Outil d'accs aux donnes . . . . . . . . . . . 2.3.5 la modlisation dimensionnel . . . . . . . . . . . . . . . 2.3.5.1 Table de faits . . . . . . . . . . . . . . . . . . 2.3.5.2 Table de dimension . . . . . . . . . . . . . . . 2.3.5.3 snowaking . . . . . . . . . . . . . . . . . . . 2.3.5.4 Matrice en bus et les dimensions conformes . 2.4 OLAP et AdHoc Querry . . . . . . . . . . . . . . . . . . . . . 2.4.1 OLAP . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1.1 Composant . . . . . . . . . . . . . . . . . . . 2.4.2 requte Ad Hoc . . . . . . . . . . . . . . . . . . . . . . 2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
PS
25 26 26 27 27 27 27 28 28 28 29 29 30 30 30 30 32 32 32 32 33 33 34
II tude de l'existant
35
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Q lteforme et tehnologie existntes
3.1 Introduction . . . . . . . . . . . . . . . . . . 3.2 Agent Mining . . . . . . . . . . . . . . . . . 3.2.1 facteur de l'mergence . . . . . . . . 3.2.1.1 Facteurs li aux agents . . . 3.2.1.2 Facteurs lis au data minig 3.2.2 Framework pour agent mining . . . . 3.2.3 Cycle de vie et Process . . . . . . . . 3.3 Application . . . . . . . . . . . . . . . . . . 3.4 plateforme et architecture existante . . . . . 3.4.1 IRF Architecture . . . . . . . . . . . 3.4.1.1 Agent Academy . . . . . . . 3.4.1.2 l'architecture externe d'IRF
QU
37 37 37 38 38 39 39 40 40 40 41 42
le des mtires
3.4.1.3 l'architecture interne d'IRF Critique . . . . . . . . . . . . . . . . Papyrus . . . . . . . . . . . . . . . . 3.4.3.1 Architecture : . . . . . . . . 3.4.3.2 Critique . . . . . . . . . . . 3.5 Conclusion . . . . . . . . . . . . . . . . . . . 3.4.2 3.4.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
iii
42 42 44 44 45 45
III Conception et modlisation de la solution
46
sntrodution R fuisness wodle
4.1 Introduction . . . . . . . . . . . . . 4.2 Le scnario . . . . . . . . . . . . . 4.3 Architecture . . . . . . . . . . . . . 4.3.1 GRC . . . . . . . . . . . . . 4.3.2 Le modle . . . . . . . . . . 4.4 Architecture du systme dcisionnel 4.4.1 Dnition . . . . . . . . . . 4.4.2 La requte . . . . . . . . . . 4.5 Technique de Data Mining . . . . . 4.5.1 C4.5 . . . . . . . . . . . . . 4.5.2 Les Paramtre : . . . . . . . 4.6 Conclusion . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
RV RW
49 49 50 50 51 55 55 55 57 57 58 58
S erhiteture du systme multiEgent
5.1 Introduction . . . . . . . . . . . . . . . . 5.2 Origines . . . . . . . . . . . . . . . . . . 5.3 Prsentation des tapes de la conception 5.3.1 Diagramme des cas d'utilisation : 5.3.2 Identication des types d'Agents : 5.3.3 Identication des responsabilits : 5.3.4 Identication des Accointances : . 5.3.5 Ranement des Agents : . . . . . 5.3.6 Le dploiement des Agents : . . . 5.3.7 rvaluation des agents : . . . . . 5.4 Interaction des agents . . . . . . . . . . . 5.5 notre architecture . . . . . . . . . . . . . 5.5.1 Diagramme des cas d'utilisation : 5.5.2 Identication des types d'agents . 5.5.3 Identication des responsabilit .
SW
59 59 60 60 61 61 61 62 62 62 62 64 64 64 65
iv
5.5.4 Identication des Aquintance : 5.5.5 Ranement des Agents : . . . 5.5.6 Le dploiement des Agents : . 5.6 Interaction et Format de message . . 5.6.1 Interaction . . . . . . . . . . . 5.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
le des mtires
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 66 68 69 69 69
T erhiteture snterne des gents
6.1 Introduction . . . . . . . . . . . . . . . 6.2 Format de messages . . . . . . . . . . . 6.3 Agent Miner . . . . . . . . . . . . . . . 6.3.1 Construction du modle . . . . 6.3.2 Modication des modles . . . . 6.4 Agent Agrgateur . . . . . . . . . . . . 6.4.1 Cration d'un modle gnrique 6.4.2 Transformation de modle . . . 6.5 Agent User . . . . . . . . . . . . . . . 6.5.1 Assimilation . . . . . . . . . . . 6.5.2 Ores . . . . . . . . . . . . . . 6.6 Conclusion . . . . . . . . . . . . . . . .
UH
70 71 72 72 73 74 74 75 76 76 76 77
gonlusion
IV Ralisation et mise en oeuvre
UV
79
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
U listion et mise en oeuvre
7.1 Introduction . . . . . . . . . 7.2 Benchmark . . . . . . . . . 7.2.1 TPC-DS . . . . . . . 7.2.1.1 Modle . . 7.2.2 Motivation . . . . . . 7.3 Exprimentation . . . . . . 7.4 Jade . . . . . . . . . . . . . 7.4.1 Motivation . . . . . . 7.5 Jess . . . . . . . . . . . . . 7.5.1 Intgration avec Jade 7.5.2 Motivation . . . . . . 7.6 SQL Server . . . . . . . . . 7.6.1 Les outils . . . . . . 7.6.2 Data Mining . . . . . 7.7 Notre Application . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
VI
81 81 81 82 83 84 85 85 86 86 86 87 87 87 87
le des mtires
7.8 Exprimentation . . . . . . . . . . . . . . . . . . . . . . . . . 7.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
v
88 89
gonlusion et erspetive filiogrphie
WH WI
Table des gures

1.1 1.2 1.3 1.4 2.1 2.2 2.3 2.4 2.5 Interaction dans les systmes multi-agents processus du kdd . . . . . . . . . . . . . . Taxonomie du KDD . . . . . . . . . . . . Systme dcisionnel . . . . . . . . . . . . . L'architecture de l'entrept de donnes Modle d'un entrept de donnes . . . Modle en ocon de neige . . . . . . . Modle avec les dimensions conformes . Exploitation des entrepts de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 19 21 23 29 31 32 33 34 39 41 43 51 55 63 64 65 66 68 71 71 73 82 83 83 84 85 86 88 88
3.1 Possibilit d'intgration et d'interaction . . . . . . . . . . . . . 3.2 Architecture d'Agent Academy . . . . . . . . . . . . . . . . . 3.3 L'architecture IRF . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Notre modle de donnes . . . . . . . . . . . . . . . . . . . . . 4.2 Notre modle de donnes . . . . . . . . . . . . . . . . . . . . . 5.1 5.2 5.3 5.4 5.5 Cheminement des tapes de notre Conception Diagrammes de cas d'utilisation . . . . . . . . Diagramme Type d'agents . . . . . . . . . . . Nouveaux Diagramme agent . . . . . . . . . . Nouveaux diagramme des agents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1 Exemple format PMML . . . . . . . . . . . . . . . . . . . . . 6.2 L'arbre de dcision . . . . . . . . . . . . . . . . . . . . . . . . 6.3 L'arbre de dcision . . . . . . . . . . . . . . . . . . . . . . . . 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 Membre du TPC . . . . . . . . . . . Tables du modle . . . . . . . . . . . Statistiques des tables . . . . . . . . Un chantillon des modles existants GUI de JADE . . . . . . . . . . . . . Jade et Jess . . . . . . . . . . . . . . Notre application . . . . . . . . . . . Notre application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Liste des tableaux

4.1 4.2 4.3 4.4 4.5 4.6 Table Client . . . . . . Table Adresse Client . Status Client . . . . . Table Date . . . . . . . Table Magasin . . . . . Table Retour-Magasin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 52 52 53 54 54 66 67 69 74 75 76 84 89
5.1 Table des responsabilit . . . . . . . . . . . . . . . . . . . . . 5.2 Table des responsabilit aprs ranement . . . . . . . . . . . 5.3 Table des Interaction . . . . . . . . . . . . . . . . . . . . . . . 6.1 Rcapitulatif pour 6.2 Rcapitulatif pour 6.3 Rcapitulatif pour
ew . . . . . . . . . . . . . . . . . . . . . . ee . . . . . . . . . . . . . . . . . . . . . . e . . . . . . . . . . . . . . . . . . . . . .
7.1 Exprimentation Benchmark . . . . . . . . . . . . . . . . . . . 7.2 Exprimentation . . . . . . . . . . . . . . . . . . . . . . . . .
Ddicaces
je ddie ce travail a toute ma famille et aux deux femmes qui ont fait de moi ce que je suis je taime maman. M BENABADJI qui restera toujours dans nos coeurs AITAKLI Soane.
je ddie ce travail a ma famille et mes amis qui ont su se montrer patients prsents et surtout souriants (smile). AITCHEIKH LYES.
Remerciements
En prsentant ce travail nous tenons exprimer notre grande gratitude notre promotrice Mme Habiba DRIAS, pour avoir accepter de nous encadrer tout au long de ce travail, pour sa disponibilit, son amabilit, ses conseils et suggestions et pour toute laide morale et matrielle quelle na cessai de nous prodiguer. Nous tenons remercier M NECIR pour lhonneur quil nous fait de prsiderai notre jury de soutenance. Nous tenons galement remercier Mme TAMEN et M AMANI pour avoir bien voulu accepter dexaminer et de juger notre modeste travail. Que tout enseignant nous ayant fait bncier de son savoir, trouve ici lexpression de notre profonde gratitude. A toute personne ayant contribu, de prs ou de loin, ce travail, nous disons merci. A toute personne nous ayant une fois fait rire, nous disons merci. Au hasard qui nous a runi, un grand merci.
Introduction
Nous sommes l're de l'information, l'information a remplac l'argent dans le capital des socits, les dcideurs doivent prendre des dcisions rapidement et ecacement pour pouvoir survivre dans la jungle qu'est le monde du buisness,ces dcisions peuvent propulser l'entreprise au devant de la scne comme elles peuvent la rduire nant.Les entrepreneurs ont remarqu que l'exprience de l'entreprise pouvait aider prendre ces dcisions vu que les situations sont parfois rcurrentes, ce qui les a pouss essayer de capitaliser leurs expriences : ceci a donn naissance aux entrepts de donnes. Stocker c'est bien mais fallait il encore trouver le moyen de les exploiter d'une manire ecace d'autant plus que ces donnes taient de l'ordre du traoctet, ceci a donn naissance au data mining pour l'entreprise comme outil d'aide la dcision, le data minig remplissait bien sa tache il classiait,trouvait des relations enfouies et aidait prendre la bonne dcision au bon moment. Cela dit avec le temps plusieurs obstacles commenaient apparaitre l'abondance des donnes obligeaient les socits distribuer leur donnes, c'est alors que s'est pos le problme de la propagation de la connaissance acquise . Ces obstacles annoncent l'entr d'une autre technologie qu'est les agents,ils ont pour mission de rendre le data mining plus exible, capable de s'adapter aux environnements distribus et d'utiliser les interactions de ses agents pour propager cette connaissance. Une chose reste voir c'est comment ces deux technologies vont pouvoir interagir pour crer une synergie capable de nous orir le systme dont rve tout preneurs de dcisions,un systme performant able et capable de s'adapter toutes les situations. C'est ce systme que nous allons essayer de prsenter tout au long de ce projet . Notre travail sera divis en quatre parties : Nous dbuterons par prsenter les dirents ingrdients dont on aura besoin tout au long du projet. Nous tudierons tout ce qui a tait fait en rapport notre problmatique . Nous prsenterons notre solution . Nous ferons un tour rapide sur les applications ainsi que le benchmark utilis pour montrer l'ecacit de notre systme
Premire partie tat de l'art
Systme multi-agent et KDD
Chapitre 1
Systme multi-agent
1.1 Introduction
Les systmes multi-agents sont un nouveau paradigme pour la conception et la ralisation de solutions informatiques. Ce paradigme a t conu et mis en oeuvre pour relever les ds qui se posent l're de l'informatique moderne.Ce qui le distingue des autres modles, tel que l'orient objet, c'est la capacit de chacun de ses composants agir sur le monde qui l'entoure et cela de manire totalement indpendante . Les systmes multi-agents comprennent des ides et techniques venant de plusieurs disciplines : calcul distribu, intelligence articielle, sociologie, psychologie, philosophie... Le foisonnement et l'interaction entre ces multiples sciences a donn naissance cette discipline avec des contours assez dicile dlimiter,d'o la cration de la FIPA 1 . Nous introduirons cette organisation qui a pour but de standardiser les dirents concepts lier aux agents ;cela dit, nous dbuterons ce chapitre par une dnition des agents, puis nous passerons aux dirents types qui coexistent dans cette discipline et leur particularit la plus intressante savoir l'interaction et la communication .
1.2 Dnition
La meilleure manire de dbuter cette partie aurait t de donner une dnition formelle des agents et des systmes multi-agents. Malheureusement il n'y a pas de dnition universellement reconnue, de ce qu' un agent est cens tre ou faire, par contre, il y a un consensus gnral sur le fait que l'autonomie est un concept fondamental des agents . Dans ce qui suit nous dressons une vue d'ensemble sur les direntes dnitions que nous pouvons rencontrer dans la littrature : Un agent est une entit qui peroit son environnement et agit sur celui-ci" (Russell 2 , 1997) Un agent est un systme informatique, situ dans un environnement, qui agit d'une faon autonome pour atteindre les objectifs pour lesquels il a t
1. Foundation for Intelligent Physical Agents. 2. Professeur a l'universit de Berceley Auteur du :"Articial Intelligence : A Modern Approach" .
IH
ghpitre IF ystme multiEgent et uhh
conu (Wooldrige et Jennings 3 , 1995). Les agents intelligents sont des entits logiciels qui ralisent des oprations la place d'un utilisateur ou d'un autre programme, avec une sorte d'indpendance ou d'autonomie. Pour faire cela, ils utilisent une sorte de connaissance ou de reprsentation des buts ou des dsirs de l'utilisateur." (L'agent selon IBM) ; Un agent est une entit qui fonctionne continuellement et de manire autonome dans un environnement ou d'autres processus se droulent et d'autres agents existent." (Shoham 4 , 1993) ; Un agent est une entit autonome, relle ou abstraite, qui est capable d'agir sur elle-mme et sur son environnement, qui dans un univers multiagents, peut communiquer avec d'autres agents dont le comportement est la consquence de ses observations, de ses connaissances et des interactions avec les autres agents (Ferber 5 , 1995). En partant de ces dnitions mises par des professionnelles du domaine , on peut identier les caractristiques suivantes pour la notion d'agent : situ :l'agent est capable d'agir et de ragir sur son environnement partir des entres qu'il reoit de ce dernier. utonome : l'agent est capable d'agir sans l'intervention d'un tiers (humain ou agent) et contrle ses propres actions ainsi que son tat interne. proEtif : l'agent doit adopter un comportement pro-actif et opportuniste, tout en tant capable de prendre l'initiative au bon moment. ple de rpondre temps :l'agent doit tre capable de percevoir son environnement et d'laborer une rponse dans le temps requis ; soil : l'agent doit tre capable d'interagir avec d'autres agents (logiciels ou humains) an d'accomplir des taches ou aider ces agents accomplir les leurs.
1.3 L'intelligence des agents

Dans le vaste domaine des agents il y a deux faon de voir et de concevoir les agents, selon le but que nous voudrions atteindre :
3. Chercheurs dans le domaine de l'IA et spcialiste de la discipline agents. 4. Professeur a l'universit de Stanford . 5. Chercheur au LIRMMonpelier en Intelligence Articielle et en Intelligence Collective (Systmes multi-agents)
IFQF v9intelligene des gents

1.3.1 cognitif
II
L'approche traditionnelle pour construire des systmes articiellement intelligents, connue comme L'IA Symbolique,suggre que les comportements intelligents peuvent tre gnrs dans un systme en donnant ce dernier une reprsentation symbolique de son environnement, du comportement dsir et d'une manipulation de cette reprsentation [Wooldridge 09]. Les agents cognitifs s'inscrivent dans cette approche. Ils sont caractriss par une reprsentation des connaissances sous forme symbolique et par des notion mentale (telles que la connaissance, les croyances ...). L'agent utilisera cette reprsentation symbolique qui est un ensemble de formules logiques, pour faire un travail de dduction[Wooldridge 09]. En terme de fonctionnalit ce type d'agent une reprsentation symbolique et partielle de son environnement et des buts spciques. Ils sont capables de planier leur comportement, mmoriser leurs actions passes, communiquer par envoi de messages, ngocier, etc.
1.3.2 ractif
L'approche traditionnelle, pour construire des agents, fait face certaines limitations tel que la faiblesse du langage de reprsentation de notre logique. Cela ne permettra pas de construire des agents qui pourrait rpondre toutes les attentes de leur concepteur notamment dans des environnement contrainte de temps. Une nouvelle approche a vu le jour au milieux des annes 1980. Elle se caractrise par un rejet de l'IA symbolique[Wooldridge 09]. Cette approche est bas sur trois ides principales : Le rejet de la reprsentation symbolique et de la prise de dcision base sur la manipulation de cette reprsentation. L'intelligence n'est pas incorpor mais est le produit de l'interaction que les agents maintiennent avec leur environnement. Le comportement intelligence jaillit de l'interaction de comportement tout fait simple.[Wooldridge 09] Ce type d'agent est gnralement quali de pas intelligents , il n'a donc pas de capacit mental. Ses capacits rpondent uniquement au mode stimulus/action qui peut tre considr comme une forme de communication. Un systme multi-agents ractif est gnralement compos d'un grand nombre d'agents. l'intelligence merge de l'interaction de ces agents entre eux ,on dit que leur intelligence est distribue.
IP
1.4 L'interaction
Jusqu'ici nous avons mis l'accent sur les direntes faons de voir et de concevoir un agent isol mais une de leur proprit incontournable est leur capacit interagir en groupe ou avec le monde extrieur(l'environnement). Cette interaction est dnie comme toute action qui se droule dans le systme d'agents et qui a pour eet de modier le comportement d'un autre agent[Bellifemine 07]. En gnral, les interactions sont mises en oeuvre soit par un transfert d'information entre les agents ou entre l'agent et l'environnement, soit par sa perception La gure ci dessous [Wooldridge 09] montre une structure gnrique des diffrentes interaction que l'on peut rencontrer dans un systme multi-agent.
Figure 1.1 Interaction dans les systmes multi-agents

Comme nous pouvons voir sur cette gure chaque agent peut interagir avec d'autre agents qui sont dans son groupe. Chacun d'entre eux a une sphre d'inuence, qui concide avec l'environnement ou une partie de ce dernier, sur laquelle il peut avoir un certain contrle. Plusieurs thories ont t utilis pour modliser l'interaction de ces agents selon le type de cette dernire(Agent coopratif ,concurrents) tel que l9quilire de xh,le dilemme du prisonnier qui sont issus de domaine mathma-
IFSF gommunitions et tes de lngge

tique.
IQ
1.5 Communications et actes de langage

Depuis le tout dbut de l'informatique, la communication a t identie comme un axe central de recherche et de dveloppement. Cela est d'autant plus vrai que les systmes multi-agents sont un paradigme qui convient trs bien aux problmes caractre distribu, ce qui implique une grande capacit de communication et d'change d'information. Plusieurs formalisme ont t conus et mis en place comme l'invocation de mthode dans le modle objet. L'importance de la communication rside dans le fait que tout comportement social mane indniablement de la capacit de ses individus communiquer. L'envoi de messages est le seul moyen pour qu'un agent inuence un autre (niveaux d'abstraction plus important que dans les systmes objet).
1.5.1 actes de langages

la thorie des actes de langages est une thorie de communication fond dans les annes 60 par le philosophe J.L.Austin, qui selon lui parler(communiquer) c'est changer l'tat des choses, autrement dit cela quivaut une action physique qui inue sur l'tat mental des choses. Les actes de langage bien dnis sont trait comme des actes physiques(Cohen and Perrault 6 , 1979) J.L. Austin s'est intress aux dirents types d'actes de langage que constituent les actions intentionnelles eectues au cours d'une communication. Il distingue trois types d'actes de langage : actes locutoires, actes illocutoires et actes perlocutoires. ves tes loutoires se rapportent la formulation d'un nonc. Ces actes sont satisfaits lorsque l'nonc est correctement formul. ves tes illoutoires dsignent l'action eectue sur l'auditeur lors de la formulation de l'nonc (e.g., donner un ordre, poser une question). ves tes perloutoires rapportent aux consquences indirectes vises par les actes locutoires et illocutoires. Ils ne sont pas cods dans l'nonc et dpendent du contexte dans lequel s'eectue la communication. Ils sont satisfaits lorsqu'ils sont reconnus par l'auditeur (e.g. convaincre, faire croire, etc.).
6. C. Raymond Perrault et Philip R. Cohen Dept. d'informatique Universit de Toronto
IR
1.5.2 Langages de communication des agents

Dans le dbut des annes 90 le "US-based DARPA-funded Knowledge Sharing Eort"(KSE) a tait fond pour la conception et le dveloppement de protocoles d'change de connaissance sous forme symbolique(reprsentation de connaissance )pour des systmes autonome le KSE a eu pour rsultat 2 principaux langages : he unowledge uery nd wnipultion vnguge @uwvA :qui est un langage et un protocole de communication de haut niveau qui permet l'change de messages sans se proccuper du contenu (Patil et al., 1992 ; Mayeld et al., 1996). he unowledge snterhnge pormt @uspA : qui est un langage qui a t spciquement conu pour permettre la reprsentation des connaissances ,il a t conu au dpart pour tre une description des messages de uwv.
pse a cre un standard de langage de communication agent egv @egent gommunition vngugeA : elle dnit une vingtaine de
La performative (tel que "inform")pour instruire sur le contenu du message. Elle ne contraint pas l'utilisation d'un certain langage dans le contenu et ressemble au @uwvA dans sa syntaxe.
1.6 Mthodologies
Le paradigme agent suit dans son volution celui de la yy. L'agent est dans une priode faste o il doit mettre en oeuvre des mthodologies pour son expansion d'un paradigme exprimental vers une technologie plus pratique. Qui dit pratique dit mis en oeuvre d'application industrielle, cela induit un processus de conception d'agents ecace et rentable. Dans ce qui suit nous verrons les dirents cas d'utilisation du paradigme d'agent ainsi que les direntes mthodologies les plus utilises pour concevoir ces systme base d'agents. Mais tout d'abord, nous devons identier les dirents cas et scnarios dans lesquels une solution base d'agents est la plus adquate. Ceci est le prambule pour chaque situation o une solution base d'agent est envisag :
1.6.1 Dans quel cas utiliser l'agent

Il n'y a malheureusement pas de rgle spcique qui dicte l'utilisation du paradigme agent, nanmoins fort de l'exprimentation, des chercheurs ont reconnu certains domaines o l'utilisation de l'agent est trs souhaitable et o il a montr une grande ecacit :
IFTF wthodologies l9environnement est ouvert omplexe ou inertin
IS
:dans ce genre d'environnement les agents sont les plus appropris car capable de dcision exible et autonome les gents sont une mtphore nturelle :plusieurs environnement sont de nature organisationnel avec des interaction qui ressemblent celles des humains (le commerce et les environnements comptitifs). Ces derniers sont diciles voir impossible mettre en oeuvre avec les paradigmes existants . l distriution des donnes :dans le domaine informatique la centralisation d'une solution est tout simplement inimaginable. Le paradigme agent est tout a fait convenable pour les problme a caractre distribu. les systmes onventionnels :la plupart des systmes informatiques tournent grce des solutions dont la technologie est obsolte, il est donc dicile de mettre en oeuvre une solution base d'agent dans un tel environnement.
1.6.2 les mthodologies

Il y a quatre phases fondamentales dans le cycle de vie de dveloppement d'un logiciel : plni(tion,nlyse ,oneption ,implmenttion. Les systmes multi-agents ne font pas exception cette rgle, il est toujours utile d'avoir une ligne directrice suivre pour progresser dans ces phases. Ceci est le but des mthodologies, elles permettent d'conomiser du temps et de l'eort en regroupant les tapes essentielles que le concepteur devra suivre tout en vitant de tomber dans des problme de conception bien connues. Parmi les mthodologies les plus connues nous citerons :
the eess methodology @uinny et lA X qui a t dvelopp par l'Australian AI Institute. Il est l'un des premiers qui a mis en oeuvre le paradigme royneEdesireEintention. Il a t utilis dans la conception de
logiciel pour la gestion du trac arien.[Sellers 05] cette mthodologie permet, partir de simples spcications, de crer un modle de grande precision. Ce dernier sera directement utilis lors de l'implmentation ;[Sellers 05]
qi @ooldridge et lA X
tde methodology X cette approche combine deux approches dite op hown ET hown op
Nous dtaillerons cette dernire un peu loin[Sellers 05].
IT
1.7 FIPA
Une collaboration internationale, constitu d'organisations universitaires et industrielles sous l'gide de la FIPA (Foundation for Intelligent Physical Agents), a permis de spcier des standards dans la technologie agent qui vise favoriser l'interoprabilit des applications, des services et des quipements informatiques bass sur le paradigme agent. Parmi les standards qu'elle a dnit, nous trouvons les protocoles d'interactions suivants : pseEequest X c'est le protocole de base de touts les protocoles, il permet a un agent de faire une demande a un autre agent[Bellifemine 07]. pseEgontrt xet X Permet l'initiateur d'envoyer un appel d'ore un ensemble d'agents. Seuls ceux qui respectent certaines conditions pourront soumettre leur ore. L'initiateur pourra choisir un ou plusieurs agents selon ses besoins[Bellifemine 07]. pseEusrier X L'initiateur devra envoyer un message pour pouvoir s'inscrire dans une sorte de mailing liste. Chaque fois que l'agent cible aura rempli certaines conditions, il enverra un message tous les agents qui se sont inscrit dans la mailing liste[Bellifemine 07]. Elle a dnit des standards pour les comportements qui ont la responsabilit de grer les direntes taches des agents ynehot fehviour X les taches qui sont grer par ce comportement ne seront excut qu'une seul fois . iker fehvuour X les taches qui sont grer par ce comportement seront excut a des intervalles de temps dnie. gyli fehvuour X les taches qui sont grer par ce comportement seront sans interruption et de faon rcurrente.
1.8 Application
La technologie des agents est en train de s'implanter dans divers domaines o les systmes conventionnels ont montr leurs limites ou dans lesquelles les agents ont montr une ecacit sans prcdent. Souvent, ce sont des domaines assez critiques ou ouverts avec une complexit norme. Nous pouvons citer certains exemples : les gents et les rseux de pteur Xce sont des micro-capteurs capables de rcolter et de transmettre des donnes environnementales d'une manire autonome. Cela convient tout fait aux systmes multi-agent qui voluent bien dans un environnement distribu
les gents pour l reherhe d9informtion X
Notre re est l're de
IFWF onlusion
IU
l'information. Des sources de donnes presque innies sont notre disposition et les agents sont tout fait adquats pour les exploiter et grer cette information. La technologie agent est la plus adquate pour cette mthode car l'information est distribue et parpille (Internet) l'intrt pour la gestion la gestion du workow ne cessent d'augmenter dans l'informatique moderne,automatiser le process d'un business est devenue ncessaire, Un systme multi-agent nomm ADEPT a tait conue pour le workow, il modlise une socit d'change et de ngociation
les gents pour le work)ow et le uisness mngement proess X
1.9 conclusion
Ce chapitre n'tait qu'une bauche d'ides et de principes concernant la technologie des agents. Nous avons tudi d'abord les agents en tant qu'entits et vu qu'il n'existait pas d'agent isol. Ainsi nous avons vu les systmes multi-agent et leurs proprits qui est l'interaction. Nous avons omis de mentionner les technologies existantes pour les systme multi-agents car chacune a une vision bien particulire des dirents concepts prsents plus hauts. Les SMA ont atteint une certaine maturit qui leur permet de combiner leur comptence avec d'autres technologies comme nous l'avons signal. Particulirement les agent cognitif utilisent la dduction pour faire face aux obstacles. Une autre possibilit est l'utilisation de l'induction qui est reprsent par la discipline prsent dans le chapitre suivant le Data Mining
Knowledge Discovery in Databases (KDD)

1.10 Introduction
La convergence de l'information et de la communication a produit des socits qui ont un apptit insatiable de l'information. Des ponts entier de leur vies quotidiennes dpendent de cette dernire. D'un autre cot et l'heure o nous parlons, nous sommes submergs par les donnes et cela va en augmentant exponentiellement. L'omniprsence des machines personnelles n'attnue pas le phnomne bien au contraire. La sauvegarde des informations est devenue aussi simple qu'un simple clic. Cette facilit n'a d'quivalent que la dicult de l'exploitation de ces donnes,qui sont encore sous forme de simple enregistrements bruts inutilisables. C'est l'existence de donnes qui n'informent pas qui est la principale raison de l'mergence du KDD et du data mining. Dans ce qui suit, nous allons dnir le KDD puis nous passerons au data mining qui est le coeur de ce processus. Ensuite, nous donnerons les dirents type de data mining avec une vue d'ensemble sur les algorithmes les plus populaires .
1.11 Dnition
"Le Knowledge Discovery in Databases (KDD) est l'analyse exploratoire et la modlisation de larges entrepts de donnes.Le KDD est le processus d'identication de modle qui soit valide,indit,utile et comprhensif et cela partir de large et complexe sources de donnes[Witten 05] ; Le data mining est le coeur de ce processus et cela par l'utilisation des dirents algorithmes qui explorent les ensembles de donnes et qui construisent les dirents modles, qui sont ensuite utiliss pour l'assimilation de phnomnes mergents ainsi qu' son analyse et sa prdiction[Maimon 10] De ces dnitions assez austre nous pouvons dduire plusieurs points assez intressants et qui nous aiderons poser les bases de cette technologie : le KDD et le data mining sont complmentaires, ils ont un but commun :transformer les donnes en connaissances le KDD est un ensemble d'tapes qui pour but la construction de modles qui nous aiderons mieux comprendre nos donnes .
IFIPF le proessus du uhh
IW
le data mining est l'une de ces tapes, il a un rle crucial car c'est grce ses algorithmes que l'on peut construit ces fameux modles.
1.12 le processus du KDD

Le processus de dcouverte de connaissances est la fois itrative et interactive. itrative car nous pouvons nous dplacer dans les direntes tapes et revenir vers les tapes prcdentes si cela est ncessaire. Interactive dans le sens o certaines tapes peuvent tre inuences par d'autre . Ce processus est construit en 9 tapes. Certains conoivent ce processus comme une oeuvre artistique car il n'y a point de formule pour mener bien l'extraction de connaissances, ce qui nous contraint avoir une bonne maitrise des dirents outils qui entrent dans ce processus . Dans ce qui suit nous prsentons une brve introduction pour chaque tape :
Figure 1.2 processus du kdd

rir une comprhension du domaine d'application ainsi que les connaissances pertinentes pralables. grer un ensemle de donnes iles @utA X Slectionnez un ensemble de donnes sur lequel sera eectue l'apprentissage, dans le cas ou les donnes seraient trop grandes il faudra se concentrer sur un sous-ensemble de variables ou des chantillons de donnes pour y eectuer la recherche xettoyer et prEtriter les donnes X An de pallier ou minimiser les erreurs, on tentera d'eectuer certaines taches : suppression du bruit dans les
sdenti(er les ojetifs du proessus du uhh X Dvelopper ou acqu-
PH
donnes, traiter les champs de donnes manquantes, tenir compte des informations sur les squences temporel et les changements connus rduire et projeter les donnes X Trouver des outils utiles pour reprsenter les donnes, en fonction de l'objectif de la tache et ce an de rduire leur taille et en avoir une meilleure apprciation. identi(er une mthode de dt mining X Faire correspondre les objectifs du processus KDD une mthode de datamining particulire et qui serait la plus apte nous donner des rsultats optimaux, par exemple : classication, rgression, clustering, etc. hoix d9un lgorithme de dtmining X Choix de la ou des mthodes utiliser pour la recherche de modle dans les donnes parmi les algorithmes les plus connus et ayant dj fait leur preuves. ppliquer le dtmining X Appliquer la techniques ainsi que l'algorithme choisi dans l'tape prcdente sur notre base de test vluer les rsultts du dtmining X Interprter les modles explors selon le rsultat obtenus tout en possdant toujours la possibilit de revenir aux tapes 1-7 pour plus d'itration. onsolider les onnissnes douvertes X Intgrer ces connaissances dans un autre systme pour des actions supplmentaires, ou simplement le documenter et le rapporter aux parties intresses.
1.13 Taxonomie des mthodes de data mining

Les domaines sur lesquelles le data mining peut tre appliqu sont aussi vari que les direntes techniques qui le compose, les bases de donnes ,les entrepts de donnes et l'internet sont autant de plateforme ou le data mining peut appliquer ses algorithmes et construire ses modles. L'abondance de ces techniques peut parfois porter confusion, pour y remdier nous utiliserons la taxonomie de ces techniques tir du livre rfrence de Oded Maimon and Lior Rokach pour prsenter une certaine classication qui nous aidera a mieux cerner ces algorithmes Comme nous pouvons le voir sur la gure ci dessous nous avons :
1.13.1 mthodes de dcouverte :

qui englobe les mthodes qui identient les schmas dans les donnes. Cette mthode se scinde en deux branches :la branche descriptive et la branche prdictive
IFIQF xonomie des mthodes de dt mining
PI
Figure 1.3 Taxonomie du KDD

des donnes , de leur positionnement ainsi que leur rpartition dans l'espace d'hypothse[Witten 05]. wthode prditive X aspire construire des modles comportementaux qui peuvent nous gnrer des chantillons, ces chantillons n'appartiennent aucunement aux donnes existantes. La plupart de ces mthodes usent de l'approche inductive o le modle est construit partir d'un ensemble assez reprsentatif de la population existante et gnralisent leurs direntes proprits[Witten 05] ;
wthode desriptive X cette mthode est oriente vers l'interprtation
1.13.2 mthodes de vrication

D'un autre cot ,nous avons ces mthodes qui ont pour but la vrication et l'valuation d'une hypothse d'origine externe (donn par un expert par exemple). Ces mthodes incluent les mthodes statistiques les plus communes :le test d'adquation, les tests d'hypothse et ANOVA[Witten 05].
PP
1.13.3 supervis et non supervis

Une autre appellation est utilise par la communaut de l'apprentissage pour classier ces mthodes : les mthodes supervises pour dcrire les mthodes prdictives, et les non supervises pour modliser les instances dans l'espace, avec les paramtres comme axes[Witten 05]. relations entre les paramtres en entres(appeles variables indpendantes ) et le paramtre en sortie(variable dpendante). Il faut distinguer entre deux principales branches de cette technique, les modles de classication et les modles de rgression. la rgression a pour but de relier les donnes en entr vers un domaines de relles, alors que la classication relie les donnes en entre des classes prcdemment dnit. Nous retrouvons dans la classication plusieurs techniques telles que les arbres de dcisions les rseaux baysiens ... mthodes non supervis Xce terme se rfre a des techniques qui regroupes les instances d'un problme en cluster sans pour autant prdnir les classes, ces mthodes couvre une partie des techniques de description que nous avons vu sur la gure tel que le clustering.
mthodes supervises X ces mthodes sont utilises an de trouver des
1.14 La place du data mining dans les systmes d'aide la dcision

Le data mining est devenu incontournable dans le domaine du dcisionnel, il est de plus en plus intgr aux logiciels traitant les grandes masses de donnes (oracle 11g,Microsoft SQL Server ) une architecture trois tiers tait de mise La premire couche reprsente les direntes sources de donnes, la suivante est le data warehouse puis les outils servant analyser. C'est l o nous trouvons le data mining. Nous verrons dans un prochain chapitre une architecture plus spcique. Avoir le data mining intgr est d'une grande utilit car cela permet de faciliter le reste du processus de KDD, qui reprsente la plus grande part de complexit temporelle.
IFISF espirtions du domine
PQ
Figure 1.4 Systme dcisionnel
1.15 Aspirations du domaine etive dt mining X Les nouvelles informations qui rsulteront partir du KDD seront automatiquement appliques aux systmes. ves mtElgorithme X Des algorithmes qui pourront nous informer sur la
ou les techniques les plus adquates utiliser pour un ensemble de donnes en particulier. xonomie pour les neufs tpes X Nous avons vu tout l'heure la taxonomie des techniques de data mining. Une telle taxonomie pour chacune des neuf tapes serait un bon en avant dans la rsolution de la complexit de cette dernire. ve dt mining distriu X on ne peut imaginer une gigantesque source de donnes qui serait centralise le data mining dans un environnement dcentralise est une ncessit. grtristique du prolme X tude au pralable de l'utilit de l'utilisation d'une technique de data mining.
1.16 Conclusion
Nous avons essay dans ce qui a prcd, de donner une vue d'ensemble sur le processus d'extraction de connaissances tout en dnissant son outil le plus crucial le data mining. Nous avons prfr ne pas inclure des interactions avec des d'autres disciplines qui auraient un lien avec notre problmatique car elles seront traites dans les prochains chapitres. Nous avons aussi vu l'architecture trois tiers du systme dcisionnel. Nous allons dans le chapitre suivant d-
PR
cortiquer ce systme pour mieux comprendre l'utilit de l'application du Data Mining sur les plateformes prcdemment mentionnes.
Systme dcisionnel et entrept de donnes

2.1 Introduction
Les systmes d'information ont connus ces 20 dernires annes direntes innovations et changements aussi bien au niveau des infrastructures(clientserveur,internet/intranet) que celui des outils(relationnel,langages de quatrime gnration ,objet). Le data warehouse ne s'inscrit pas dans cette squence mais dans une philosophie bien prcise :passer de systmes qui automatise la consommation de l'information vers des systmes qui informent, c'est dans ce contexte qu'est n le terme d'information dcisionnel,formalis au dbut des anne 1990. Le concept d'entrept de donnes est devenu la pice maitresse de ce que nous appelons dornavant les systmes dcisionnels. L'industrie du data warehouse a incontestablement chang depuis que Ralph Kimball a publi son ouvrage "Entrepts de Donnes" notamment en ce qui concerne la modlisation dimensionnelle. Les premiers avoir utilis ce concept sont les grandes entreprises puis cette pratique s'est dmocratise. Elle a tait propage vers des entreprises de divers niveaux. Jours aprs jours des millier de traoctets sont stocks dans ces structures,ce qui engendre une complexit spatiale normes , mais la tache la plus ardue et qui reprsente tout l'intrt de la construction et du dploiement d'entrept de donnes est l'accs et l'analyse des direntes donnes prsentes sur cette plateforme, ces analyses participent aux processus de prises de dcisions dans les entreprises et constituent le fer de lance des quipes de marketing pour tudier et mettre en oeuvre des stratgie et ainsi rentabiliser l'investissement de l'entreprise.// Ce chapitre a pour vocation d'introduire les entrepts de donnes et leurs notions fondamentales. Nous essayerons d'abord de lever la confusion faite sur plusieurs termes dans ce domaine , nous porterons une attention particulire au volet analyse des donnes et pour ce faire ce chapitre est divis en 2 sections principales : ves ystmes hisionnels X nous donnerons quelques dnitions les concernant ainsi que le rle qu'ils jouent dans une entreprise . ves entrepts de donnes X nous introduirons le concept et ses compo-
Chapitre 2
PT
ghpitre PF ystme disionnel et entrept de donnes
sants ainsi qu'une vue d'ensemble sur les direntes faon de modliser et de l'exploiter .
2.2 Le projet dcisionnel

2.2.1 limites des systmes d'information oprationnelle(SIO)
Nous ne pouvons dnir les systmes dcisionnels sans parler des limitations auxquels ont tait confronts les systmes d'information dit oprationnel. Ces limites sont les suivantes : l'existence de systmes d'information qui n'informent pas est le rsultat d'une automatisation du traitement de donnes application par application , sans cohrence globale,sans vritable intgration. Ceci a engendr des problmes tel que : une htrognit des formats de donnes et des chier changs entre les diffrents acteurs au sein de l'entreprise. Les connexions entre applications sont faites point point sans une planication d'ensemble, ce qui implique la cration d'interdpendance et de chier temporaire considrable Les copies physiques de chiers de donnes entre applications gnrent une forte redondance, ce qui rend quasiment impossible toute possibilit de mettre jour l'information la cohrence entre deux application n'est rtablie que priodiquement ce qui veut dire qu' un instant quelconque notre systmes d'information est globalement incohrent// Les donnes utilises et produites dans de telles conditions comportent des caractristiques assez contraignantes pour un usage dcisionnel ,nous pouvons citer d'hors et dj quelque unes Elles retent directement les ux et les stocks oprationnels de l'organisation,chacune d'elles tant une grandeur qui ne se conoit qu'en rapport avec un traitement lmentaire spcique et donc ne peuvent faire partie d'un processus d'analyse qu'aux prix d'opration de pre-traitement . Chaque fonction du SI ayant t conue de faon isole, la smantique et la codication varient considrablement, l'htrognit des quipements informatiques (matriels et logiciel) aggrave cette situation et nous ne pouvons estimer le temps et l'ecacit d'un processus qui impliquerai plusieurs fonction du SI. Les donnes ne concernent que le fonctionnement elle ne dcrivent pas les
PFQF ves entrept de donnes
PU
donnes, le SI n'est donc pas en mesure de fournir une aide aux stratgies d'adaptation cet environnement les donne du SI ont une forme ge et sont exclusivement destines tre traites par des procdures prdtermines.
2.2.2 Dnition
Un systme d'information dcisionnel est,par essence et par dnition,un outil destin recueillir, organiser, mettre en forme et diuser des donnes de manire en faire des informations.Sa conception repose avant tout sur des modles de donnes[Rabah 09] Un systme dcisionnel est un systme d'information ddi aux applications dcisionnelles,il regroupe un ensemble d'information et d'outil mis la disposition des dcideurs pour supporter de manire ecace la prise de dcision[Gouarne 98]. Elle se distingue par des caractristiques qui sont Un systme d'information dcisionnel qui est la fois spar du point de vue conception et applications et dpendant pour son alimentation . L'information dcisionnelle est indpendante des structures et des procdures courantes de la production (elle est oriente sujet ). L'information dcisionnelle est chronologique, elle est utilise des buts d'analyse de phnomne voluant dans le temps,ce facteur est essentiel mais contribue la complexit du systme.
2.3 Les entrept de donnes

2.3.1 Dnition
Un entrept de donnes peut tre dni comme une collection de donnes intgres ,orientes sujet ,non volatile ,et disponible pour l'interrogation et l'analyse, les entrepts de donnes ne sont pas de simple bases de donne d'enregistrements des transactions journalires ,leur mise en oeuvre suit un schma et un modle bien prcis. Ils se distinguent par des particularits indites aux bases de donnes que nous verrons dans la suite[Kimball 02] ;
2.3.2 Particularit des Entrepts de donnes

comme nous l'avons soulign plus haut les donnes contenues doivent dcrire un sujet particulier non le processus en lui mme,l'entrept de donnes est construit autour de ce sujet .
yrient sujet X
PV
sntgres X elle se propose de rsoudre le problme d'htrognit des donnes (logiciel et matriel). honnes histories X un rfrentiel temps doit tre attribu aux donnes pour donner un sens leur utilisation dans l'entrept. honnes non voltile X les donnes ne peuvent tre mise a jour la seul
opration permise est l'ajout .
2.3.3 Objectifs des Entrepts

Pour complter notre dnition nous prsentons quelques objectifs que les entrepts de donnes aspirent atteindre v9entrept de donnes doit rendre les donnes de l9orgnistion filement essile :son contenu doit tre facile comprendre les donnes doivent tre tiquetes pour que leur lectures et leur signications soient videntes .
v9entrept de donnes doit prsenter l9informtion de l9orgnistion de mnire ohrente : les donnes doivent tre crdibles, elle ne seront publies qu'aprs avoir vri leur qualit. v9entrept de donnes doit tre dptle et rsistnt ux hnE gement X les changements dans une entreprise sont invitables et cela se
rpercute sur l'entrept ,les changements eectus ne doivent pas porter atteinte la validit des donnes dj stockes .
est la cl de voute des systmes d'aide la dcision
l9entrept doit tre le sole sur lequel repose l9mliortion des prises de dision X C'est l'un des objectifs les plus critiques des entrepts,il
2.3.4 Les composants d'un Entrept de donnes

L'environnement du Data Wareheouse est constitu de 4 lments fondamentaux nous allons les survoler en tachant de souligner leur rle et leur importance
PFQFRFI ves pplitions oprtionnelles soures

Ce sont les applications qui enregistrent les transactions qui se produisent au niveaux de l'organisation, ils se distinguent d'une faible capacit d'historisation. Elles sont construites de faon verticale(autour d'un processus) sans se soucier des processus entourant ce dernier.
PW
Figure 2.1 L'architecture de l'entrept de donnes
PFQFRFP rprtion des donnes

Cette zone est utilise la fois comme une plateforme de stockage et d'excution du processus ig. L'extraction est la premire tape de ce processus : on lit et on copie les donnes depuis les applications sources. Une fois dans la zone de prparation elles subissent une rnsformtion des modication sont apportes tel que :la correction orthographique ou la rsolution de noms de domaine puis ces donnes corriges sont charges vers la zone de prsentation . cette zone ne peut tre accessible aux utilisateurs et leur requtes car les donnes ne sont pas dans un format qui soit apte a tre utiliser
PFQFRFQ rsenttion des donnes

La zone de prsentation est le lieux ou les donnes sont organises stockes et oertes aux requtes directes des utilisateurs[Gouarne 98]. les donnes doivent tre prsentes et stockes sous forme dimensionnelle pour amliorer l'intelligibilit et la performance des requtes ainsi que l'aptitude s'adapter au changement . l'entrept doit contenir des donnes atomiques pour faire face aux direntes requtes des utilisateurs .
QH
PFQFRFR yutil d9s ux donnes

L'un des composants le plus critique dans un entrept de donnes est l'ensemble des outils qui permettent un accs et une exploitations des donnes contenues dans cet entrept
2.3.5 la modlisation dimensionnel

La modlisation dimensionnelle comme nous l'avons signal tout l'heure est une solution au schma excessivement complexe dans la zone de prsentation. Un modle dimensionnel contient les mmes informations qu'un modle relationnel, mais une dirence fondamentale se pose au niveau technique , car la performance des transactions et la sauvegarde de l'intgrit rfrentielle sont autant d'lments autour desquels,la modlisation des SIO se base,et cela s'eectue par une normalisation systmique(3 eme forme normal et dpendance fonctionnelle) et il en rsulte des schma de donnes semblables des autoroutes entremles,ce qui est loin d'tre l'objectif des data warehouse qui elle est bas sur les performances des requtes d'interrogation et de la simplicit d'assimilation des modles,ce modle est constitu de deux types de tables
PFQFSFI le de fits
Chaque table de fait contient des mesures en relation avec le Buisness Process comme la prise de commande ou la gestion du stock ,chaque enregistrement dans cette table reprsente une mesure ,ces mesures quantie la magnitude de ce Process, de ce fait ces mesures sont quasi exclusivement numrique comme le prix de la commande ou la quantit restante dans un stock,et ils sont pour la plupart additive car les traitements se font au niveaux de ces quantit mesurable en leur appliquant des oprations ensembliste ,par exemple acher les gains engrang en un an en auditionnant les direntes prix des commandes sur une anne ve grin X Une notion importante plus le grain est petit plus on peut adresser des requte plus exible il reprsente la precision de nos donnes ou l'chelle ,si nous sommes dans un contexte temporelle le grain peut tre prsent comme le mois ou le jour le grain dans une table de fait doit tre le mme.
PFQFSFP le de dimension
Les tables de dimension sont les points d'entres dans la table de faits.Des attributs de dimension nombreux permettent de varier les possibilits d'ana-
QI
lyse ,Les dimensions tablissent l'interface Homme/Modle[Kimball 02]. les dimensions sont les fondations du modle dimensionnel ils dcrivent l'objet du Business comme les employ les client ,ces tables sont des description textuelle de ce Process,la puissances et la lisibilit de l'entrept de donnes est proportionnelle la qualit des attributs de ces dimensions ,car ils sont le points d'entre dans la table de fait ou sont gard les mesures intressantes . les relation qui vont lier la table des faits et la table de dimension et une relation de type <un a plusieurs> ,un enregistrement dans la table des fait aura un enregistrement dans la table des dimension et un enregistrement dans la table des dimension aura plusieurs enregistrements dans la table des fait ce qui nous garantit la non redondance des donnes Ci dessous la gure montre
Figure 2.2 Modle d'un entrept de donnes

un exemple d'un modle dimensionnel pour un systme typique de gestion des achats. On remarque que la table de fait est situ au milieu entour de tables de dimension (le modle typique en toile). Les attributs avec le libelle Pk sont des cls principales et PF sont des cl trangres, ces dernires lient la table de fait avec les tables dimensionnelles et l'union des cls trangres dans la table de fait reprsente la cl principale de cette dernire. La relation qui lie la table de fait la table dimensionnelle est de type un plusieurs (1-n). Pour chaque enregistrement dans la table de fait on aura un seul enregistrement dans la table de dimension ce qui nous permet de garantir la non redondance des donnes et pour chaque enregistrement dans la table de dimension on aura plusieurs enregistrement dans la table des faits ce qui nous permettra de faire des agrgations sur les quantits mesurables de la table des faits.
QP
PFQFSFQ snow)king
Le snowaking se rsume attacher des tables aux, tables de dimension ce qui donne un modle en forme de ocon de neige. Ce genre de modle met en avant l'ecacit et la rapidit pour trouver des donnes en tentant parfois de renormaliser les tables dimensionnelles,la gure ci dessous est un exemple d'un modle en ocon de neige.
Figure 2.3 Modle en ocon de neige
PFQFSFR wtrie en us et les dimensions onformes

L'ide est de rutiliser les tables dimensionnelles travers plusieurs business processes , cela reprsente les fondations pour l'utilisation d'un systme BI/DW en entreprise. Deux tables de fait peuvent avoir des tables en commun, on les appelle des tables conformes. On peut voir sur la gure un exemple de cela, la table emps est partage par deux tables de fait, cela nous permet d'adresser des requtes plus compliques
2.4 OLAP et AdHoc Querry

2.4.1 OLAP
OnLine Analytic Process(OLAP)database est une technologie qui a pour but le stockage,la gestion et l'interrogation de donnes spciquement conues
PFRF yve et edro uerry
QQ
Figure 2.4 Modle avec les dimensions conformes

des ns de Business intelligence [Gouarne 98] Il s'agit d'une catgorie de logiciel axs sur l'exploration et l'analyse rapide des donnes selon une approche multidimensionnelle. Il vise assister l'utilisateur dans son analyse en lui facilitant l'exploration de ses donnes de manire rapide et facile .
PFRFIFI gomposnt
L'architecture OLAP consiste en trois services : fses de donnes X cette base de donnes doit supporter les donnes agrges ou rsumes qui peuvent provenir d'un entrept ou d'un march de donnes. Elle doit possder une structure multidimensionnelle erveur yve X Elle gre la structure multidimensionnelle dans le SGBD et l'accs aux donnes de la part des usagers wodle lient XPermet aux usagers de manipuler et d'explorer les donnes,ache les donnes sous forme graphique ou de tableaux.
2.4.2 requte Ad Hoc

Les requtes Ad hoc sont formules par l'utilisateur sur le moment. L'approche dimensionnelle dans la modlisation est largement reconnue comme la meilleure technique pour supporter ce genre de requtes car la structure est simple apprhender [Mundy 06] ces deux techniques permettent l'exploitation des donnes contenues dans notre plateforme
QR
Figure 2.5 Exploitation des entrepts de donnes
2.5 Conclusion
Nous avons essay dans cette partie de donner une vue d'ensemble sur la technologie des entrepts de donnes. Nous avons intentionnellement nglig le cot accs de donnes ainsi que l'interaction avec le data mining en ne donnant que de simple dnition car nous y reviendrons plus longuement dans un chapitre ou nous donnerons les avantages et les inconvnient de chaque approche
Deuxime partie tude de l'existant
Chapitre 3
Plateforme et technologie existantes
3.1 Introduction
L'intgration et l'hybridation des technologies avances est un processus qui s'inscrit tout naturellement dans le dveloppement de l'informatique moderne. Le rsultat de ces hybridations peut mtaphoriquement tre reprsent par cette somme 2+2=5. Les avantages de chaque hybridation peuvent tre vue de direntes faons ,selon qu'on se place du cot des agents ou du data mining. Le data mining amliore les capacits du systme base d'agents ,il augmente son intelligence et sa capacit s'adapter des situations nouvelles, le data mining gagne en vitesse et en distributivit. Nous dresserons dans ce qui suit une vue d'ensemble sur les facteurs qui ont pouss l'mergence de cette branche ainsi que les ds et objectifs que les deux technologies veulent atteindre avec cette intgration.
3.2 Agent Mining

3.2.1 facteur de l'mergence
Les deux disciplines ont volu dans deux domaines de recherche nettement dirents Les recherches dans le domaine agent taient accs sur les aspects thoriques, mthodologiques et exprimentales pour crer des systmes plus intelligents. Le data mining quand lui est centr sur la dcouverte de modle de connaissance et dernirement dans le domaine de l'aide la dcision. Pourtant chacune des deux technologies peut jouer un rle important dans la rsolution de certains aspects lis l'autre. Dans ce qui suit nous allons lister quelques exemples :
QV
ghpitre QF lteforme et tehnologie existntes
QFPFIFI pteurs li ux gents

Nous noncerons quelques proprits importantes aux agents et qui ncessitent l'introduction d'algorithme de data mining v sensiilit X La sensibilit est la facult de l'agent percevoir les changements internes et externes de son environnement et sa capacit les analyser. Le data mining peut grandement amliorer cette proprit en l'aidant dceler les changements et les analyser d'une faon plus ecace. v9pprentissge X C'est une facult trs importante dans les systmes agents organisationnels ouverts. Il devra apprendre de ses direntes interactions avec ses semblables, l'environnement, l'humain et mme de ses propres erreurs. L'agent qui utilisait la dduction tait incapable d'eectuer ces taches d'ou le besoin du data mining. tionnle X L'agent devra sur la base des connaissances acquises (lors de l'analyse de l'environnement) prendre des dcisions ,et cela des ns de consulting et de recommandation .
QFPFIFP pteurs lis u dt minig

Lors de l'application du data mining dans le monde de l'entreprise,il est confront plusieurs ds d'ordre organisationnels et de gestion de donnes : mining pour des entreprises pose beaucoup de ds. La gestion des donnes physiquement spare,htrogne,et la diusion de ces connaissances reste un problme majeur. ontrintes et environnements X L'environnement joue un rle incontournable dans le data mining . Les algorithmes de data mining doivent tre exibles et s'adapter aux dirents changements qui peuvent aecter celui ci. ht mining distriutive et ve le prlllisme X dans un souci continuel d'amliorer les rsultats des dirents algorithmes de data mining ,le paralllisme devient donc invitable pour diminuer de la complexit ,ce qui induit indniablement la distributivit des sources de donnes rprtion des donnes et fusion X d a la complexit des donnes qui ne cesse d'augmenter et cela dans leur htrognits mais aussi dans leurs sources ,car les outils de data mining doivent pouvoir prparer et fusionner des ux continus de donnes ce qui implique l'introduction des agents qui sont capables d'eectuer ces taches l.
ht mining pour les entreprises X Le dveloppement d'outils de data
QFPF egent wining

3.2.2 Framework pour agent mining
QW
L'egent wining en tant que discipline mergente,tudie les direntes mthodologies,principes,techniques et applications de cette synergie[Cao 07]. L'interaction et l'intgration du data mining dans les agents se fait sur diffrentes couches comme nous pouvons le voir dans la Figure,que ce soit au niveau des donnes,des capacits d'apprentissages et de l'aspect organisationnel. Ceci requiert une tude pousse des aspects des deux disciplines pour trouver un framework assez consistant qui puisse orir une synergie parfaite entre les deux technologies.
Figure 3.1 Possibilit d'intgration et d'interaction
gouhes essoures X L'intgration et l'interaction peut s'eectuer au niveau des donnes. gouhes gonnissnes X L'intgration et l'interaction peut s'eectuer au niveau de la connaissances qu'elle soit humaine ou extraite. gouhes epprentissge X L'intgration et l'interaction peut s'eectuer au
niveau des mthodes d'apprentissages,des capacits d'apprentissages et des perspectives lier la performances de ce dernier. gouhes erformne X L'intgration et l'interaction peut s'eectuer pour l'amlioration de l'une ou de l'autre des technologies.
tant donn que l'egent wining se compose de deux technologies qui ont volu dans des domaines dirents leur cycle de vie est en toute logique dirents ; si les systmes base d'agents sont utiliss exclusivement pour supporter les
3.2.3 Cycle de vie et Process
RH
algorithmes de data mining alors le cycle de vie suivra celui de ce dernier savoir : Extraction , Transformation , Chargements ... D'autre part si les algorithmes de data mining sont implants sur les agents pour les rendre plus performant,alors le cycle de vie sera celui de la conception d'un logiciel savoir analyse ,conception ... Jusqu' maintenant il n'y a pas de cycle de vie gnrique qui engloberai les deux voies, cela dpend grandement de la solution prsenter et de l'importance de chacune des deux technologies dans cette dernire. D l'importance que prend cette discipline, il serait plus intressant de mettre en oeuvre un cycle de vie qui serait propre elle .
3.3 Application
L'interaction des 2 technologies ouvre des perspective normes dans les applications auxquelles elle peut tre conduite que ce soit dans les domaines du data mining ou des agents. On trouve dans la littrature plusieurs domaines : erti(il nd eletroni mrkets, qestion de l reltion lient, ixE trtion et tritement des donnes distriu, iEommere, fusiness intelligene . Dans ce qui suit nous allons voir l'application de l'egent wiE ning pour l'extraction de connaissances. Ces deux plateformes ont mis en oeuvre leur propre framework pour mettre en oeuvre la synergie des systme multi-agent et du data mining pour bncier au maximum de cette complmentarit .
3.4 plateforme et architecture existante

Dans ce qui suit nous allons essayer d'introduire deux framework qui utilisent l'egent wining. Plusieurs plateformes existent,nous pouvons voir une numration de ces derniers dans [A. Mitkas 04], nous avons choisi ces deux car ils taient notre sens les plus aboutis.
L'sntelligent eomendtion prmework est comme son nom l'indique un framework pour la construction de systmes de recommandation partir d'i (Entreprise Roussources Planning),des progiciel pour les systme d'information , l'aide de systmes multi agents utilisant des algorithmes de data mining. Ce systme a pour but d'extraire des rgles partir des donnes contenues dans l' i et de les injecter vers d'autre agents qui joueront le rle d'agents de recommandation. Ce systme a t conu spcialement pour
3.4.1 IRF Architecture
QFRF plteforme et rhiteture existnte
RI
le wrket eomndtion, ce qui veut dire qu'il gre des recommandations et des prols d'usagers et d'inventaires. Avant d'entrer dans les dtails de l'architecture de ce framework nous devons tout d'abord faire une brve introduction de la plateforme sur laquelle se base IRF Architecture.
QFRFIFI egent edemy

Agent Academy est un projet europen initi en 2003 qui s'inscrit dans la branche de l'egent wining , c'est une plateforme qui a pour but de faciliter la conception et la mise en oeuvre de systme multi-agents ,en permettant l'utilisateur de crer des systme multi-agents sans taper une seule ligne de code, grce son interface ou il devra choisir le type ,le comportement et les interactions du systme. Il supporte aussi l'extraction de modle en utilisant des techniques de data mining et pour cela il sut de spcier la source de donnes et la techniques utiliser. La gure ci dessous donne un aperu sur cette plateforme.
Figure 3.2 Architecture d'Agent Academy
RP
QFRFIFP l9rhiteture externe d9sp

l'architecture est constitue de 4 couches : v ouhe ommunition X couche qui rcupre les donnes depuis l'i ouhe tritement de donnes X ou les algorithmes de data mining sont appliqus v ouhe reommndtion X transformation des connaissances acquises en rgles prt tre utilises. v ouhe interfe X sert d'interface entre l'utilisateur et le systme ces direntes couches sont reprsentes par des agents qui eectuent ces taches l. On peut voir sur la gure ci dessous une reprsentation assez sommaire de l'architecture et des dirents type d'agents d'sp lorsque un ordre d'achat arrive, il contient le nom du client ,de l'objet acheter et celui de l'entreprise qui l'a produit. Ces trois informations sont transmises Recommandation agent. Cet agent a en sa possession un ensemble de rgles qui peuvent s'appliquer sur le prol de ces trois entits ,donc la prochaine tape est de construire le prol de chacune de ces entits. gse, seet sse se chargeront de construire ces modles, ils construiront des modles de donnes en accdant aux informations contenues dans l'i par le biais de ie qui est un agent interface avec l'ERP. Les trois agents appliquent le modle construit sur les attributs du client et renvoient les rsultats e qui devra fournir les recommandations nales. Cette architecture utilise l'approche transducteur dont on parlera un peu plus tard.
QFRFIFQ l9rhiteture interne d9sp

L'architecture interne des agents est la partie la plus intressante de ce framework , particulirement l'agent de recommandation qui a pour fonction de rassembler les dirents prols et d'appliquer des techniques de data mining sur ces prols ,et de les assimiler instantanment dans sa base de connaissances , ce qui lui permet de pouvoir rpondre aux direntes requtes des agents interface. L'utilisation du PMML qui est un langage base de XML est indispensable, plus de dtails seront fournis sur ce langages tout au long des chapitres.
3.4.2 Critique
Ce framework a t conu exclusivement pour le systme de recommandation, en dehors de ce domaine il est inutilisable . Les ERP sont par essence des systmes distribus nanmoins il n'y a pas dans
QFRF plteforme et rhiteture existnte
RQ
Figure 3.3 L'architecture IRF

ce framework une stratgie pour grer ce fait ,tout comme l'aspect rseau est compltement inexistant. La cration de prols et sa gestion est laisse au soin d'un seul et unique agent,ce qui est une trs mauvaise approche,il faut viter la centralisation et adopter un comportement peer to peer. la plateforme Agent Academy ne contient pas de documentation ni d'un vritable manuel en plus de contenir plusieurs BUG ,ce qui la rend tout
RR
simplement inutilisable.
3.4.3 Papyrus
Papyrus est un systme base de couches contenant dirents outils logiciels ainsi que des outils rseaux pour rsoudre le problme du data mining distribu. Contrairement ses prdcesseurs, il est orient peer to peer,en d'autre termes les agents sont plus libres d'eectuer leur travail avec une abilit et une ecacit maximum[Grossman 99]. Cette architecture est tout fait adquate pour le Data Mining Distribu (DMD)et elle a d'ailleurs t conue pour pour eectuer de l'extraction de connaissances sur des zones distribues.
QFRFQFI erhiteture X
Papyrus se compose de quatre couches : l ouhe dt wrehouse X la couche la plus basse de l'architecture contient comme son nom l'indique les entrepts de donnes desquelles seront extraites les donnes d'apprentissages l ouhe dt mining XCette couche a pour but la construction de modle de donnes en appliquant des techniques de data mining sur les ensembles de donnes extraites partir des entrepts de donnes . l ouhe du modle prditive XCette couche va grer les connaissances extraites en transformant les modle de donnes en format XML (PMML) . l ouhe egent X s'occupe du transport de ces modles entre les dirents noeuds. Les concepteurs de cette approche ont mis sur pied un langage xml appel DDML (Data Discovery Markup Language) qui dcrit les direntes requtes et les meta-donnes qui accompagnent l'utilisation du data mining distribu. Les agents se transmettent les chiers PMML ET DDML . Plusieurs stratgies peuvent tre mises en oeuvre en ce qui concerne les donnes que les agents se transmettent : dpler les donnes X cette approche permet de transmettre les donnes. Ceci requiert un trs grand dbit, mais en contre partie cela permet une plus grande precision lors de la construction du modle agrg dpler les modles douverts X une autre approche serait d'appliquer la technique de data mining localement et de transmettre les donnes sous un format XML. Ceci requiert une bande passante moindre avec une certaine perte de precision lors de l'agrgation. dpler les rsultts X cette stratgie est la moins couteuse mais ne permet pas de faire l'agrgation entre plusieurs sources.
QFSF gonlusion QFRFQFP gritique
RS
Ce framework a nglig totalement l'aspect extraction de donnes et n'a fait que survoler le fait d'appliquer une technique de data mining. Inexistence d'une mthodologie capable d'accompagner la construction du systme multi agents. L'tat interne de l'agent a t tout simplement ignor(Comportement,Interaction ...).
3.5 Conclusion
Les plateformes existantes servirons de base notre propre modle. Nous essayerons de reproduire les avantages de chaque mthode en vitant leurs inconvnients tout en essayant de suivre les aspirations de cette nouvelle discipline qu'est l'egent wining et la synergie de ces composants .
Troisime partie Conception et modlisation de la solution
Introduction
Aprs une courte introduction des dirents ingrdients et techniques que nous allons dployer, pour mettre en oeuvre notre solution,nous allons nous atteler dans cette partie prsenter notre modlisation. Elle aura pour but d'automatiser l'extraction des connaissances partir d' entrept de donnes distribues ,de propager ces connaissances et modles de donnes et de faciliter leur accs pour les utilisateurs. Quand nous parlons de connaissance, il est bien sur question de construction de modle de donnes cens nous montrer et nous rvler des relations enfouies dans les donnes et ou de prdire le comportement d'une entit . Comme abord dans la partie "Etude de l'existant" il n'y a pas de mthodologie qui puisse nous accompagner tout au long de la construction d'un systme multi-agents, tout en ayant la capacit d'utiliser les techniques de data mining. Nous avons vainement essayer d'adapter les frameworks existants notre problmatique, coups de modications et de changements assez critique, malgr cela ils n'arrivaient pas couvrir tous les aspects de notre problmatique. Aprs avoir pris conscience de cette donne, nous nous somme mis concevoir un framework en nous inspirant des travaux dj existants(certains sont cits dans la section "Agent Mining") en vitant de reproduire leur lacunes et de le concevoir de faon gnrique de telle faon pouvoir s'adapter toutes les situations qui requinqueraient l'utilisation des direntes technologies. Nous avons donc d mettre en place une nouvelle architecture qui puisse supporter les direntes contraintes lies notre problme et en rgle gnrale tout systme qui aurait pour ambition l'extraction de rgles et leur propagation pour une utilisation eective et simple , nous allons dcrire notre architecture en la ciblant sur un cas bien prcis pour montrer l'ecacit et sa exibilit. Nous allons d'abord dcrire le scnario sur lequel nous allons appliquer notre systme , cela fera oce de notre premier chapitre puis nous passerons notre systme multi-agents en cernant les dirents rles et nalement nous consacrerons un chapitre pour dcrire la constituante de chaque agent et de son comportement.
Buisness Modle
4.1 Introduction
Les nouvelles technologies sont omniprsentes dans notre socit. Tous les magasins et grandes surfaces l'incorporent dans leur stratgie an d'attirer et dliser leurs clients pour faire plus de prots. Toutes ces entreprises proposent aux clients des cartes d'abonnements, qui ne sont ni plus ni moins que des prols que ces dernires gardent pour mieux connaitre le client ,car plus on connait le client plus on saura quoi lui vendre. L'exemple le plus connu est celui de wall mart : ds que vous poser un pied dans cette chaine de grande surface,wall mart sait ce que vous voulez acheter . Nous allons donc simuler une grande surface qui a des succursales gographiquement spares. Elle utilise une technologie d'entrept de donnes qui historise direntes informations auxquels nous nous intresserons. Le modle de donnes est inspir d'un benchmark nomm TPC-DS et des ouvrages de Ralph Kimball qui modlise une grande surface de distribution de produit en tout genre, donc contient toutes les informations (tables) dont nous aurons besoin pour notre cas. Nous ne prsenterons pas ce benchmark dans ce chapitre mais dans le chapitre ralisation, cependant l'architecture des donnes est typique pour un systme de gestion des relations clients et donc elle sera dissque. Nous dbuterons notre chapitre par prsenter le scnario dans lequel nous voulons appliquer notre systme ,nous passerons ensuite vers la description de l'architecture de nos donnes historises dans l'entrept de donne,nous parlerons ensuite de l'architecture 3-tiers utilis pour analyser . Nous tayerons tout ce que nous dirons par des exemples et des gures explicatives.
Chapitre 4
4.2 Le scnario
Le data mining peut tre appliqu divers applications dans le monde rel et particulirement dans le monde du business. Nous pouvons cerner une dizaine de cas tels que : htetion d9nomlie X Les entreprises utilisent le data mining pour vrier si une donne est valide ou pas comme par exemple est ce que le code de la
SH
ghpitre RF fuisness wodle
reommndtion X
carte de crdit est entr par une personne autoris ou pas . qestion du risque XLe data mining peut tre utilis pour dterminer le risque qu'on peut avoir par exemple pour l'octroie d'un prt . Mais la principale utilisation du data mining est bien sur les systmes de
Quelle type de produit ou d'ores devez vous prsenter un client. C'est une question que tout les grants de magasins se posent.Gnrer des recommandations est trs important dans le domaine de la distribution,les clients qui reoivent les recommandations(en d'autre termes les bons produits au bon moment) seront plus rentables (car ils seront plus apte consommer encore plus) et plus dle (car ils se sentiront plus l'aise ) . Ce que nous voulons modliser est un systme de recommandations, qui pourra selon le prol d'un utilisateur, recommander des produits avec un label satisfait ou rembours pour dliser les clients. Mais de l'autre cot cela gnre des pertes si on tombe sur des clients qui demanderont tre rembours sans aucune raison li leurs satisfaction au produit. La solution : selon le prol de l'utilisateur qui se trouve tre dans une carte de dlit ou dans son compte (si les achats se font sur internet), il recevra des ores personnalises. Nous restons toujours dans notre logique de pousser le consommateur acheter plus de produit et lui rserver des traitements personnaliss pour qu'ils se sentent plus l'aise et donc deviennent dle sans pour autant engranger de pertes.
4.3 Architecture
Dans cette section nous tenterons de prsenter l'architecture typique d'un processus qui a pour but d'englober le retour des produits qui fait partie de la gestion de la relation clients. Nous dbuterons par une dnition du GRC puis de l'tude de l'architecture
4.3.1 GRC
Tous les secteurs se rallient la gestion des relations clients,passant d'une orientation produit une orientation client [Kimball 02] L'ide, toujours la mme, est d' essayer de mieux cerner les clients pour tablir une relation durable avec lui ; cela concerne ventes,livraison ou service aprs vente.Essayer d'orir un traitement personnalis chaque client est le mot d'ordre de ce systme.
RFQF erhiteture
SI
Figure 4.1 Notre modle de donnes

4.3.2 Le modle
An d'atteindre les spcications dcrites dans la section prcdente, nous utilisons le modle dcrit ci dessous avec une table de fait wgsinEetour qui contient des attributs numriques mais aussi neuf tables de dimension : Trois tables de clients qui ont pour but de dcrire chaque aspect du client : les informations sur les clients auraient pu tre englob dans une seul table mais en les scindant en plusieurs tables appel mini-dimension, cela facilite la navigation et diminue le volume de donnes stockes. Cela permet aussi d'excuter des requtes sur le client sans passer par la table de fait. glient Xprsente des information tels que le nom prnom et autres information edresses glient Xdes information spciques l'adresse ttu glient Xinformation sur son statut mari ou salaire Nous avons deux dimension temporelles, ce qui peut paraitre premire vue inutile, mais en suivant les spcications de Ralph kimball, cela parait tout fait cohrent dans le sens o :
SP
Colonne c-Salutation c-Nom c-Prenom c-Naissance-Jour c-Naissance-Mois c-naissance-Anne m-Naissance-Pays c-ID c-Ad-Mail m-Pays m-Dernire-Visite Type char(3) char(20) char(20) int int int char(10) int char(30) char(10) date Nulle X X X X X X X X X

Explication Monsieur,Madame,Mademoiselle Le nom du client Prnom Jour de naissance Mois de naissance Anne de naissance Lieu de naissance L'identicateur l'adresse mail du client Pays ou rside le client La date de visite du client
Table 4.1 Table Client

Colonne c-Rue-Nom c-Rue-Num c-Rue-Type c-Ville c-Rgion c-Pays c-Zip Type Nulle Explication Char(20) X Le nom de la rue Char(20) X Le Numro de la rue Char(20) Le Type de la rue,Frquent ou pas Decimal Nom de la ville Decimal Nom de la rgion Decimal Nom du pays Decimal Numero Zip
Table 4.2 Table Adresse Client

Colonne c-Genre c-Mari c-Etude c-Estimation-Achat c-Taux-Crdit c-Institut m-Emploie Type Entier Entier Decimal Decimal Decimal Decimal Decimal Nulle Explication X Le genre du client Statu du client Type d'tude X le Montant des achat eectu par le client X Le Taux du Crdit que le client a pris Lieux tude emploie
Table 4.3 Status Client
RFQF erhiteture
Colonne d-Nom-Jour d-Num-JS d-Num-JM d-Num-JAE d-AE d-AC d-Seq-Semaine d-Seq-Tri d-Num-Tri d-Ind-Fri Type Entier Entier Entier Decimal Decimal Decimal Decimal Decimal Decimal Decimal Nulle X X X X X X X X X X
SQ
Explication la dnomination du jour l'ordre du jour par rapport au dbut de la semaine l'ordre du jour par rapport au dbut du mois Numro de jour a partir de la premire anne d'exercice Anne de puis le dbut de l'exercice L'anne d'aprs le calendrier numro de semaine depuis le dbut de l'exercice numro du trimestre depuis le dbut de l'exercice le numro de trimestre depuis le dbut de l'anne est ce un jour fri
Table 4.4 Table Date

la semaine (1,...,7) qui peut tre utilis pour comparer des jours de semaine entre autre et contient jour dans le mois (1,2 .....,28,29,30) pour comparer les jour a distance gales et englobe aussi les jours fri et non fri. emps elle est utilis quand nous voulons accder l'heure de la transaction en vue d'une analyse sur une partie de la journe ; la date et l'heure sont presque compltement indpendante. La fusion de ces deux dimensions augmenterai le volume considrablement, entravant un des principes fondamentaux des entrept de donnes : leur simplicit tre assimile. La table stem est l pour dcrire les direntes caractristique de l'objet qui a t rendu tels que la catgorie,le prix,la couleur ... La table ison X dcrire la raison de la non satisfaction du consommateur du produit La table wgsin X direntes informations sur le magasin tels que l'emplacement l'heure d'ouverture ou encore le manager La table de fait etourEwgsins Xqui comme nous l'avons dit plus haut contient divers informations numrique tels que la quantit, la perte nette sur le produit rendue,la somme rembours ... Nous porterons un intrt particulier quatre tables qui participerons notre systme de recommandation et qui sont glients Dwgsins DetourE
hte X dpend du jour que la ligne reprsente,cette table contient le jour de
wgsins Dhte
Nous n'avons pas inclus les cls primaires et trangres car cela ne ferait que compliquer les tables et le modle.
SR
Colonne m-Magasin-date-ouverture m-Magasin-Nom m-Rue-Nom m-Rue-Numero m-Ville m-Region m-Pays m-Zip-Code m-Manager m-Taxe-Pource m-Decalage-horaire
Type Entier Decimal Decimal Decimal Decimal Decimal Decimal Decimal Decimal Decimal Decimal
Nulle X X X X X X X
Explication Date d'ouverture du magasin non du magasin Nom de la rue Numro de la rue Nom de la ville Nom de la rgion Nom du pays Le code Zip Le nom du manager du magasin de la charge Pourcentage de la taxe appliqu Decalage horaire
Table 4.5 Table Magasin
Colonne rm-Retour-quantit rm-Retour-Montant rm-retour-Tax rm-retour-frais rm-Montant-rendu rm-Net-Perdue rm-charge-amortie
Type Entier Decimal Decimal Decimal Decimal Decimal Decimal
Nulle X X X X X
Explication la quantit retourne Le montant des produit retourn la taxe sur les produit retourn Les frais qui ont accompagn le retour du produit Montant qui as tait rembours La perte Net Amortissage de la charge
Table 4.6 Table Retour-Magasin
RFRF erhiteture du systme disionnel
SS
Figure 4.2 Notre modle de donnes
4.4 Architecture du systme dcisionnel

4.4.1 Dnition
L'architecture de tout systme dcisionnel suit un modle gnrique en 3-tiers qui est dcrit dans la gure ci dessous Nous nous sommes inspir du modle dcrit dans l'ouvrage he miroE soft wrehouse ooluit et nous pouvons distinguer deux faon d'accder aux donnes yve X passer par des bases multidimensionnel ou ce que nous appelons des cubes pour construire sur cette base des requtes et des application BI,ce qui ncessite un temps de traitement entre l'entrept et ces bases multidimensionnel et cette solution manque de exibilit par rapport a la deuxime techniques. equte htwining X c'est des requtes que l'administrateur peut adresser ou ce que nous appelons des requtes Ad Hoc qui ont tait dnit dans une partie prcdentes et cela pour retrouver une certaine quantit de donnes en relation avec un certain Process
4.4.2 La requte
Nous utiliserons le langages SQL pour modliser une requtes qui pourra nous permettre de rcolter les donnes ncessaires a notre processus de data mining ,cette requtes nous aidera a retrouver des donnes qui pour-
ST
ront nous informer sur les client qui ont une fcheuse tendance a demander remboursement par rapport aux produit elle s'exprime sous la forme suivantes with client-total-retour as (select sr-client-sk as ctr-client-sk //sr-client-sk est la cl primaire de la table client ,sr-magasin-sk as ctr-magasin-sk //sr-magasin-sk est la cl primaire de la table magasin ,sum(sr-retour-amt) as ctr-total-retour //sr-retour-amt le montant qui a tait rendu from Retour-Magasin group by sr-client-sk ,sr-magasin-sk) select <Les paramtres de l'algorithme de data mining> // les paramtre que nous allons utiliser pour le DM from client-total-retour ctr1 //la table que nous avons construit plus haut ,magasin ,client where ctr1.ctr-total-retour > (select avg(ctr-total-retour)2 // calcul la moyenne des retour from client-total-retour ctr2 // et slectionne ceux qui sont suprieur de deux fois where ctr1.ctr-magasin-sk = ctr2.ctr-magasin-sk) // la moyenne and s-magasin-sk = ctr1.ctr-magasin-sk and ctr1.ctr-client-sk = c-client-sk order by c-client-id Cette requte utilise l'oprateur ith qui cre si on puis dire une table contenant le prix de touts les produits que le client a rendu en utilisant l'oprateur qroup y sur client,le calcule la somme est eectu par la fonction sum. Nous utiliserons la table de fait ou se trouve le prix des produits rendus. puis nous utilisons le rsultat de la requte avec ith pour calculer la moyenne du prix des objet rendu (par utilisateur et par magasins), et nous slectionnons ceux qui ont un montant deux fois plus lev que la normal,avec cette ligne : where trIFtrEtotlEretour b @selet vg@trEtotlEretourAP . On fait une jointures entre trois tables : Client et magasins qui fournissent dirents attributs a utiliser avec nos algorithmes de data mining. la table construites tout a l'heure avec l'oprateur ith pour retrouver les
RFSF ehnique de ht wining
SU
bon clients,nous leur rajoutant une colonne ype lient qui aura pour valeur wuvis,et d'un autre cot nous slectionnant les client, qui au contraire, ont un montant d'objet rendu infrieur au double de la moyenne,nous leur donnant un label fon,en faisant cela nous venons de construire notre ensemble d'apprentissage . ce que nous essayerons d'apprendre est donc le concept de bon client (dans le sens de notre systme de recommandation), nous avons juger que les information sur le client lui mmes peuvent tre rvlatrice, l'environnement ou il fait ses achats a savoir le magasin est important,les objet rendu ne sont pas important car notre systme de recommandation ne visera pas a fournir des promotion sur des objets spcique mais a dtecter les mauvais clients.
4.5 Technique de Data Mining

Comme nous l'avons dit un peu plus haut nous allons essayer d'apprendre le concept de bon et de mauvais client pour pouvoir les cibler avec des promotion ,cette apprentissage sera une classication. Pour chaque type de client nous avons deux classes que nous pouvons leur aecter ,cette aectation dpendra de plusieurs paramtres qui vont de l'age du client jusqu'au Manager du magasin. Comme nous l'avons vu dans la partie ht wining de l'tat de l'art plusieurs techniques nous permettent de faire de la classication On peut citer les arbres de dcision,les rseaux de neurones,support vector machine ... Notre choix s'est port sur les arbres de dcision et plus prcisment sur sa version C4.5 nous allons dans ce qui suit faire une introduction des arbres de dcision et plus spciquement sur le C4.5 en argumentons notre choix.
4.5.1 C4.5
Les systmes qui font de la classications sont les plus rpondues dans le paysage du data mining appliqu,ils prennent en compte des instances et doivent les aecter a des classes prdnies,le C4.5 est UN descendant de L'ID3 et de CART qui ont largement tait utilis [XindongWu 07], tout comme touts les arbres de dcision il utilises l'approche diviser pour mieux rgner et apporte plusieurs amlioration tel que : une rapidit et un taux d'apprentissage lev Une plus grande exibilit. les tests sont bien plus ecaces la reprsentation de la connaissances acquise est sous la forme de rgle Les arbres de dcision et plus particulirement le C4.5 a tait lu comme la
SV
meilleur techniques de data mining par le Top dix des algorithmes de data mining [Maimon 10] plusieurs raisons li a notre problme nous ont pouss a choisir cette voie : les arbres de dcision en sortie gnre un modle qui est comprhensible par l'tre humain et donc sujet a modication ce qui sera notre cas . les sorties de cet arbre de dcision seront de la forme de rgle par exemple : i oueaR i grurntari i itessewxaIPH
evy inginaoiture
4.5.2 Les Paramtre :

Comme nous l'avons prcdemment soulign les arbres de dcisions font partie de la familles des algorithme d'apprentissage supervis donc il a besoin en entr d'instances ,ces instances sont constitu de paramtre ,ces paramtres aurons une grande inuence sur le modle que nous allons produire. La pertinence de cet algorithme dpendra grandement de la pertinence des paramtres ,dans ce qui suit nous allons faire un tour d'horizon des dirents paramtres ainsi que les raisons qui nous ont pousser a les inclure nous allons inclure la majeur partie des information concernant le client a savoir sa date de naissances,son pays de naissances et de rsidence,son statut personnel et le type d'ducation ,ces information nous paressent trs pertinente tant donne que le systme tourne autour du clients . Nous inclurons aussi des informations propres au magasin ou les produit ont tait achet car l'environnement est un facteur important ,sans oublier bien sur d'inclure la date et la priode concernant le produit en question .
4.6 Conclusion
Aprs avoir dcrit notre problmatique dans ce chapitre, nous passerons en revue dans les chapitres suivants notre conception et les direntes approches que nous avons mis en place pour rsoudre cette problmatique .La exibilit et la tolrance aux pannes serons prises en compte,il faut garder a l'esprit que ce scnario est juste un exemple pour montrer de faon simple l'ecacit de notre solution
Architecture du systme multi-agent

5.1 Introduction
Pour rsoudre tout problmes de quelque nature que ce soit,et surtout si nous avons coordonner plusieurs individus qui oeuvrerons cette tache,il faudra tout d'abord cerner les direntes responsabilits ainsi que les types d'individus qui auront assumer ces direntes taches. Ce que nous venons de dcrire est un processus gnrique pour rsoudre un problme au sein d'une socit d'individus organiss, et c'est cela que reprsente les agents,un groupe d'individus organis et c'est la tout le but de ce chapitre : dcrire les responsabilits et les rles que les dirents types d'agents devront endosser ,et pour rsoudre les problmes ecacement plusieurs mthodologies ont vu le jour pour automatiser le processus dcrit plus haut . La culture des agents a atteint une maturit qui lui permet de concevoir divers mthodologies,qui sont en fait des heuristiques sur lesquels des solution informatiques , utilisant la technologie des agents, sont bases. Elles nous orent un ensembles d'tapes qui nous permet de faire une conception de telle sorte viter des erreurs usuelles,et nous faire gagner un temps prcieux, elle sert aussi de guide pour identier et cerner les dirents tenants et aboutissants de la solution base d'agents . Dans cette section nous allons identier les dirents types et rles des dirents agents qui font partie de notre solution, nous laissons tout ce qui touche la structure interne et les comportements pour le prochain chapitre,mais tout d'abord nous allons faire une brve prsentation de la mthodologie utilis
Chapitre 5
5.2 Origines
Comme nous l'avons signal dans les paragraphes prcdents,le choix d'une mthodologie est crucial l'accomplissement d'une conception saine. Nanmoins il y a une abondance de ces mthodologies. Nous en dnombrons une dizaine dans l'ouvrage rfrence de Brian Henderson-Sellers sur les mthodologies orient agent ,aprs une lecture des direntes mthodologies
TH
ghpitre SF erhiteture du systme multiEgent
orient agents,notre choix s'est port sur la jdeEmthodologie. Direntes raisons (en rapport direct ou non avec notre problmatique)nous ont pouss faire ce choix, nous proposerons certaines d'entre elles dans ce qui suit : -elle n'est pas une extension d'un quelconque modle objet mais conue exclusivement pour le paradigme agent. -la dnition des rles des agent s'eectue aprs l'identication du types des agents ce qui est une approche plus souhaitable (et qu'on retrouve rarement dans les autres mthodologies). -elle supporte les environnements distribu . -la jade mthodologie est assez li a la plateforme jade ce qui nous permet d'exploiter au maximum tout les outils que nous ores cette dernire . -utilisation d'une approche (dite top-down et inversement) ce qui garantit que les systmes usuelle seront pris en compte. -elle suit les spcications de la FIPA ce qui nous permet une conception en adquation avec les normes tablie.
5.3 Prsentation des tapes de la conception

Nous commencerons par prsenter l'architecture externe de notre systme et pour se faire nous avons labor un ensemble d'tape, s'inspirons de la mthodologie cit ci dessus,nous avons pris certaines tapes que nous avons jug utile pour rsoudre notre problmatique ,nous en avons modier certaines et rajouter d'autre ,une fois appliqu sur un problme donn ces tapes permettrons de faciliter la comprhension de notre problme et ainsi mieux cerner les tenons et aboutissant,nous allons donc en premier lieux introduire chaque tapes puis l'appliquer sur notre problmatique,en pratique cela nous donnent six tapes qui vont de la dnition des pr-requis de notre systme jusqu' l'identication des dirents rles que les agents auront jouer les schma seront la pour nous aider a saisir les dirents concepts et ide que nous dvelopperons
5.3.1 Diagramme des cas d'utilisation :

La premire tape dans tout processus qui aurait pour but de mettre en place une conception pour l'architecture d'une application est l'identication des direntes pr-requis et les direntes faon que l'application aura a interagir avec les lments extrieur,et pour remplir cet objectif nous nous aiderons du diagramme de cas d'utilisation. Ce diagramme est utilis an de montrer la faon dont le systme interagit avec l'utilisateur nal ou les
SFQF rsenttion des tpes de l oneption
TI
autres systmes,ce diagramme est le meilleur moyen de modliser et de mettre en vidence les pr-requis et les objectifs d'un systmes (la technologie implment dans le systme n'inue pas sur ce diagramme)
5.3.2 Identication des types d'Agents :

Les agents n'auront pas tous les mme responsabilits chacun d'eux devra accomplir certaines tache et c'est avec ces critre que nous allons dnir les dirents types qu'aura notre systme. on produit un schma appel Diagrammes des agents qui reprsentatif les diffrents types agents,une rgle simple peut nous aider a acclrer le processus d'identication permet d'identier les dirents types qui coexistent : -Un type d'agent pour chaque utilisateur :chaque personne qui devra interagir avec notre systme devra avoir son propre type d'agent -Un type d'agent pour chaque ressources :chaque ressources a laquelle devra accder notre agent devra tre accompagner d'un agent de type spcique. A vrai dire ce que nous venons de dcrire est l'approche que nous que nous mettrons en oeuvre pour l'interaction avec les lment qui seront en dehors de notre systme c'est a dire avec les systmes dit conventionnel et les acteurs(utilisateurs),cette approche est dite transducteur ce qui veut dire qu'on va utiliser une interface qui fera le lien entre ces lments extrieurs et notre systme et cela an d'changer des donnes,s'entre inuencer... et bien sur cette interface sera un agent.
5.3.3 Identication des responsabilits :

Aprs avoir identier les dirents types d'agents nous allons ici leur aecter les direntes taches et responsabilit qu'il devront mener a bien,cette tape aura pour rsultat la mise sur pied d'une tables des responsabilit,pour ce faire nous allons revenir vers notre diagramme d'utilisation extrapoler les direntes taches que notre solution devra accomplir les regrouper si il le faut et essayer de les assigner au dirents types d'agent prcdemment identi.
5.3.4 Identication des Accointances :

Identier les accointances signient "identier qui interagit avec qui" nous allons ici identier et cerner les dirents lien que les agents devront dployer pour accomplir une tache une lien peut tre mis entre deux agents si l'un par exemple aura besoin d'information qu'un autre agent dtient ou pour
TP
lui faire part d'vnement spcique. Cette tape aura pour eet la mise a jour de la table des responsabilit et du diagramme agent ce qui inclut une remise en question prliminaire des dirents diagramme pour dtecter toute incohrence lier aux types d'agents et leur responsabilit.
5.3.5 Ranement des Agents :

Une rvaluation des dirent schma et tables que nous avons produit tout au long des tapes prcdentes en prenant en considration 2 lments importants : -Support :quelles genre d'information les agents ont ils besoin pour accomplir leur taches et comment est ce qu'ils reoivent ces information et quand. -Dcouverte :comment les agents reli par une accointances se dcouvre t'il -Gestion et Monitoring :si le systme doit garder trace des dirents agents existants
5.3.6 Le dploiement des Agents :

Un schma en rfrence sur l'emplacement ou seront dploy les Dirents agents ce schma nous sera trs utiles notamment en ce qui concerne l'tape nale lorsque nous devront agrg des agent ou les diviser
5.3.7 rvaluation des agents :

Il y'a deux lments essentiel et qui font la dirence entre un agent (cognitif) et une simple application ce sont la connaissance et le raisonnement et ce point n'est malheureusement pas toujours mis en avant d'ou nous avons ajouter cette tape , qui est ax sur ce concept "chaque type de connaissances un agent " nous listerons les dirents agent pour voir leur connaissances et leur facult a raisonner dessus pour viter de tomber sur des agents purement fonctionnel et ainsi unir les agents qui n'ont que de simple tache a remplir . cette tape devrait fournir le diagramme agent nal .
5.4 Interaction des agents

Aprs avoir identier dans les tapes prcdentes les dirents types d'agents et leur responsabilits respectifs nous passons a une tape trs critique qui est l'identication des interactions de notre systme,nous devrons identier les dirents type d'interaction de faon natif puis les traduire en
SFRF sntertion des gents
TQ
Figure 5.1 Cheminement des tapes de notre Conception

interaction reconnue par la FIPA,nous nous attellerons ensuite a dnir les dirents types de messages chang et leur format et nous ferons un lien ici avec la discipline de data mining . En utilisant la tables des responsabilits prcdemment et en dcortiquent les direntes responsabilits des dirents types d'agents on extrait celle qui ncessite une interaction avec un autre agents , nous allons mettre ces responsabilit dans une nouvelle tables,nous lui aectons un nom qui lui sois reprsentatif ,nous identions les deux partie qui interagissent c'est a dire les deux types d'agents qui joue le rle de l'initiateur de l'interaction et celui qui a qui est destin cette interaction puis nous passons a la partie la plus critique qui est la dnition du types de l'interaction ,pour ce faire nous utilisons les les interaction que la FIPA a dnit comme applicable dans les systmes multi-agents a savoir
pseEii gyxegExi
Toutes ces tapes sont a caractre itratif,il faut rpter les tapes dcrit ci dessus jusqu' avoir cerner touts les objectifs,et aecter les direntes responsabilit sur la multitude d'agents,les dirents schma seront la pour nous aider a mieux visualiser notre conception et a l'aner.
TR
5.5 notre architecture

Aprs avoir prsent les plus importants concepts de cette partie,nous allons les appliquer sur notre problme,nous devons prendre compte de plusieurs lments li a ce dernier : -Les entrepts de donnes sont distribu -les commerciaux et utilisateurs naux n'ont aucune connaissances en informatique
5.5.1 Diagramme des cas d'utilisation :

Le cas d'utilisation est la premire tape de notre conception nous allons lister les direntes fonctionnalit et scnario qu'on pourrait rencontrer. Comme nous pouvons le voir sur la gure ci dessous notre systme a raliser plusieurs fonction : prise en compte du prol du client que a soit par la lecture d'une carte magntique ou un prol existant au sein du systme. classier le client selon son prol et cela induit deux fonction : Construction d'un modle de donne simple ou agrg selon notre choix Rcupration des donnes a partir de l'entrepts de donnes.
Figure 5.2 Diagrammes de cas d'utilisation

5.5.2 Identication des types d'agents
Nous allons identier dans cette partie les types d'agents et pour arriver a nos ns nous allons utiliser l'heuristique que nous avons dcrit un peu plus haut : -Un type d'agent pour chaque utilisateur
SFSF notre rhiteture
TS
-Un type d'agent pour chaque ressources donc comme nous pouvons le voir sur la gure ci dessous nous aurons un "Agent Miner" et un agents qui servira comme interface entre notre entrept de donnes notre Systme multi-agent et et cela va de mme pour "l'Agent User" selon l'approche transducteur que nous avons vu un peu plus haut,et donc si nous voulons interagir avec notre entrept de donnes nous passerons par l'agents de type "Agent entrept de donnes" et pour interagir avec l'utilisateur a sera l'autre type.
Figure 5.3 Diagramme Type d'agents
5.5.3 Identication des responsabilit

Aprs avoir identi et cela de faon prliminaire les types d'agents auxquels nous aurons a faire,nous devons assigner les taches qui seront les leurs . Nous pouvons dj assigner a nos deux Agents de nature transducteur la responsabilit de servir d'interface entre notre systme multi-agents et les lments extrieurs auxquels ils sont assigns ,de plus il auront d'autres taches a remplir : "AM" devra pouvoir rcuprer des donnes au sein de l'entrept,leur appliquer un traitement selon les besoin(gestion du bruit,Format)ainsi que la construction du modle local "AU" devra rcuprer les recommandation ,proposer des ores aux clients .
TT

Nom de l'agent Taches Rcuperer des donnes a partir du data warehouse Agent Miner Traiter les donnes Construire des modle Rcuperer des modle a partir de "Agent Miner" Agent User Proposer des ores aux clients
Table 5.1 Table des responsabilit

5.5.4 Identication des Aquintance :
Nos agents auront a interagir ceci est un fait,a l'aide des diagrammes prcdemment tablis nous allons dcouvrir ces liens et mettre jour notre diagramme des agents. D'aprs notre tableaux de responsabilits "AU" doit recouvrir les modles de donns construit et il se trouve que "AEP"construit des modles locaux lorsque qu'il recouvre des donnes et donc ces 2 types d'agents devront interagir et on le montre' en ajoutant un lien entre ces deux types dans le diagramme d'agents
Figure 5.4 Nouveaux Diagramme agent

5.5.5 Ranement des Agents :
Nous allons revoir ici notre conception pour combler certaine incohrence li trois aspects lesquels ont t introduit un peu plus haut dans la section du mme nom que celle ci . Support :d'aprs la tables des responsabilits l'"AU"devra recouvrir des
SFSF notre rhiteture

Nom de l'agent
TU
Taches 1-Rcuperer des donnes a partir du data warehouse Agent Miner(AM) 2-Traiter les donnes 3-Construire des modle 4-Rcuprer des modle a partir de "Agent Miner" Agent Agrgation(AA) 5-Construire modle uni a partir de ces modles 6-Rcuperer des modle a partir de "Agent Agrgation" Agent User(AU) 7-Rcuperer des modle a partir de "Agent Miner" 8-Proposer des ores aux clients
Table 5.2 Table des responsabilit aprs ranement

modles de type rgional et cela partir des "AEP" mais aussi des modles agrgs aucun type d'agent dans notre architecture actuelle ne peut supporter une telle tache donc nous allons mettre jour notre diagramme des agents en y ajoutant un type d'agent "Agent Agrgation"qui aura pour but de crer un modle uni prsenter , il aura son tour rcuprer les information dont il a besoin par le biais de "AED". Donc nous avons dcouvert deux nouvelle accointances et mis jour notre table de responsabilit on peut voir cela sur les 2 gure ci dessous -Dcouverte :pour la dcouverte des agents qui ont des accointances les uns avec les autres, un systme de pages jaune sera utilis. Il sera trs intimement li l'implmentation dont on reparlera un peu plus loin -Monitoring :nous n'avons pas garder la trace des dirents agents tant donne que leur nombre ne sera pas variant et il seront toujours prsents
TV
Figure 5.5 Nouveaux diagramme des agents
5.5.6 Le dploiement des Agents :
Nous allons ici situer le champ d'action de chaque agent cela peut nous tre d'une grande utilit dans les tapes a venir "AM"prendra place auprs des serveurs qui sauvegarde les donnes ainsi il pourra traiter localement les donnes et diminuer de la charge du rseaux de par son emplacement on comprend aisment qu'il y'aura autant d'agent de ce type que de source de donnes car il ne faut pas oublier que cette architecture est distribu . "AU"seront localiser au sein des machine des utilisateur naux(dans les grandes surfaces) "AA"ce type d'agents pourrait ventuellement prendre place aux cot du serveur ou de l'utilisateurs mais la machine qui implmentera cet agent aura beaucoup d'opration d'entr sortie a grer donc son usage auprs des machine utilisateurs et dconseill et la mettre du cot serveur alourdira ses capacit car cet agent devra construire d'autre modle donc si le choix est oert implmenter ce genre d'agents sur des machine intermdiaire avec une bonne puissance de calcul et qui a bonne bande passante
SFTF sntertion et pormt de messge

Interaction Rcuprer les modles simple Rcuprer les modles agrg Rcuprer des modles simple Resp 4 6 7 Protocole FiPA Request FiPA Subscribe Contract Net Rle I I I Avec AM AA AM
TW
Lorsque Priodiquement Modle construit AA indisponible
Table 5.3 Table des Interaction
5.6 Interaction et Format de message

5.6.1 Interaction
Nous tenterons dans cette partie de cerner les direntes interaction que les agents aurons dployer pour atteindre leur objectifs naux,grce la table des responsabilit nous pouvons construire le tableau de la gure ci dessous : -AA devra rcuprer les modles qui ont t cre localement par AM,donc priodiquement il rcupra ces modles si ils ont subi des modication par rapport aux derniers construits et utilisera le protocole FIPA Request . -AU devra rcuprer pour sa part le modle agrg de chez AA toujours en utilisant en utilisant le protocole FIPA Subscriber touts les agents s'inscrirons chez AA et recevront les modles des que ceci seront construits,nous avons choisi ce protocole pour permettre une exibilit plus grande pour notre . -AU devra aussi rcuprer des modle de chez AA et cela pour viter une architecture centralis et plutt adopter une approche peer to peer (en cas de panne notre systme sera toujours actif) pour ce faire notre AU utilisera le protocole Contract Net et ce basera sur trois paramtres pour lire le meilleur interlocuteur le temps de rponse ,la validit des modle(le taux d'erreurs) ,et la date de production du modle(plus le modle est rcent mieux c'est) nous aurons l'occasion de parler de cela lors de notre prochain chapitre
5.7 Conclusion
Nous avons essay d'introduire la premire partie de notre mthodologie qui s'est inspire de la tde wthodologie nous avons grce elle cern les rles et les principales responsabilits de chaque type d'agent. La prochaine tape est de prsenter la constituante interne de chaque agent ainsi que les dirents comportement qui devront gr ces taches.
Architecture Interne des agents

6.1 Introduction
Nous avons dcrit dans le chapitre prcdent les rles et l'interaction que les dirents agents auront dployer pour venir bout de notre problmatique,on a dcrit pour chaque agent les responsabilits qui lui incomberait et les taches qu'il devrait remplir sans pour autant dcrire la faon dont cet agent arrivera ses ns et c'est exactement ce que nous verrons dans ce chapitre ,l'architecture interne propre de chaque individus est une constituante trs importante dans une socit organis,tant donne que nous sommes face systme multi-agent qui utilise des agents exclusivement cognitifs ,ces derniers devront percevoir leur environnement, raisonner et prendre des dcisions,l'intelligence de notre systme dpendra grandement de l'intelligence de chacun de ces composants,nous avons dni dans le chapitre prcdent les accointances de chacun de nos agents qui reprsentent son environnement ,nous devons maintenant montrer comment va t'il raisonner sur la base des informations qu'il reois partir de ces accointances toutes les responsabilits qui incombent un agent seront remplies grce leurs comportements ,dans ce qui suit nous allons dtailler le comportement de chaque agent et dcortiquer la connaissance qu'ils acquirent ou qu'ils comportent ,Nous dbuterons d'abord par l'Agent Miner puis l'Agent Agrgateur et nous nirons par l'Agent User.
Chapitre 6
TFPF pormt de messges
UI
6.2 Format de messages

Nous devons introduire avant de pouvoir avancer dans notre conception deux formats, vi wwv ,vi tiwv, ces deux formats sont utiliss pour propager les rgles et ne sont en aucun cas une reprsentation de la connaissance acquise. Le wwv pour reditive wodel wrkup vnguge est un modle bas sur XML pour reprsenter les modles de donnes ,il est dvelopp et maintenu par le ht wining qroup orgnistion pour la standardisation des modles de data mining,la force de ce modle est sa facilit de dploiement et sa exibilit on pourra passer de ce format vers un ensemble de rgles assez aisment . Lorsque un agent devra raisonner sur des rgles et prendre une
Figure 6.1 Exemple format PMML

dcision, il lui faut un format de donnes que ce dernier pourra assimiler d'une manire automatique ,c'est dans cette optique que nous introduisons un autre format bas sur XML nomm tiwv que les agents (Implmentant Jess) peuvent automatiquement comprendre et raisonner avec ,dans la gure un petit exemple :
Figure 6.2 L'arbre de dcision
UP
ghpitre TF erhiteture snterne des gents
6.3 Agent Miner

Cet agent sera positionn localement auprs des serveurs ou se trouvent les donnes,d'aprs la table des responsabilits il devra Construire des modles de donnes locales. Transformer ces modles dans un format assimilable par les agents. dans ce qui suit nous allons dcrire ces deux fonctions :
6.3.1 Construction du modle

Comme nous l'avons signal dans un chapitre prcdent,notre systme devra produire des ores aux dirents clients ,et cela en se basant sur les donnes les plus rcentes ce qui induit la construction de modles assez souvent .Cette tache sera de nature rcurrente ce qui nous a pouss la concevoir avec un iker fehviourqui est un comportement dni par la FIPA [Bellifemine 07] et donc devra s'excuter des intervalles de temps rguliers ,ces intervalles seront calculs en rapport avec le rythme de mise jour de l'entrept. dans ce comportement nous trouvons plusieurs taches : D'abord il devra interroger les entrepts de donnes pour avoir l'ensemble de donnes sur lesquelles il est suppos apprendre le schma de donnes,grer le bruit dans les donnes . Si les donnes sont trop importantes, ce qui rendrai l'utilisation de techniques de data mining trop long ou trop dicile, nous utiliserons l'chantillonnage ,malheureusement la plus part des serveurs de bases de donnes ne supportent pas ce genre d'oprations,nous avons donc imagin un mcanisme pour arriver ce rsultat ,nous avons ajout une colonne Hasard ,nous aecterons des nombres entiers au hasard et nous rordonnerons la table puis nous slectionnerons les premires lignes de chaque classes ,car il faut et ceci est d'une importance capital slectionner les lignes en respectant le pourcentage de chaque classes : Si par exemple dans notre scnario le pourcentage de Bon clients et de 60 pour cent et celui des mauvais 40 on doit retrouver les mmes proportions. Nous appliquons l'algorithme de l'arbre de dcision qui construit un arbre de la forme de la gure : Ce que nous voulons extraire c'est des rgles partir de cet arbre de dcisions, nous parcourons chaque branche de la racine jusqu' la feuille pour nous donner des rgles tel que :
sp gontrya4e4 nd egebQH rix ypeafon glient
TFQF egent winer
UQ
Figure 6.3 L'arbre de dcision

Ceci est la dicult principale la plus part des Logiciels dans le domaine du data mining, ils proposent en sortie des modles ou il faut insrer directement les paramtres, donnent des modle qui ne sont pas exibles et qui sont impermables tout changement et modication . C'est pour ces raisons que nous avons export les modles (l'arbre de dcision )en un format tout fait exible avec lequel nous pouvons facilement retrouver la rgle dcrite en haut et ce format est nomm wwv un extrait de chier wwv est montr sur la gure .
6.3.2 Modication des modles

Si ee est dfectueux ou indisponible l'ew devra fournir e les modles qu'il devra utiliser pour pouvoir fournir les ores . Nous avons Conu un module qui va convertir les modles qui sont en format wwv en tiwv cela permettra e d'tre oprationnel et jour sans pour autant faire un quelconque traitement. Le Comportement qui implmentera ces taches est le gyli fehviour il sera bloqu et se rveillera lorsque un message arrivera de la part de e, cela aura pour rsultat l'excution des taches qui on tait prcdemment dcrites tout en transformant le modle. le tableaux ci dessous fait un rcapitulatif de tout les comportements que nous avons cit
UR
ghpitre TF erhiteture snterne des gents e
Comportement Type Condition Construire le modle Ticker Behaviour chaque priode de temps Transformer le modle Cyclic Behaviour lorsque une demande arrive de
Table 6.1 Rcapitulatif pour ew
6.4 Agent Agrgateur

Cet agent est la pice maitresse de notre systme multi-agents, l'ecacit de ce dernier dpends presque entirement de ce ee il aura eectuer les taches suivantes : Crer partir de tous les modles obtenus un modle gnrique. Convertir ce modle en un modle comprhensible par les agents .
6.4.1 Cration d'un modle gnrique
Dans la section prcdente nous avons dit que L'ew devra construire des modles de donnes grce aux arbres de dcision et sous forme de wwv ,ee les rcupra grce la responsabilit numro six que nous avons dcrit dans la table ,cette responsabilit utilise un protocole d'interaction FIPARequest,ce dernier doit tre excut intervalle rgulier pour pouvoir suivre la production de modles dans ew et donc utilisera le iker fehviour ; lorsque l'agent rcuprera ces modles sous forme de chier wwv il devra les agrger et pour cela nous utilisons la technique dcrite dans [Pichuka 07] et dans [Aoun-Allah 07] cette technique est dcrite ci dessous : Sur chaque serveur local faire (a)construire le modle : Ri ={rik | k [1..n] } avec n le nombre de rgles et R le modle (b)calculer pour chaque modle le coecient de condence crik sur le site central (a) Crer R= i=1..nd Ri avec nd le nombre d'entrept de donnes jusqu' l'tape il n'y'a pas de problme on construit des modles puis pour chaque rgle on assigne un coecient qui va tre calcul selon une equation que nous montrerons plus tard puis nous arrivons la l'tape d'unication de modle,c'est la o nous introduirons la notion de conit,lorsque deux rgles dcrivent le mme objet comme par exemple :
TFRF egent egrgteur
US
Comportement Type Condition Rcuprer et transformer les modles Ticker Behaviour chaque priode de temps
Table 6.2 Rcapitulatif pour ee

r1 : r2 :
on dit dans ce cas que nous avons un conit et pour le rsoudre nous allons utiliser le coecient que nous avons calcul tout l'heure ,nous additionnerons les coecients de toutes les rgles qui ressemblent r1 puis ceux de r2 nous ferons la moyenne pour chacune d'elle : le coecient le plus bas l'emportera . le point central de la gestion de conit est bien sur le coecient de chaque rgles que nous devons calculer ,nous avons modi ce coecient pour l'adapter notre problmatique ; tr aBin@nDnEr D A cette valeur reprsente le plus petit taux d'erreurs dans le pire cas dans 1- fin reprsente la loi binomiale cette loi provient fin@nDkDcd A qui est la probabilit que le classieur produisent k erreurs parmi n instances avec un taux d'erreurs vritable avec n le nombre d'instances K le taux d'erreurs minimums cd la vritable erreur du classicateur nous ajoutons tr une autre information ,c'est l'anciennet de l'information :plus la rgle est ancienne moins elle est crdible donc nous ajoutons cette contrainte comme suit ;
cr tr
sp gontrya4e4 nd egebQH rix ypeafon glient sp gontrya4e4 nd egebQH rix ypeawuvis glient
a avec une unit de temps qu'on dnira avec les exprimentations.
pour les autres rgles nous aurons tout simplement les mettre ensemble vu qu'ils ne comportent pas de conit
6.4.2 Transformation de modle

Tout comme nous avons vu tout l'heure dans l'ew l'ee doit lui aussi convertir les modles de wwv vers des modles en tiwv ,puis il devra les envoyer tout les agents qui se sont inscrits au pseEusrie ces deux taches font partie du comportement que nous avons dni plus haut qui est le iker fehviour ce comportement sera synchronis avec celui des ew pour pouvoir rcuprer de nouveaux modles
UT
Comportement Obtenir modle de ee Obtenir modle de ew Fournir Ore
ghpitre TF erhiteture snterne des gents

Type Cyclic Behaviour Ticker Behaviour Cyclic Behaviour Condition lorsqu'un utilisateur entrera les donnes aprs priode de temps et pas de wet lorsque le prol sera classi
Table 6.3 Rcapitulatif pour e
6.5 Agent User

Cet agent est le seul qui interagira avec le clients ,notre systme comme nous l'avons soulign dans un paragraphe prcdents utilise l'approche transducteur,cet agent en est l'instrument il reprsente l'interface entre le systme et le client,c'est le seul agent qui aura une interface graphique pour pouvoir interagir avec les tres humains. D'aprs la table des responsabilits cet agent devra : Assimiler les informations lies au client. Fournir des ores aux clients.
6.5.1 Assimilation
L'agent devra assimiler les connaissances qui lui parviendront et cela partir de deux sources ee et lew. notre agent recevra cette connaissance sous format tiwv qu'il s'injectera,ce processus continuera indniment et est actionn par l'arriv d'un message lee :le comportement qui l'implmentera sera de type gyli feE hviour. Au mme moment un autre comportement sera la pour prvenir toute panne ou problme li l'ee, ce comportement sera de type iker fehviour, si ce comportement se rveille et il n'y a pas eu de mise jour des rgles alors il lancera une interaction de type gontrt xet vers les ews pour obtenir des modles, le critre de choix de l'agent qui fournira le modle est la vitesse de rponse ,car opter pour l'interrogation des ew n'est qu'une solution secondaire recalculer l'erreur de chacune serait une perte de temps
6.5.2 Ores
Comme nous l'avons dit tout l'heure cet agent est dot d'une interface graphique, il attendra qu'un utilisateur entre sa carte ou son login et mot de passe pour se mettre en marche, il assimilera des informations sur l'utilisateur puis il les soumettra aux rgles que l'agent a assimil tout l'heure et c'est la
TFTF gonlusion
UU
que l'agent devra dcider : si il doit lui proposer l'ore ou pas . Cette tache sera implmente dans un comportement de type Cyclique qui sera bloqu et attendra que l'utilisateur entre des informations pour qu'il se rveille et soumet le prol de ce dernier ses rgles.
6.6 Conclusion
Ceci est la dernire tape de notre conception, nous avons dcri l'tat interne de chaque agents : nous avons dcri les dirents comportements que les agents devrons dployer pour remplir leurs taches. Les dirents comportements qui auront grer les direntes interactions.
Conclusion
Ce que nous venons de prsenter est une suite d'tapes pour concevoir un systme multi-agents capable de faire de l'extraction de connaissances,nous l'avons appliqu a un systme de recommandation et nous avons vu de quelle faon nous avons remplies touts les objectives,nanmoins ces tapes peuvent tre facilement port a touts les systmes qui aspirent a voluer dans les conditions suivantes : Le systme volue dans un systme distribu une large quantit de donnes pour extraction de connaissances propagation de ces connaissances . L'utilisation des format en XML dmultiplie les possibilit de propagation de l'information ,tout les systme (agent ou non) peuvent prtendre a acquierire de la connaissances rien qu'en interagissant .
Quatrime partie Ralisation et mise en oeuvre
Ralisation et mise en oeuvre

7.1 Introduction
Nous arrivons la dernire tape de notre projet qui est l'application des dirents concepts et conceptions que nous avons expos et expliqu.Les outils qui peuvent nous aider mettre en oeuvre notre conception sont nombreux, le march des applications ore de nombreuses possibilits, nous avons donc choisi d'utiliser des outils de tout bord (propritaire ,non propritaire) dirents langages et cela pour donner une performance optimale notre application . Dans ce qui suit nous allons lister tous les outils que nous avons utilis ainsi que les raisons qui nous ont pouss les choisir. Nous allons aussi introduire notre application .
Chapitre 7
7.2 Benchmark
Le Transaction Process Council (TPC) est une organisation but non lucratif, fond en 1988, elle dnit des benchmarks pour les bases de donnes et les systmes dcisionnels, l'un de ses atouts est sa totale neutralit envers les fournisseurs des technologies ,elle compte parmi ses membres la majeur partie des plus grands fournisseurs de service de traitement de donnes ,ce qui lui donne une trs grandes crdibilit .
7.2.1 TPC-DS
le TPC Benchmark DS (TPC-Decison Support) est un benchmark qui modlise plusieurs aspects -d'ordre gnral- de l'application des systme d'aide la dcision en entreprise, incluant la maintenance des donnes et la gnration de requtes . s Le Benchmark propose une valuation de la performance,et modlise les processus d'aide la dcision suivant : Gnration et examen de larges quantits de donnes . Proposer des solutions de rels problmes d'entreprises . Excution de plusieurs sortes de requtes de direntes complexits (ad-hoc,
VP
ghpitre UF listion et mise en oeuvre
Figure 7.1 Membre du TPC

Olap, Data Mining) . il est caractris par un nombre d'entres et sorties lev . il est priodiquement synchronis avec la source (OLTP) .
UFPFIFI wodle
le TPC-DS modlise le systme d'aide la dcision d'une chaine de grande surface qui distribue dirents produits(lectro-mnagers ,nourriture... ), le modle prend en compte la distributivit de ces grandes surfaces,il modlis les ventes par magasin, internet et catalogues,que a soit pour le rachat ou le retour. Les tables de fait sont au nombre de sept : le modle contient deux tables de fait pour chacun des trois rseaux de distribution : Une table pour les ventes. Une table pour les retours. Il contient une table de fait pour modliser l'inventaire . Il fournit aussi des tables dimensionnelles qui sont au nombre de 17 qui sont utilises par les tables de faits . Dans ce qui suit quelques statistiques sur les direntes tables qui existent : Comme nous pouvons le voir sur la gure un extrait du modle on voit que le modle choisi est le modle en ocon de neige qui utilise des tables conformes que nous avons vu dans notre partie tat de l'art(plus communment appel
UFPF fenhmrk
VQ
Figure 7.2 Tables du modle
Figure 7.3 Statistiques des tables

modle en constellation)
7.2.2 Motivation
On peut trouver les raisons d'utiliser TPC-DS comme benchmark au lieux des autres existants dans l'article [Poess 05] nanmoins nous pouvons citer quelques raisons : Il modlise un vritable processus d'entreprise. Il est caractris par une exibilit qui nous permet d'exploiter ses donnes grce des requtes de data mining. Il respecte les spcications de modlisation des entrepts de donnes. Il est reconnu par la plus grande partie des entreprises activant dans le traitement et le stockage de donnes.
VR
Figure 7.4 Un chantillon des modles existants

T.Donnes 1G 10G 20G T.Fait(Mo) 32 333 3200 T.Inventaire 290 2828 4045 gnration(Mn) 3 187 370 Intgration(Mn) 5 67 132
Table 7.1 Exprimentation Benchmark
7.3 Exprimentation
Nous avons gnrer trois chantillon de donnes 1,10,20 GO nous pouvons remarquer que le temps de gnration et d'intgration dans le moteur de basses de donnes augmente exponentiellement. Les donnes qui sont gnr sont synthtiques ce qui veut dire elle ne s'inspire pas de la ralit mais suit une loi bien dnie (Normal,Poisson...) ceci optimise la gnration des donnes.
UFRF tde
VS
7.4 Jade
Jade(Java Agent Developpement Framework)est une plateforme dvelopp par eleom stli en 2003,entirement conu en java, elle simplie l'implmentation des systmes multi-agents ,grce son interface graphique elle simplie le dboguage et le dploiement et cela en quelques clics, elle peut intgrer des bibliothques provenants de vepce qui la rend encore plus exible . La dnition d'un agent dans tehi est aussi simple que la dnition d'une classe,elle inclut plusieurs bibliothques qui reprsentent les interactions et les comportements ce qui facilite normment le travail du dveloppeur qui n'aura qu' personnaliser ces classes.
Figure 7.5 GUI de JADE
7.4.1 Motivation
Il respecte les spcications de la FIPA . Interoprabilit avec plusieurs autres composants . Sa conception en java lui permet d'tre multi-plateforme . Outil open source ce qui garantit une maintenance continue de la plateforme .
VT
7.5 Jess
Jess est un moteur d'infrence pour la plateforme java dveloppe par nE di xtionl vortories,il utilise un langage fonctionnel pour spcier la logique, il sut d'utiliser des rgles en utilisant l'un des deux formats suivant : ve lngge de rgle pormt wv @tiwvA on devine aisment que le deuxime format est le plus convenable pour notre application pour des raisons cites dans la partie conception
7.5.1 Intgration avec Jade

Comme nous pouvons le voir sur la gure ci dessous
Figure 7.6 Jade et Jess

les deux plateformes sont complmentaires pour la conception d'agent cognitif ,jade peut percevoir son environnement et peut inuer dessus , quand Jess, il prendra des dcisions sur la base des perceptions fournies par jade .
7.5.2 Motivation
L'utilisation de tess comme moteur d'infrence procure plusieurs avantages : Une compatibilit entre jade et tess criture des rgles en format XML
UFTF v erver
VU
ont commenc tre intgr, Microsoft a tenu le cap, et maintenant dans sa dernire version toute une suite d'outil d'aide la dcision est notre disposition .
7.6 SQL Server wirosoft v erver est un systme de gestion de base de donnes (abrg en SGBD ou SGBDR pour Systme de gestion de base de donnes relationnelles ) dvelopp et commercialis par la socit wirosoft . Depuis la version v erver PHHH, des outils pour l'aide la dcision
7.6.1 Les outils
notre solution : un moteur relationnel pour grer et stocker les tables dimensionnelles de l'entrepts de donnes. Un service d'intgration pour pouvoir construire le systme ig(Extraction, Transformation, Chargement) . Ore des services de data Mining pour extraire des modles. des environnements pour le BI accompagne v erver qui augmente la productivit et l'ecacit des utilisateurs ;
v erver ore plusieurs outils qui nous aiderons mettre en oeuvre
7.6.2 Data Mining
dcision, les taches de data mining se feront par l'intermdiaire de ce langage qui est suppos faciliter et optimiser les taches d'aide la dcision. Les arbres de dcision se voit aussi optimis, l'algorithme est toujours le mme gRFS mais wirosoft utilise une architecture qui permet de booster la tache des arbres de dcision sur les tables relationnelles on peut trouver plus d'informations dans [Poess 05].
wirosoft est parmi les premiers qui ont utilis hw qui est un langage qui s'approche de v, il permet de spcier des requtes pour l'aide la
7.7 Notre Application

Notre application se prsente (pour l'utilisateur) sous forme d'une interface graphique, ou l'utilisateur pourra rentrer ses donnes personnelles, acheter un produit, et recevoir des ores
VV
Figure 7.7 Notre application
7.8 Exprimentation
Dans cette section nous allons prsenter quelques exprimentations que nous avons eectu, les donnes qui sont gnres le sont sur une seule machine,ce qui laisse imaginer les potentialits lorsque plusieurs sont mises en parallles,mais d'abord nous allons jeter un coup d'oeil l'arbre qui a t gnr par Microsoft Decision Tree (MDT) Bien sur les donnes sur lesquelles a t gnr cet arbre de dcision sont
Figure 7.8 Notre application

purement synthtiques,et donc sont prendre titre d'exemple seulement. la lecture qui est faite sur cet arbre est que les femmes sont plus susceptibles d'tre de mauvais clients que les Hommes .Les autres attributs ont t ignor
UFWF gonlusion
Taille donnes(Go) 1 10 20 Taille PMML(Ko) 2 3 2.5
VW
Dur moyenne pour DM (secondes) 33 67 125
Table 7.2 Exprimentation

car ils taient pas assez pertinents d'aprs wh Nous avons gnr trois quantits de donnes 1,10 et 20 GO nous remarquons dj que la gnration de donnes consomme beaucoup de temps ce qui est d essentiellement au benchmark . Nous pouvons aussi voir que la taille du chier en PMML est inniment petite car elle est indpendante de la taille de donnes et ne contient que les rgles ce qui garantit une rapidit lors de son transfert travers un rseau. le traitement des rgles par les agents ne dpasse une seconde ce qui garantit une rapidit et ecacit optimum.
7.9 Conclusion
Les exprimentations prouvent que notre architecture est tout fait crdible et applicable dans le monde rel,vu la taille des chiers changs travers le rseau elle ne ncessite pas une grande bande passante. On peut remarquer que notre systme utilise plusieurs plateforme,langage et format .Cela est une consquence -en grande partie- la nouveaut du domaine auquel nous nous sommes attaqus, cela a gnr plusieurs dicults et parfois des incompatibilits ce qui nous pousse une rexion :pourquoi ne pas dvelopper un outil spciquement conu pour l'extraction de la connaissance travers des agents,ce qui fera partie de nos perspectives.
Conclusion et Perspective
Nous avons essay tout au long de ce projet de prsenter une nouvelle approche pour exploiter les entrepts de donnes distribues et ainsi orir un service performant et able pour des systmes qui auraient pour vocation d'exploiter ces donnes grce des outils d'aide la dcisions tel que le data Mining ,les agents ont montr une fois encore leurs utilits dans des environnements distribus et surtout dans des environnements incertains(possibilit de panne) La symbiose de ces deux disciplines a donn naissances L'Agent Mining, une branche trs prometteuse nous avons vu dans notre cas comment elle a contribu rendre notre systme ecace mais ses applications sont indnombrables et cela s'explique par leurs complmentarits tant au niveau de l'intelligence des agents que de l'optimisation du data mining. L'agent Mining se heurte un problme majeur auquel nous avons du faire face, l'inexistence d'une methodologie ou d'un framework capable de nous accompagner lors de la conception d'un systme utilisant cette branche, notre travail d'une manire indirecte s'inscrit dans ce sillage, nous pouvons extrapoler partir de notre travail un framework assez exible pour l'achvement d'un tel systme tout en exploitant au maximum les capacits de chacun de ses deux constituants. Malgr que notre systme ait atteint tous les objectifs de dpart il peut tre amlior et cela sur deux plan : Notre systme peut tre bas sur les i au lieux des entrepts de donnes, les i sont des pro logiciel qui peuvent contenir des entrepts de donnes mais contiennent aussi des informations non historises ce qui peut donner une plus grande exibilit et plus de possibilit notre systme. Un autre point trs important est l'apprentissage : l'entrept de donnes n'est pas la seul source de donnes accessible a l'agent, il y'a un proverbe qui dit que la connaissance de soi est la sagesse, appliquer cela aux agents serait d'apprendre de ses propres comportements et de ses propres erreurs ce qui lui confrerait une plus grande autonomie et une ecacit dcuple.
Bibliographie
[A. Mitkas 04] Andreas A. Mitkas, L. Symeonidis, Dionisis Kehagias & Ioannis N. Athanasiadis. Application of Data Mining and Intelligent Agent Technologies to Concurrent Engineering. IJAM, 2004. Michael Wooldridge, An introduction to multiagent systems. Chichester : Wiley and Sons, 2009. Fabio Luigi Bellifemine, Developing multi-agent systems with jade. Chichester : Wiley and Sons, 2007. Brian Henderson-Sellers, Paolo Giorgini, Agent-oriented methodologies. Hershey : IDEA GROUP, 2005. Andreas L. Symeonidis, Pericles A. Mitkas, Agent intelligent through data mining. New York : Springer, 2005. Longbing Cao, Data mining and multiagent integration. New York : Springer, 2007. Mohamed Aoun-Allah & Guy Mineau. Distributed Data Mining : Why Do More Than Aggregating Models. IJCAI, 2007. Oded Maimon, Lior Rokach, Data mining and knowledge discovery handbook. New York : Springer, 2010. Ian H.Witten, Eibe Frank, Data mining : Practical machine learning tools and techniques. San Francisco : ELSEVIER, 2005. Jamie MacLennan, ZhaoHui Tang, Data mining with microsoft sql server 2008. Danvers : Wiley Publishing, 2009. Ralph Kimball, The data warehouse toolkit. New York : Wiley Publishing, 2002. Jean-Marie Gouarne, Le projet dcisionnel. Paris : Eyerolles, 1998. Joy Mundy, Warren Thornthwaite, Ralph Kimball, The microsoft data warehouse toolkit : With sql server 2005 and the microsoft business intelligence toolset. Indiana : Wiley Publishing, 2006. R. L. Grossman, S. Bailey, A. Ramu, B. Malhi & A. Turinsky H. Sivakumar. Papyrus : A System for Data Mining over Local and Wide Area Clusters and Super-Clusters. IEEE Press, 1999.
[Wooldridge 09] [Bellifemine 07] [Sellers 05] [Symeonidis 05] [Cao 07] [Aoun-Allah 07] [Maimon 10] [Witten 05] [MacLennan 09] [Kimball 02] [Gouarne 98] [Mundy 06]
[Grossman 99]
WP
[Pichuka 07]
filiogrphie
Chaithanya Pichuka, Raju S. Bapi, Chakravarthy Bhagvati, Arun K. Pujari & B. L. Deekshatulu. A Tighter Error Bound for Decision Tree Learning Using PAC Learnability. IJCAI, 2007. [Poess 05] Meikel Poess, Raghunath Othayoth Nambiar & David Walrath. Why You Should Run TPC-DS :A Workload Analysis. 32nd International Conference on Very Large Data Bases (VLDB), 2005. [Rabah 09] Bouabdallah Rabah & Merrad Khaled. Conception et ralisation d'un outil d'aide a l'administration des entrepts de donnes relationnels. Master's thesis, Universit des sciences et technologies Houari Boumedienne, 2009. [XindongWu 07] XindongWu, Vipin Kumar, J. Ross Quinlan, Joydeep Ghosh, Qiang Yang, Hiroshi Motoda, Georey J. McLachlan, Angus Ng, Bing Liu, Philip S. Yu, Zhi-Hua Zhou, Michael Steinbach, David J. Hand & Dan Steinberg. Top 10 algorithms in data mining. Verlag London, 2007.
Abstract :
Notre travail a pour but de concevoir un systme multi-agents capable d'extraire de la connaissances a partir d'entrept de donnes distribu et cela en utilisant des techniques de data mining,cette connaissance devra pouvoir etre propag et assimiler d'une faon automatique sans l'intervention d'un tiers .
Keywords :
Systeme multi-agents,Data Mining,Agent Mining,systme Dcisionnelle ,entrept de donnes.

These SMA

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

These SMA

Uploaded by

Copyright:

Available Formats

Rpublique Algrienne Dmocratique et Populaire

Ministre de l'Enseignement Suprieur et de la Recherche Scientique

niversit des ienes et de l ehnologie rouri foumediene

Facult d'lectronique et d'Informatique

wrF eseuvs o(ne wrF es grisur vyes rsident ixminteur ixminteur

M NECIR M AMANI Mme TAMEN

Table des matires

I ystme multiEgent et uhh ystme multiEgent

unowledge hisovery in htses @uhhA

ii P ystme disionnel et entrept de donnes

Q lteforme et tehnologie existntes

III Conception et modlisation de la solution

sntrodution R fuisness wodle

S erhiteture du systme multiEgent

T erhiteture snterne des gents

U listion et mise en oeuvre

gonlusion et erspetive filiogrphie

Table des gures

Liste des tableaux

7.1 Exprimentation Benchmark . . . . . . . . . . . . . . . . . . . 7.2 Exprimentation . . . . . . . . . . . . . . . . . . . . . . . . .

Premire partie tat de l'art

Systme multi-agent et KDD

ghpitre IF ystme multiEgent et uhh

1.3 L'intelligence des agents

IFQF v9intelligene des gents

ghpitre IF ystme multiEgent et uhh

Figure 1.1  Interaction dans les systmes multi-agents

IFSF gommunitions et tes de lngge

1.5 Communications et actes de langage

1.5.1 actes de langages

ghpitre IF ystme multiEgent et uhh

1.5.2 Langages de communication des agents

1.6.1 Dans quel cas utiliser l'agent

IFTF wthodologies l9environnement est ouvert omplexe ou inertin

1.6.2 les mthodologies

ghpitre IF ystme multiEgent et uhh

les gents pour l reherhe d9informtion X

Notre re est l're de

les gents pour le work)ow et le uisness mngement proess X

Knowledge Discovery in Databases (KDD)

IFIPF le proessus du uhh

1.12 le processus du KDD

Figure 1.2  processus du kdd

sdenti(er les ojetifs du proessus du uhh X Dvelopper ou acqu-

ghpitre IF ystme multiEgent et uhh

1.13 Taxonomie des mthodes de data mining

1.13.1 mthodes de dcouverte :

IFIQF xonomie des mthodes de dt mining

Figure 1.3  Taxonomie du KDD

wthode desriptive X cette mthode est oriente vers l'interprtation

1.13.2 mthodes de vrication

ghpitre IF ystme multiEgent et uhh

1.13.3 supervis et non supervis

mthodes supervises X ces mthodes sont utilises an de trouver des

1.14 La place du data mining dans les systmes d'aide la dcision

IFISF espirtions du domine

Figure 1.4  Systme dcisionnel

ghpitre IF ystme multiEgent et uhh

Systme dcisionnel et entrept de donnes

ghpitre PF ystme disionnel et entrept de donnes

2.2 Le projet dcisionnel

PFQF ves entrept de donnes

2.3 Les entrept de donnes

Ministre de l'Enseignement Suprieur et de la Recherche Scientique

Table des gures

Figure 1.1 Interaction dans les systmes multi-agents

Figure 1.2 processus du kdd

Figure 1.3 Taxonomie du KDD

1.13.2 mthodes de vrication

mthodes supervises X ces mthodes sont utilises an de trouver des

Figure 1.4 Systme dcisionnel

Figure 2.1 L'architecture de l'entrept de donnes

Figure 2.2 Modle d'un entrept de donnes

Figure 2.3 Modle en ocon de neige

Figure 2.4 Modle avec les dimensions conformes

Figure 2.5 Exploitation des entrepts de donnes

Figure 3.1 Possibilit d'intgration et d'interaction

Figure 3.2 Architecture d'Agent Academy

Figure 3.3 L'architecture IRF

Figure 4.1 Notre modle de donnes

Table 4.1 Table Client

Table 4.2 Table Adresse Client

Table 4.3 Status Client

Table 4.4 Table Date

Table 4.5 Table Magasin

Table 4.6 Table Retour-Magasin

Figure 4.2 Notre modle de donnes