LesSMA Ferber

ii
Les Syst` emes Multi Agents: vers une intelligence collective

Jacques Ferber 1995
ii
Contents
Pr eface Avant-propos 1 Principes des syst` emes multi-agents 1.1 Pour une intelligence collective . . . . . . . . . . . . . 1.1.1 De la machine pensante... . . . . . . . . . . . 1.1.2 ... ` a lorganisation articielle . . . . . . . . . . 1.2 Agent et soci et e . . . . . . . . . . . . . . . . . . . . . 1.2.1 Quelques d enitions . . . . . . . . . . . . . . 1.2.2 Niveaux dorganisation . . . . . . . . . . . . . 1.2.3 Social ou biologique? . . . . . . . . . . . . . . 1.2.4 Architecture et comportement . . . . . . . . . 1.2.5 Langages, communications et repr esentations . 1.3 Un peu dhistoire . . . . . . . . . . . . . . . . . . . . 1.3.1 Les premiers ages . . . . . . . . . . . . . . . . 1.3.2 L age classique . . . . . . . . . . . . . . . . . 1.3.3 Linuence de la vie articielle . . . . . . . . . 1.3.4 Les temps modernes . . . . . . . . . . . . . . 1.4 Domaines dapplication . . . . . . . . . . . . . . . . . 1.4.1 La r esolution de probl` emes . . . . . . . . . . . 1.4.2 La simulation multi-agent . . . . . . . . . . . 1.4.3 La construction de mondes synth etiques . . . 1.4.4 La robotique distribu ee . . . . . . . . . . . . . 1.4.5 La conception k en etique de programmes . . . 1.5 Les grands th` emes de la k en etique . . . . . . . . . . . 1.5.1 La probl ematique de laction . . . . . . . . . . 1.5.2 Lindividu et sa relation au monde . . . . . . 1.5.3 Linteraction . . . . . . . . . . . . . . . . . . . 1.5.4 Ladaptation . . . . . . . . . . . . . . . . . . 1.5.5 La r ealisation et limpl ementation des SMA . 1.6 Domaines voisins des syst` emes multi-agents . . . . . 1.6.1 Lintelligence articielle . . . . . . . . . . . . 1.6.2 La syst emique . . . . . . . . . . . . . . . . . . 1.6.3 Les syst` emes distribu es . . . . . . . . . . . . . xiii 1 5 5 5 7 12 12 17 19 24 25 28 28 29 31 32 34 34 38 43 50 52 54 54 54 55 56 56 56 57 57 58
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
vi 1.6.4 1.6.5
CONTENTS La robotique . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Ce qui ne rel` eve pas de la k en etique . . . . . . . . . . . . . . . 60 63 63 65 65 67 68 69 70 70 70 70 71 71 71 71 72 74 74 75 78 79 81 82 82 83 84 84 85 85 86 86 88 89 91 91 92 93 94 95 95 99
2 Interactions et coop eration 2.1 Situations dinteraction . . . . . . . . . . . . . . . . . . . . . . 2.2 Composantes des interactions . . . . . . . . . . . . . . . . . . 2.2.1 Buts compatibles et incompatibles . . . . . . . . . . . . 2.2.2 Relations aux ressources . . . . . . . . . . . . . . . . . 2.2.3 Capacit es des agents par rapport aux t aches . . . . . . 2.3 Types dinteraction . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Ind ependance . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Collaboration simple . . . . . . . . . . . . . . . . . . . 2.3.3 Encombrement . . . . . . . . . . . . . . . . . . . . . . 2.3.4 Collaboration coordonn ee . . . . . . . . . . . . . . . . 2.3.5 Comp etition individuelle pure . . . . . . . . . . . . . . 2.3.6 Comp etition collective pure . . . . . . . . . . . . . . . 2.3.7 Conit individuel pour des ressources . . . . . . . . . . 2.3.8 Conits collectifs pour des ressources . . . . . . . . . . 2.3.9 Niveau danalyse des situations dinteraction . . . . . . 2.4 Formes de coop eration . . . . . . . . . . . . . . . . . . . . . . 2.4.1 La coop eration comme attitude intentionnelle . . . . . 2.4.2 La coop eration du point de vue de lobservateur . . . . 2.4.3 Lam elioration de la survie . . . . . . . . . . . . . . . . 2.4.4 Laccroissement des performances . . . . . . . . . . . . 2.4.5 La r esolution de conit . . . . . . . . . . . . . . . . . . 2.5 Les m ethodes de coop eration . . . . . . . . . . . . . . . . . . . 2.5.1 Le regroupement et la multiplication . . . . . . . . . . 2.5.2 La communication . . . . . . . . . . . . . . . . . . . . 2.5.3 La sp ecialisation . . . . . . . . . . . . . . . . . . . . . 2.5.4 La collaboration par partage de t aches et de ressources 2.5.5 La coordination dactions . . . . . . . . . . . . . . . . 2.5.6 La r esolution de conit par arbitrage et n egociation . . 2.6 Organisations et coop eration . . . . . . . . . . . . . . . . . . . 2.6.1 Le syst` eme des activit es de coop eration . . . . . . . . . 2.6.2 Avantages . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.3 Contraintes sociales et emergences de structures . . . . 3 Organisations multi-agents 3.1 Quest-ce quune organisation? . . . . . . . . . . . . . . . . . . 3.1.1 Structures organisationnelles et organisations concr` etes 3.1.2 Les niveaux dorganisation . . . . . . . . . . . . . . . . 3.1.3 Comment etudier une organisation? . . . . . . . . . . . 3.2 Lanalyse fonctionnelle . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Les fonctions dune organisation . . . . . . . . . . . . . 3.2.2 Les dimensions danalyse . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
CONTENTS 3.2.3 Analyse dimensionnelle dune organisation . . . . . . . 3.2.4 Grille danalyse fonctionnelle des organisations . . . . . Lanalyse structurale . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Agents et t aches . . . . . . . . . . . . . . . . . . . . . 3.3.2 Relations abstraites . . . . . . . . . . . . . . . . . . . . 3.3.3 Les modes de couplage . . . . . . . . . . . . . . . . . . 3.3.4 Structures de subordination et prises de d ecision . . . . 3.3.5 Types de constitution des structures organisationnelles Les param` etres de concr etisation . . . . . . . . . . . . . . . . Analyse dune organisation concr` ete . . . . . . . . . . . . . . . 3.5.1 Lexemple des robots explorateurs . . . . . . . . . . . . 3.5.2 Organisations ` a structure xe-hi erarchique-pr ed enie . 3.5.3 Organisations ` a structure variable- egalitaire- emergente 3.5.4 Organisations ` a structure variable- egalitaire-pr ed enie 3.5.5 Organisations ` a structure evolutive . . . . . . . . . . . 3.5.6 Autres travaux sur les organisations . . . . . . . . . . . Organisations individuelles . . . . . . . . . . . . . . . . . . . . 3.6.1 Tableau des principales architectures . . . . . . . . . . 3.6.2 Architecture modulaire horizontale . . . . . . . . . . . 3.6.3 Les architectures ` a base de tableaux noirs . . . . . . . 3.6.4 Larchitecture de subsomption . . . . . . . . . . . . . . 3.6.5 Les t aches comp etitives . . . . . . . . . . . . . . . . . . 3.6.6 Les syst` emes de production . . . . . . . . . . . . . . . 3.6.7 Les syst` emes ` a base de classieurs . . . . . . . . . . . . 3.6.8 Les architectures connexionistes . . . . . . . . . . . . . 3.6.9 Les architectures ` a base de syst` eme dynamique . . . . 3.6.10 Architectures multi-agents et acteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
vii 100 106 110 110 115 116 117 118 119 122 123 125 126 127 127 128 129 130 131 132 135 136 137 139 140 142 144
3.3
3.4 3.5
3.6
4 Action et comportement 4.1 La mod elisation . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Des mod` eles... . . . . . . . . . . . . . . . . . . . . . . . 4.1.2 ... et de leur utilit e pour les SMA . . . . . . . . . . . . 4.1.3 Que mod eliser? . . . . . . . . . . . . . . . . . . . . . . 4.1.4 Agents et actions: des notions faussement el ementaires 4.1.5 Mod eliser laction . . . . . . . . . . . . . . . . . . . . . 4.2 Laction comme transformation dun etat global . . . . . . . . 4.2.1 Une repr esentation fonctionnelle de laction . . . . . . 4.2.2 Les op erateurs de type STRIPS . . . . . . . . . . . . . 4.2.3 Planier avec des op erateurs de type STRIPS . . . . . 4.2.4 Quelques cat egories de plans . . . . . . . . . . . . . . . 4.2.5 Limites des planicateurs de type STRIPS . . . . . . . 4.2.6 Limites des repr esentations classiques de laction . . . . 4.3 Laction comme r eponse ` a des inuences . . . . . . . . . . . . 4.3.1 Pr esentation g en erale . . . . . . . . . . . . . . . . . . . 4.3.2 Les etats . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
147 . 147 . 147 . 148 . 149 . 149 . 151 . 152 . 152 . 153 . 155 . 158 . 160 . 161 . 164 . 164 . 165
viii
CONTENTS 4.3.3 Actions et r eactions . . . . . . . . . . . . . . . . . . . . 4.3.4 Int er et du mod` ele inuences/r eactions pour les SMA . Laction comme processus informatique . . . . . . . . . . . . . 4.4.1 Repr esentation de processus par automates ` a etats nis 4.4.2 Automates ` a registres . . . . . . . . . . . . . . . . . . . 4.4.3 Repr esentation de processus par r eseaux de Petri . . . 4.4.4 Autres mod` eles ev enementiels . . . . . . . . . . . . . . Laction comme d eplacement physique . . . . . . . . . . . . . 4.5.1 D eplacements dans un champ de potentiel . . . . . . . 4.5.2 Int er et de cette conception de laction . . . . . . . . . . Laction comme modication locale . . . . . . . . . . . . . . . 4.6.1 Les automates cellulaires . . . . . . . . . . . . . . . . . 4.6.2 Repr esentation dun automate cellulaire . . . . . . . . 4.6.3 Automates cellulaires et syst` emes multi-agents . . . . . Laction comme commande . . . . . . . . . . . . . . . . . . . . Agents tropiques et hyst er etiques . . . . . . . . . . . . . . . . Agents tropiques . . . . . . . . . . . . . . . . . . . . . . . . . 4.9.1 Approche formelle . . . . . . . . . . . . . . . . . . . . 4.9.2 Un syst` eme multi-agent tropique . . . . . . . . . . . . 4.9.3 Agents tropiques et actions situ ees . . . . . . . . . . . 4.9.4 Souplesse des actions situ ees . . . . . . . . . . . . . . . 4.9.5 Les buts sont dans lenvironnement . . . . . . . . . . . Agents hyst er etiques . . . . . . . . . . . . . . . . . . . . . . . 4.10.1 Approche formelle . . . . . . . . . . . . . . . . . . . . 4.10.2 Un syst` eme multi-agent hyst er etique . . . . . . . . . . 4.10.3 Mod elisation dagents hyst er etiques par automates . . Mod elisation de SMA en BRIC . . . . . . . . . . . . . . . . . 4.11.1 D ecrire des SMA ` a laide de composants . . . . . . . . 4.11.2 Mod elisation de SMA purement communicants . . . . . 4.11.3 Mod elisation des environnements . . . . . . . . . . . . 4.11.4 Mod elisation dun SMA situ e . . . . . . . . . . . . . . 4.11.5 Mod elisation dun SMA complet . . . . . . . . . . . . . 4.11.6 Un exemple: les agents transporteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 168 169 171 174 176 182 182 184 186 187 188 189 190 191 192 194 194 194 195 200 202 206 206 207 207 209 209 211 212 218 220 221
4.4
4.5
4.6
4.7 4.8 4.9
4.10
4.11
5 Lagent dans tous ses etats 5.1 Etats mentaux et intentionnalit e. . . . . . . . . . . . 5.1.1 Introduction . . . . . . . . . . . . . . . . . . . 5.1.2 La notion de cogniton . . . . . . . . . . . . . 5.1.3 Une nomenclature des cognitons . . . . . . . . 5.2 Le syst` eme interactionnel . . . . . . . . . . . . . . . . 5.3 Le syst` eme repr esentationnel . . . . . . . . . . . . . . 5.3.1 Quest-ce que la connaissance? . . . . . . . . . 5.3.2 Repr esenter les connaissances et les croyances 5.3.3 Logiques des savoirs et des croyances . . . . . 5.3.4 Ad equation et r evision des croyances . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
225 . 225 . 225 . 227 . 228 . 231 . 233 . 233 . 240 . 246 . 255
CONTENTS 5.4 Que croire? Les contenus des repr esentations . . . . . . . . . . . . . 5.4.1 Croyances environnementales () . . . . . . . . . . . . . . . 5.4.2 Croyances sociales ( ) . . . . . . . . . . . . . . . . . . . . . 5.4.3 Croyances relationnelles () . . . . . . . . . . . . . . . . . . 5.4.4 Croyances personnelles ( ) . . . . . . . . . . . . . . . . . . . Le syst` eme conatif . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5.1 Rationalit e et survie . . . . . . . . . . . . . . . . . . . . . . 5.5.2 Un mod` ele du syst` eme conatif . . . . . . . . . . . . . . . . . Les motivations: les sources de laction . . . . . . . . . . . . . . . . 5.6.1 Les motivations personnelles: plaisir et contraintes . . . . . . 5.6.2 Les motivations environnementales: le d esir de lobjet . . . . 5.6.3 Les motivation sociales: le poids de la soci et e. . . . . . . . . 5.6.4 Les motivations relationnelles: la raison cest les autres . . . 5.6.5 Les engagements: des motivations et contraintes relationnelles et sociales . . . . . . . . . . . . . . . . . . . . . . . . . . . . Le passage ` a lacte r eactif . . . . . . . . . . . . . . . . . . . . . . . 5.7.1 Actes consommatoires et comportements app etitifs . . . . . 5.7.2 Modes de s election et de contr ole des actions . . . . . . . . . 5.7.3 S election daction ou combinaison dynamique . . . . . . . . Passages ` a lacte intentionnels . . . . . . . . . . . . . . . . . . . . . 5.8.1 Th eories logiques de lintention . . . . . . . . . . . . . . . . 5.8.2 La th eorie de laction rationnelle de Cohen et Levesque . . . . . . . . . . . . . . . . . . . . . . . .
ix 263 264 265 265 268 268 269 271 273 274 275 276 278 279 284 285 286 294 298 299 301
5.5
5.6
5.7
5.8
6 Communications 6.1 Aspects de la communication . . . . . . . . . . . . . . . 6.1.1 Signes, indices et signaux . . . . . . . . . . . . . . 6.1.2 D enition et mod` eles de communication . . . . . 6.1.3 Cat egories de communication . . . . . . . . . . . 6.1.4 A quoi sert la communication? . . . . . . . . . . . 6.2 Les actes de langage . . . . . . . . . . . . . . . . . . . . 6.2.1 Dire, cest faire . . . . . . . . . . . . . . . . . . . 6.2.2 Actes locutoires, illocutoires et perlocutoires . . . 6.2.3 Succ` es et satisfaction . . . . . . . . . . . . . . . . 6.2.4 Composantes des actes illocutoires . . . . . . . . 6.3 Les conversations . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Conversations et automates ` a etats nis . . . . . 6.3.2 Conversations et r eseaux de Petri . . . . . . . . . 6.3.3 Une classication des actes de langage pour des conversationnelles multi-agents . . . . . . . . . . 6.4 KQML . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . structures . . . . . . . 330 . . . . . . . 338
309 . 309 . 309 . 310 . 312 . 317 . 320 . 320 . 322 . 323 . 325 . 326 . 328 . 329
7 Collaboration et r epartition des t aches 343 7.1 Modes dallocation des t aches . . . . . . . . . . . . . . . . . . . . . . 343 7.1.1 Crit` eres de d ecomposition des t aches . . . . . . . . . . . . . . 344 7.1.2 R oles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344
x 7.1.3 Formes dallocation . . . . . . . . . . . . . . . . . Allocation centralis ee des t aches par m ediateur . . . . . . Allocation distribu ee des t aches . . . . . . . . . . . . . . 7.3.1 Allocation par r eseau daccointances . . . . . . . 7.3.2 Allocation par appel dore: le r eseau contractuel 7.3.3 Variantes et allocations hybrides . . . . . . . . . . 7.3.4 Contrats et engagements . . . . . . . . . . . . . . Int egrer les t aches et les etats mentaux . . . . . . . . . . 7.4.1 Le syst` eme SAM . . . . . . . . . . . . . . . . . . 7.4.2 La hi erarchie des architectures . . . . . . . . . . . 7.4.3 Les r esultats . . . . . . . . . . . . . . . . . . . . . 7.4.4 Limpl ementation des architectures . . . . . . . . 7.4.5 Le niveau 1 . . . . . . . . . . . . . . . . . . . . . 7.4.6 Le niveau 2 . . . . . . . . . . . . . . . . . . . . . 7.4.7 Le niveau 3 . . . . . . . . . . . . . . . . . . . . . Allocation emergente . . . . . . . . . . . . . . . . . . . . Un exemple: le syst` eme Manta . . . . . . . . . . . . . . . 7.6.1 Description g en erale . . . . . . . . . . . . . . . . 7.6.2 Larchitecture du syst` eme . . . . . . . . . . . . . 7.6.3 Les exp erimentations . . . . . . . . . . . . . . . . 7.6.4 Des fourmis aux robots fourmis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
CONTENTS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 346 350 350 361 376 378 379 379 380 381 383 383 384 385 388 391 391 391 394 397
7.2 7.3
7.4
7.5 7.6
8 Coordination dactions 8.1 Quest-ce que la coordination dactions? . . . . . . . . . . . . . 8.1.1 D enitions . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1.2 La coordination comme r esolution de probl` eme . . . . . 8.1.3 Caract eristiques des syst` emes de coordination . . . . . . 8.1.4 Formes de coordination daction . . . . . . . . . . . . . . 8.2 Synchronisation dactions . . . . . . . . . . . . . . . . . . . . . . 8.2.1 Synchronisation de mouvements . . . . . . . . . . . . . . 8.2.2 Synchronisation dacc` es ` a une ressource . . . . . . . . . . 8.3 Coordination dactions par planication . . . . . . . . . . . . . . 8.3.1 Planication multi-agent . . . . . . . . . . . . . . . . . . 8.3.2 Planication centralis ee pour agents multiples . . . . . . 8.3.3 Coordination centralis ee pour plans partiels . . . . . . . 8.3.4 Coordination distribu ee pour plans partiels . . . . . . . . 8.4 Coordination r eactive . . . . . . . . . . . . . . . . . . . . . . . . 8.4.1 Coordination par actions situ ees . . . . . . . . . . . . . . 8.4.2 Du comportement de meute aux syst` emes anti-collisions 8.4.3 Marquage de lenvironnement . . . . . . . . . . . . . . . 8.4.4 Actions de coordination . . . . . . . . . . . . . . . . . . 8.5 R esolution par coordination : l eco-r esolution . . . . . . . . . . . 8.5.1 Principes de l eco-r esolution . . . . . . . . . . . . . . . . 8.5.2 Les eco-agents . . . . . . . . . . . . . . . . . . . . . . . . 8.5.3 Exemples simples d eco-probl` emes . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
399 . 399 . 400 . 402 . 405 . 409 . 411 . 411 . 411 . 413 . 415 . 419 . 421 . 427 . 432 . 432 . 433 . 438 . 444 . 446 . 447 . 448 . 450
CONTENTS 8.5.4 8.5.5 8.5.6 9 Conclusion A BRIC A.1 Les composants . . . . . . . . . . . . . . . A.2 Composants composites . . . . . . . . . . A.3 Constitution des composants el ementaires A.4 Liens de communication . . . . . . . . . . A.5 Conventions de notations et equivalences . A.6 Traduction sous forme de r eseaux de Petri A.7 Exemple . . . . . . . . . . . . . . . . . . . R ef erences bibliographiques Index
xi Univers evolutifs . . . . . . . . . . . . . . . . . . . . . . . . . 459 Formalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . 461 R esolution de contraintes par eco-r esolution . . . . . . . . . . 462 465 469 469 470 470 472 472 473 473 475 493
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
xii
CONTENTS
Pr eface
Ce livre r epond ` a un besoin: celui de donner un contenu informatique pr ecis ` a lexpression syst` eme multi-agents. Quelles notions, quelles tendances, quelles possibilit es nouvelles se cachent sous ce terme ` a la mode? Cest avant tout une question de mod elisation. Les langages actuels obligent les programmeurs dapplications a d ` ecrire les ph enom` enes quils traitent dune mani` ere strictement m ecaniste et hi erarchis ee. On arrive tout au plus ` a b atir une application ` a partir de modules construits ind ependamment comme un immeuble moderne fait d el ements pr efabriqu es au lieu de pierres taill ees sur place. Le processus est parfait pour un programme traitant du fonctionnement dun immeuble. Mais quid de la vie de ses habitants? La belle ordonnance qui explique, par exemple, la structure complexe dun etage comme une composition de pi` eces et de parois r eput ees plus simples na manifestement plus cours. Il faut prendre en compte lind ependance op erationnelle des individus (et non plus seulement leur ind ependance conceptuelle), les ph enom` enes de communication, de libre arbitre, de croyance, de concurrence, de consensus et aussi de discorde. Cela nest pas chose facile. Rien cependant n echappe ` a lapp etit des ordinateurs! La repr esentation en machine de b atiments, dimmeubles, voire de cit es enti` eres etant ` a peu pr` es devenue chose courante (demandez aux architectes), il sagit maintenant de sattaquer aux etre humains et aux soci et es qui habitent ces lieux. Comment va-t-on proc eder? Les syst` emes multi-agents bien s ur... Plusieurs forces sont sans doute ` a luvre derri` ere cette evolution. Je crois que la mont ee du lib eralisme et de lindividualisme ` a lam ericaine nous poussent plus fortement que jamais ` a vouloir mod eliser toute situation un tant soit peu complexe en termes economiques de concurrence et de march e. Ce faisant, nous avons tendance ` a privil egier les mod` eles informatiques mettant en jeu les m emes concepts. On peut lire le m eme mouvement did ees dun il plus optimiste, parler dune salutaire tendance a la d ` ecentralisation, dun utile correctif au jacobinisme ou invoquer les richesses de la cr eation collective. Dans un sens comme dans lautre, notre epoque se veut plurielle et il nest pas surprenant que cette id eologie cherche ` a se re eter jusque dans les mod` eles informatiques de la r ealit e. Les machines evoluent dans le m eme sens que les id ees: la mont ee des architectures parall` eles et des r eseaux a d etr on e le processeur unique, image d` ele du cerveau unique et de ladministration centralis ee. L` a aussi, place au pluralisme et ` a la concurrence! Comme toujours, il y a loin de la coupe aux l` evres. La t ache des sp ecialistes de syst` emes multi-agents et dintelligence articielle distribu ee (deux mani` eres de d esigner la m eme communaut e) est dune part de trouver les bonnes mani` eres de ma triser la fabuleuse puissance de calcul de nos machines (en d enissant ce
xiv
Pr eface
quen jargon on appelle des architectures logicielles et mat erielles) et dautre part dexpliquer aux utilisateurs ce quils peuvent en attendre. La dicult e est alors de dire les choses de mani` ere susamment claire et evocatrice sans masquer pour autant les limitations et les insusances des syst` emes propos es, qui sont souvent enormes: apr` es tout, ces constructions ne reposent que sur des machines! De ce point de vue, linformatique est tributaire des sciences cognitives, puisquil sagit de mettre en correspondance les processus intellectuels de lutilisateur avec ceux (sic) de la machine. En retour, cette confrontation apporte ` a l etude de la cognition des eclairages nouveaux. Cest ce que fait Jacques Ferber dans son livre, arm e de pens ee syst emique et de psychologie cognitive. Ce nest pas un ouvrage sur les techniques de programmation, bien que lauteur soit parfaitement conscient des possibilit es et des limitations des moyens informatiques actuels. Cest en fonction de ces moyens, mais de mani` ere implicite, quil analyse les nombreux facteurs qui entrent dans les syst` emes multi-agents que lon sait actuellement construire. Certains exemples sur lesquels il fonde son argumentation ont dailleurs et e r ealis es dans son equipe et ont fait lobjet de th` eses de doctorat. Comme on le verra, la mod elisation compl` ete dune soci et e humaine par un syst` eme multi-agent est encore assez loin de nous pour des raisons qui ne tiennent pas toutes ` a la stupidit e des machines. La simulation de La vie devant soi nest pas pour demain. En revanche, nous savons mod eliser certaines activit es des collectivit es humaines, par exemple le r egime des p eches dans le delta central du Niger, o` u entrent en concurrence divers facteurs climatiques, culturels, economiques et halieutiques. Nous savons aussi repr esenter les caract eristiques de certaines populations de fourmis, chaque insecte etant trait e individuellement comme un agent tr` es simple et linteraction ` a grande echelle de ces agents multiples faisant emerger des comportements globaux fort proches de ceux quobservent les entomologistes dans leurs laboratoires d ethologie ce qui ouvre des voies de recherche nouvelles. Et, pour revenir ` a des pr eoccupations ding enierie, de syst` emes qui servent ` a r esoudre des probl` emes, Jacques Ferber vous proposera tout un eventail de techniques de r esolution de probl` emes qui sav` erent prometteuses. Ce livre est un commencement, cest vous, lecteur, qui ecrirez la suite! Jean-Fran cois Perrot Professeur ` a luniversit e Pierre et Marie Curie
Avant-propos
Depuis quelques ann ees, les syst` emes multi-agents ont pris une place de plus en plus importante en informatique, que ce soit dans le domaine de lintelligence articielle, dans ceux des syst` emes distribu es, de la robotique, ou m eme dans ce champ disciplinaire nouveau quest la vie articielle, en introduisant la probl ematique de lintelligence collective et de l emergence de structures par interactions. En situant la question au niveau de lautonomie des individus, que lon appelle agents, et des interactions qui les lient, les syst` emes multi-agents soul` event de nombreuses questions. Quels sont en eet les concepts fondateurs de ce domaine? Comment se di erenciet-il des autres disciplines et en particulier de lintelligence articielle, des syst` emes distribu es et de la robotique? Quels sont ses apports aux sciences cognitives et ` a la r eexion philosophique en g en eral? Science int egratrice plus quanalytique, la recherche sur les syst` emes multiagents suscite un certain nombre dinterrogations: quest-ce quun agent qui interagit avec dautres agents? Comment peuvent-ils coop erer? Quels sont les modes de communication n ecessaires pour quils se r epartissent des t aches et coordonnent leurs actions? Quelle architecture peut-on leur donner pour quils satisfassent leurs buts? Ces questions sont pos ees avec une vigueur particuli` ere car lenjeu porte sur la r ealisation de syst` emes disposant de caract eristiques particuli` erement int eressantes: souplesse, adaptation aux changements, int egration de programmes h et erog` enes, rapidit e dobtention de r esultats, etc. Les recherches dans le domaine des syst` emes multi-agents poursuivent deux objectifs majeurs: le premier concerne lanalyse th eorique et exp erimentale des m ecanismes dauto-organisation qui ont lieu lorsque plusieurs entit es autonomes interagissent; le second sint eresse ` a la r ealisation dartefacts distribu es capables daccomplir des t aches complexes par coop eration et interaction. Leur position est donc double: dun c ot e elles se placent au sein des sciences cognitives et sociales (psychologie, ethologie, sociologie, philosophie...) et naturelles ( ecologie, biologie...) pour ` a la fois mod eliser, expliquer et simuler des ph enom` enes naturels, et susciter des mod` eles dauto-organisation; de lautre, elles se pr esentent comme une pratique, une technique tendue vers la r ealisation de syst` emes informatiques complexes ` a partir des concepts dagents, de communication, de coop eration et de coordination dactions. Ce livre est issu de lenseignement des syst` emes multi-agents (ou SMA) que jeectue dans le DEA IARFA ` a luniversit e Pierre et Marie Curie (Paris 6) depuis plusieurs ann ees. Il nexiste, ` a ma connaissance, aucun manuel (textbook) sur les SMA. Les seuls ouvrages disponibles sont des th` eses publi ees ou des compilations darticles ecrits par des sp ecialistes pour dautres sp ecialistes du domaine, ce qui
Avant-propos
ne permet pas ` a un etudiant ou ` a un non-sp ecialiste davoir un aper cu global et synth etique de la question. L eventail des recherches men ees depuis bient ot vingt ans sur les syst` emes multi-agents est extr emement vaste, et il nexiste pas (encore) de fondements susamment simples et pr ecis de cette discipline pour quil soit facile de pr esenter de mani` ere progressive et didactique les travaux dans ce domaine. Il fallait donc commencer par unier les positions et etablir un cadre conceptuel pour le d eveloppement de th eories futures. Cest ` a cet objectif que cet ouvrage est consacr e, celui de synth etiser les connaissances majeures dans ce domaine en commen cant a poser les fondations dune science de linteraction, que jai appel ` ee la k en etique, dapr` es le terme grec ko non, ce qui est commun. Pour linstant cette tentative est encore timide et sappuie essentiellement sur la d enition de cadres conceptuels, de quelques classications et formalisations et sur la pr esentation dune m ethode modulaire de construction de syst` emes multiagents. Lint er et dune telle synth` ese est double: elle permet de saranchir, ` a terme, des di erences de notations et des m eandres l egitimes eectu es par les chercheurs dans lexploration de leur domaine, et de montrer un visage uni autour dune probl ematique claire pouvant s enoncer pr ecis ement et simplement. Nous nen sommes pas encore l` a, mais jesp` ere que cet ouvrage contribuera ` a la fois ` a faire comprendre au lecteur non sp ecialiste les r esultats et les enjeux des syst` emes multiagents sous la forme dun langage uni e et ` a donner ` a l etudiant ou au chercheur des bases solides pour laider ` a elaborer de nouvelles connaissances et ` a apporter sa propre pierre ` a ces fondations.
Contenu de louvrage
On trouvera dans cet ouvrage: 1. un etat de lart sur la question, 2. un point de vue sur les syst` emes multi-agents pr esent es comme une nouvelle syst emique qui met en avant la probl ematique de linteraction et de ses cons equences, 3. une analyse conceptuelle du domaine ` a partir dune classication des principaux probl` emes et r esultats et, surtout, une analyse fonctionnelle et structurale des organisations servant de cadre ` a lensemble des travaux men es dans ce domaine, 4. un formalisme, Bric, permettant la conception modulaire et incr ementale de SMA, par la mod elisation des comportements, des structures de communication et des principales formes dinteractions que sont lallocation de t aches et la coordination dactions, 5. une tentative de formalisation des SMA et de linteraction, ` a partir dun mod` ele de laction fond e sur un couple inuence/r eaction.
Avant-propos
A qui sadresse-t-il?
Cet ouvrage sadresse tout dabord ` a des professionnels de linformatique non sp ecialistes de la question qui d esirent avoir un point de vue synth etique sur ce domaine. Il sadresse aussi ` a des non-informaticiens sp ecialistes des sciences sociales ou des sciences de la nature qui veulent utiliser les syst` emes multi-agents pour mod eliser des comportements naturels et etudier l emergence de ph enom` enes complexes. Il sadresse aussi aux non sp ecialistes de linformatique souhaitant avoir une connaissance des concepts essentiels permettant de comprendre ce quest une intelligence collective et avoir une vue densemble de la probl ematique multi-agent. Il sadresse enn aux etudiants en deuxi` eme et troisi` eme cycles dinformatique qui voudraient se sp ecialiser dans ce domaine et pour lesquels il fournit un support de cours.
Organisation de louvrage
Lorganisation de cet ouvrage suit une d emarche volontairement constructive et ascendante: apr` es une br` eve pr esentation du domaine et la pr esentation dun cadre g en eral danalyse des organisations multi-agents, les concepts et m ecanismes mis en uvre dans les syst` emes multi-agents sont progressivement etudi es et analys es. Les notions de base sont pr esent ees dans une premi` ere partie. Le chapitre 1 donne un aper cu g en eral du domaine, les th` emes principaux et leurs relations avec dautres disciplines. Le chapitre 2 introduit le concept de situation dinteraction et propose un cadre g en eral pour appr ehender les di erentes composantes de la coop eration. Le chapitre 3 propose une analyse fonctionnelle et structurale des organisations ainsi que les di erentes architectures utilis ees g en eralement pour les concevoir. Le chapitre 4 propose une transition entre les g en eralit es de la partie pr ec edente et les descriptions plus d etaill ees des parties suivantes. Il aborde la probl ematique de la formalisation de laction et du comportement ainsi que celle de la mod elisation des syst` emes multi-agents et introduit la plupart des notations utilis ees dans le reste de louvrage. On y montre que les conceptions classiques de laction ne sont pas susantes pour bien comprendre les interactions, ce qui aboutit au d eveloppement dune th eorie de laction consid er ee comme le r esultat dun ensemble dinuences produites par les agents. Ce chapitre pr esente aussi un formalisme de mod elisation des agents et des syst` emes multi-agents, Bric, qui associe des r eseaux de Petri a ` une structure modulaire. Le chapitre 5 fait le point sur la notion d etat mental dun agent (croyances, intentions, engagements, etc.) et propose une repr esentation de sa dynamique mentale sous la forme dune architecture modulaire d ecrite en termes de composants Bric. La derni` ere partie est consacr ee aux di erentes m ethodes et outils conceptuels utilis es pour construire des organisations coop eratives. Le chapitre 6 porte sur les communications et fournit une mod elisation des principales structures de communications ` a laide de r eseaux de Petri. Le chapitre 7 est d edi e` a l etude des organisations de collaboration dans lesquelles le travail est r eparti dynamiquement entre les agents. Le chapitre 8 pr esente enn les principaux mod` eles de coordination
Avant-propos
daction qui g` erent larticulation dynamique de la planication et de lex ecution des t aches et tentent d eviter les conits. On y montre aussi quil est possible de r esoudre des probl` emes par interaction entre agents simples.
Remerciements
Ce livre naurait pu voir le jour sans laide dun grand nombre de personnes qui mont apport e leurs remarques, leurs critiques et surtout leur soutien. Je pense en particulier ` a Jacqueline Zizi qui, au del` a de son amiti e, a relu mon livre de fond en comble. Son exigence et sa rigueur mont beaucoup aid e, sa diplomatie et ses encouragements mont permis de garder conance dans ce projet. Quelle re coive ici le t emoignage de ma reconnaissance. Je pense egalement ` a Philippe Laublet, Alexis Drogoul et Anne Collinot qui ont su apporter les commentaires et critiques constructives ` a ce qui etait encore un brouillon. Leurs remarques mont et e pr ecieuses. Je remercie les membres de l equipe Miriad, Stephane Bura, Thierry Bouron, Patrice Carle, Christophe Cambier, Eric Jacopin, Karim Zeghal et tous les autres. Ils ont su apporter leurs comp etences et leur dynamisme ` a la constitution de ce groupe de recherche, parfait exemple de syst` eme multi-agent. Ils ont et e un stimulant permanent durant l elaboration de cet ouvrage. Je remercie egalement les etudiants du DEA IARFA, pour avoir support e mes explications parfois confuses jen suis certain sur lint er et des SMA. Ils ont ainsi favoris e la mise au point de certaines th eories et synth` eses qui sont pr esent ees dans cet ouvrage. Yves Demazeau, Jean Erceau, Les Gasser, Charles Lenay, Jean-Pierre M uller, Jean-Fran cois Perrot mont apport e leur amiti e, leur aide et leurs encouragements. Je tiens ` a leur exprimer toute ma gratitude. Je tiens aussi ` a faire savoir ` a Pierre Azema, Jean-Paul Barth` es, Paul Bourgine, Jean-Pierre Briot, Christian Brassac, Christiano Castelfranchi, Brahim Chaib-Braa, Bruno Corbara, Pascal Estraillier, Dominique Fresneau, France Gu erin, Alain Pav e, Jo el Quinqueton, Mario Tokoro, Dominique Lestel, Christian Mullon, G erard Sabah, Lena Sanders, Luc Steels, Jean-Pierre Treuil et ` a bien dautres que la place memp eche de citer tous combien leur gentillesse et les discussions scientiques particuli` erement f econdes que nous avons pu avoir ensemble mont et e dune grande aide. Je tiens enn ` a remercier tous ceux qui mont accompagn e, famille et amis, pour leur compr ehension, leur soutien inconditionnel et leur aection alors que ces derni` eres ann ees, la phrase Je suis en train de nir mon livre etait presque devenue un leitmotiv.
Chapter 1 Principes des syst` emes multi-agents

1.1
1.1.1
Pour une intelligence collective

De la machine pensante...
Longtemps, linformatique en g en eral et lintelligence articielle (IA) en particulier ont consid er e les programmes comme des entit es individualis ees capables de rivaliser avec l etre humain dans des domaines pr ecis. Au d epart simple machine ` a calculer, lordinateur sest ainsi vu consacrer ` a des t aches qui relevaient de domaines de plus en plus complexes tels que la gestion dune entreprise, la surveillance et le contr ole de processus industriels, laide au diagnostic m edical ou la conception de nouvelles machines. Cette comp etition entre l etre humain et la machine sest accompagn ee dune identication de la machine ` a lhumain, un programme repr esentant directement un expert capable de r esoudre un probl` eme par lui-m eme. Il est possible de constater cette individualisation des programmes dIA, cest-` adire cette mise en rapport des capacit es cognitives de l etre humain et des ordinateurs, d` es le d ebut des d eveloppements de lintelligence articielle. En eet, depuis les premiers balbutiements des programmes exp erimentaux de Newell, Shaw et Simon (Newell et al. 1957) sur la d emonstration automatique de th eor` emes, le terme intelligence articielle a et e utilis e pour d esigner un projet de recherche consistant a concevoir une machine intelligente, cest-` ` a-dire capable de r eussir aussi bien quun etre humain dans des t aches jug ees complexes. Ce projet souleva un grand nombre de questions portant non seulement sur la nature dune possible intelligence articielle mais aussi sur un probl` eme crucial pour lhumanit e tout enti` ere: est-ce quune machine pense? Est-ce quelle peut etre intelligente? Doit-on lui donner un statut juridique semblable ` a celui dun etre humain? Toutes ces questions ont aliment e un d ebat qui trouve aujourdhui son expression dans un certain nombre de critiques contre les possibilit es de lIA. Pour caract eriser cette notion de machine intelligente, Turing inventa un test consistant ` a dire quune machine est intelligente si on ne peut la distinguer dun etre humain lors dune conversation. Lexp erience consiste ` a mettre un exp erimentateur
` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS
devant un terminal informatique et ` a le relier soit ` a un autre op erateur humain soit ` a un ordinateur. Lop erateur et lordinateur pr etendent tous les deux quils sont des humains. Au travers dun dialogue, lexp erimentateur doit d ecider si son interlocuteur est un humain ou une machine. Sil ne peut faire cette distinction ou sil nindique la bonne r eponse que dans la moiti e des cas, on peut dire que la machine a pass e le test avec succ` es et on la qualiera dintelligente. Il faut noter que, pour une machine, etre consid er ee comme intelligente revient ` a imiter le comportement dun humain et ne repose pas sur des crit` eres intrins` eques. Lintelligence serait donc le fait des individus isol es et non des groupes, puisquen aucun cas on ne demande a une machine (ou ` ` a un groupe de machines) de se mettre ` a la place de plusieurs personnes. Cette fa con de concevoir les programmes informatiques comme des sortes de penseurs repli es sur eux-m emes se retrouve directement dans la notion de syst` eme expert, cest-` a-dire des programmes informatiques capables de remplacer l etre humain dans ses t aches r eput ees les plus complexes et qui r eclament de lexp erience, du savoir-faire et une certaine forme de raisonnement. Cette pens ee est ` a la fois la racine et la cons equence du d eveloppement de sys1 t` emes centralis es et s equentiels dans lesquels le contr ole , cest-` a-dire ce qui d ecide ce quil faut faire, est d eni comme le pilote des di erentes activit es ex ecut ees lune derri` ere lautre. Cependant cette conception centralisatrice et s equentielle se heurte ` a plusieurs obstacles dordres aussi bien th eorique que pratique. Sur le plan th eorique, lintelligence articielle s etait engag ee sur une voie ` a la fois trop optimiste et en m eme temps trop r eductrice. Lintelligence, comme la science (Latour 1989) (Lestel 1986), nest pas une caract eristique individuelle que lon pourrait s eparer du contexte social dans lequel elle sexprime. Un etre humain ne peut se d evelopper convenablement sil ne se trouve pas entour e dautres etres de son esp` ece. Sans un entourage ad equat, son d eveloppement cognitif est tr` es limit e, et le simple apprentissage dune langue articul ee lui devient proprement impossible sil na pas et e plong e dans une culture humaine d` es sa premi` ere enfance. En dautres termes, les autres sont indispensables ` a notre d eveloppement cognitif et ce que nous appelons intelligence est autant d u aux bases g en etiques qui d enissent notre structure neuronale g en erale quaux interactions que nous pouvons avoir avec le monde qui nous entoure et, en particulier, avec la soci et e humaine. On peut donc dire que, d` es le d epart, le projet de lintelligence articielle pouvait etre consid er e comme inaccessible, et ce, non pas ` a cause des pol emiques supposant une nature transcendantale de lintelligence humaine et de la conscience impossible a reproduire dans un syst` ` eme informatique, mais ` a cause du manque dinteraction des programmes avec lext erieur et dans labsence dinsertion dans une communaut e dautres entit es intelligentes de m eme nature. Les critiques de Dreyfus (Dreyfus 1979) et de Searle (Searle 1991), notamment, portent essentiellement sur le manque dincorporation (embodiment) des programmes et donc de leur incapacit e` a interagir
1 Nous utiliserons dans lensemble de louvrage le terme contr ole dans son acception anglosaxonne de ma trise, et non dans celle de v erication qui correspond ` a lusage fran cais. Ceci dans un souci de coh erence avec cette d erive terminologique qui est maintenant devenue classique en informatique.
1.1. POUR UNE INTELLIGENCE COLLECTIVE
de mani` ere signiante avec leur environnement et avec leurs semblables. Cette dicult e th eorique sest vue conrm ee par des probl` emes pratiques dus a la complexit ` e des questions ` a r esoudre. Les syst` emes informatiques deviennent de plus en plus complexes, et il est n ecessaire de les d ecomposer en modules faiblement coupl es, en unit es ind ependantes dont les interactions sont limit ees et parfaitement contr ol ees. Ainsi, au lieu de se trouver en pr esence dune machine une entit e bien localis ee par sa structure et son architecture on se trouve, comme le d eveloppement des langages objets lont montr e, devant un ensemble dentit es en interactions, chaque entit e etant d enie de mani` ere locale sans vision globale d etaill ee de toutes les actions du syst` eme. Cette fa con denvisager des programmes introduisit de nouvelles m ethodes de conception en g enie logiciel et un changement de perspective; on passa de la notion de programme ` a celle dorganisation, notion que nous aurons loccasion de d evelopper tout au long de cet ouvrage. Pour des raisons di erentes, les concepteurs de syst` emes experts industriels sont arriv es ` a des conclusions semblables ` a partir des dicult es soulev ees par le d eveloppement de bases de connaissance. La plupart dentre elles proviennent de ce que, dans une application complexe, lexpertise que lon cherche ` a int egrer dans la base de connaissance, cest-` a-dire le savoir-faire, les comp etences et les connaissances diverses, est d etenue par des individus di erents qui, au sein dun groupe, communiquent, echangent leurs connaissances et collaborent ` a la r ealisation dune t ache commune. Dans ce cas, la connaissance du groupe nest pas egale ` a la somme des connaissances des individus: chaque savoir-faire est li e` a un point de vue particulier et ces di erentes visions, parfois contradictoires, ne sont pas n ecessairement coh erentes entre elles. La r ealisation dune t ache commune n ecessitera alors des discussions, des mises au point, voire m eme des n egociations pour r esoudre les conits eventuels. Enn, les probl` emes sont parfois naturellement pos es de mani` ere distribu ee. Que lon doive concevoir un ensemble de robots explorateurs ou que lon soit amen ea ` d enir un syst` eme de contr ole de trac a erien, le probl` eme suppose quil existe un certain nombre dentit es capables dagir et dinteragir. Dans certains cas, comme dans celui des robots explorateurs, les interactions peuvent etre positives et il est possible aux agents de saider les uns les autres, alors que dans dautres, tels que le contr ole de trac a erien, elles peuvent etre n egatives, les avions se g enant mutuellement, et la dicult e consiste ` a faire en sorte quils nentrent pas en collision. A partir de toutes ces remarques, nest-il pas possible de d es-individualiser linformatique en g en eral et lIA en particulier? Nest-il pas possible de prendre le probl` eme ` a lenvers et de consid erer justement les ph enom` enes collectifs comme ` a la fois premiers et porteurs de cette intelligence que lon narrive toujours pas ni a ` d enir, ni ` a v eritablement comprendre ni m eme ` a reproduire eectivement?
1.1.2
... ` a lorganisation articielle
Lapproche d evelopp ee ici trouve en eet son fondement dans une critique radicale de linformatique s equentielle et de lIA classique, en consid erant que les activit es simples ou complexes, telles que la r esolution de probl` emes, l etablissement dun
diagnostic, la coordination daction ou la construction de syst` emes sont le fruit dune interaction entre entit es relativement autonomes et ind ependantes, appel ees agents, qui travaillent au sein de communaut es selon des modes parfois complexes de coop eration, de conit et de concurrence, pour survivre et se perp etuer. De ces interactions emergent des structures organis ees qui, en retour, contraignent et modient les comportements de ces agents. Ce projet scientique, que jai appel e k en etique (Ferber 1994), consiste ` a pouvoir etudier, concevoir et r ealiser des univers ou des organisations dagents articiels ( electroniques ou informatiques) capables dagir, de collaborer ` a des t aches communes, de communiquer, de sadapter, de se reproduire, de se repr esenter lenvironnement dans lequel ils evoluent et de planier leurs actions, pour r epondre soit ` a des objectifs d enis extrins` equement (par un programmeur humain par exemple), soit intrins` equement ` a partir dun objectif g en eral de survie. La k en etique se veut ` a la fois la science et la technique des organisations articielles2 , que lon appelle ces organisations populations, soci et es, groupes, mondes ou univers. On dira aussi que la k en etique proc` ede par la construction de syst` emes multi-agents, cest-` a-dire par la r ealisation de mod` eles electroniques ou informatiques compos es dentit es articielles qui communiquent entre elles et agissent dans un environnement. Plus pr ecis ement, la k en etique se propose de: 1. D enir une discipline scientique qui prenne en compte linteraction entre agents comme fondement pour comprendre le fonctionnement et l evolution des syst` emes. 2. D enir les di erentes formes dinteractions, telles que la coop eration, la comp etition, la collaboration, lencombrement, etc., et les relier ` a la probl ematique de lautoorganisation ou ` a celles de la performance ou de la survie du syst` eme. 3. D egager les grands m ecanismes donnant lieu ` a lauto-organisation, tels que le regroupement, la sp ecialisation, la r epartition des t aches et des ressources, la coordination dactions, la r esolution de conits, etc. 4. D enir des mod` eles op erationnels de ces interactions en d ecrivant le fonctionnement des agents et des syst` emes multi-agents. Cest ainsi, en mettant laccent sur les interactions et plus exactement en analysant les syst` emes dinteractions qui existent entre les agents, que les syst` emes multi-agents (ou SMA) se distinguent des approches syst emiques plus classiques en prenant le parti de l emergence et en consid erant que laction et linteraction sont les el ements moteurs de la structuration dun syst` eme dans son ensemble. La m ethode utilis ee rel` eve ` a la fois des sciences th eoriques et exp erimentales. Cest par une analyse ne des di erents types de syst` emes multi-agents que lon sera a m ` eme de classer les di erentes formes dinteraction et les di erents comportements
2 On emploiera le terme syst` eme articiel uniquement dans le sens dispositif construit par l etre humain et qui est lui-m eme compos e d el ements articiels. Il sagit donc essentiellement de syst` emes electroniques ou informatiques qui sont vis es par de tels vocables, et non des entreprises ou des ecosyst` emes naturels am enag es par lhomme.
distribu es qui peuvent etre mis en uvre pour r esoudre des probl` emes de coop eration ou de comp etition. Cest aussi en r ealisant des mod` eles math ematiques et informatiques que lon sera capable de th eoriser ce champ et den faire un domaine scientique ` a part enti` ere. Cest surtout ` a partir dexp erimentations, cest-` a-dire ` a partir de la construction dartefacts collectivement organis es que lon sera en mesure de mieux analyser les composants n ecessaires ` a la description, lauto-organisation et l evolution des soci et es dagents. Mais les formes que prend lexp erimentation sont bien di erentes de celles des sciences sociales ou de la nature. Les univers que cr ee la k en etique sont purement articiels et tous leurs param` etres peuvent etre contr ol es directement par le concepteur. Le caract` ere totalement construit de ces organisations autorise chacun ` a d eterminer son point de vue et ` a choisir les param` etres qui lint eressent. Lorganisation articielle r esultante ne d epend alors plus que de ces choix, et les propri et es des structures ne sont pas aect ees par des facteurs ext erieurs non ma tris es. En eet, les entit es dun univers multi-agent sont enti` erement le fruit de conceptions humaines, dune cr eation d elib er ee, dans laquelle les caract eristiques sont etroitement contr ol ees. En particulier, et ` a la di erence des etudes portant sur les syst` emes sociaux humains ou animaliers, tout ce qui se passe dans la t ete de ces agents articiels est enti` erement d eni. Le concepteur a acc` es ` a tous les recoins de leur psychisme, puisque, par d enition, il est lauteur de ses cr eatures. Cependant en etre lauteur ne signie pas que toutes les evolutions de lunivers puissent etre pr edites. Elles ne sont pas soumises ` a un d eterministe simple qui permettrait de pr evoir toutes les congurations futures ` a partir dune situation initiale. Au contraire, les syst` emes multi-agents ob eissent aux principes des ph enom` enes chaotiques (Gleick 1989). Toute modication des conditions initiales, aussi menue soit-elle, toute introduction de variables al eatoires, aussi limit ee soit-elle, est ampli ee par les interactions entre les agents et il nest pas possible de conna tre a ` lavance l etat ult erieur pr ecis des agents au bout de quelque temps. Des ph enom` enes connus sous le nom deets papillons (un battement daile dun papillon en Asie peut conduire, par amplications progressives, ` a une tornade en Am erique) perturbent alors toutes les pr edictions nes, et la plupart des r esultats. Ces syst` emes ne sont pas pour autant soumis ` a aucune loi. Il est possible au contraire dobserver des eets dauto-organisation et dapparition de structures emergentes dont les evolutions sont parfaitement ma tris ees. De fait, il est possible, avec un peu dexp erience, de construire des syst` emes qui manifestent des comportements voulus dans une situation stable, tout en se montrant capable de sadapter a ` des perturbations non pr evues initialement. Lint er et des syst` emes multi-agents tient ` a ce que lon peut exp erimenter directement sur des mod` eles r eduits de soci et es les th eories que lon d esire mettre ` a jour. Toutes les th eories concernant l evolution sociale ou biologique ont droit de cit e dans de tels univers, puisquelles nont plus ` a etre valid ees par une exp erience sur le terrain: seul, le fait que cette th eorie soit ou non calculatoire, cest-` a-dire r ealisable dans le cadre dun programme informatique, d etermine si oui ou non une th eorie est valable. Une th eorie irrecevable dans le cadre de la nature peut tr` es bien trouver son compte dans le cadre de la k en etique. Par exemple, il est possible de cr eer
10
des univers dans lesquels les individus se reproduisent de mani` ere lamarkienne en supposant que les acquis comportementaux sont directement transmis aux g enes des descendants, ce qui est en contradiction avec nos connaissances de l evolution des esp` eces animales. Cependant, cette absence de contraintes dexp erimentation sur un univers r eel entra ne inversement une pression extr eme: celle de devoir expliciter chacun des rouages des m ecanismes impl ement es. Il nest plus possible de laisser des aspects dans lobscurit e, ni m eme de d enir vaguement un concept par un discours tortueux. Tous les el ements, tous les composants, tous les m ecanismes d enissant un syst` eme doivent etre minutieusement pens es et aucune marge dimpr ecision nest autoris ee, lordinateur etant le censeur ultime. Pourquoi distribuer lintelligence? Le d eveloppement de ces techniques pose un probl` eme fondamental: pourquoi cherche-t-on ` a cr eer des intelligences collectives? Pourquoi vouloir ` a tout prix prendre un point de vue local? Pourquoi tout simplement vouloir distribuer lintelligence? On peut r epondre ` a ces questions de plusieurs mani` eres. La premi` ere revient a constater que les syst` ` emes informatiques industriels sont de plus en plus compliqu es et font intervenir un grand nombre de sous-syst` emes de nature fort diverse, comprenant de nombreuses fonctionnalit es, interagissant avec plusieurs sp ecialistes humains (op erateurs, experts, techniciens, etc.), qui se trouvent souvent r epartis naturellement dans lespace physique. Dans les grosses applications industrielles, telles que la surveillance de r eseaux etendus (t el ecommunications, transport et distribution d energie, de mati` eres premi` eres, de produits nis) les sous-syst` emes de surveillance et de gestion sont naturellement distribu es aux nuds du r eseau et font appel ` a un grand nombre de techniciens et de programmes divers qui doivent travailler ensemble pour accomplir lobjectif global: faire en sorte que le syst` eme fonctionne. Chaque intervenant na quune vue partielle de ce quil doit faire, mais lensemble r eagit convenablement si les actions de chacun sont ecacement coordonn ees. De ce fait, on peut expliquer la n ecessit e dune distribution de lactivit e et de lintelligence par les raisons suivantes: Les probl` emes sont physiquement distribu es. En premier lieu, les probl` emes complexes sont souvent physiquement distribu es: un r eseau de transport est par nature r eparti sur un espace important, mais un syst` eme de contr ole industriel, tels que ceux qui sont ` a luvre dans des raneries ou dans des cha nes de montage, suppose lui aussi une certaine distribution dans lespace des activit es. Il en est de m eme pour la gestion de trac de v ehicules: chaque voiture ou chaque avion est une entit e autonome qui doit parvenir ` a sa destination dans le meilleur etat possible. Les probl` emes sont fonctionnellement tr` es distribu es et h et erog` enes. Concevoir un produit industriel aussi elabor e quune voiture de course, quun avion de ligne ou quun lanceur de satellites r eclame lintervention dun grand nombre de sp ecialistes, qui ne poss` edent quune vision locale de lensemble des probl` emes
11
pos es par la r ealisation du syst` eme: nul en eet nest susamment savant ou quali e pour produire une telle r ealisation ` a lui tout seul. Lensemble des probl` emes est trop vaste pour un seul individu. Une voiture de formule 1, par exemple, fait intervenir un grand nombre dexperts pour sa mise au point: il y a le sp ecialiste des moteurs, celui des ch assis, celui des pneumatiques, ling enieur en chef et le pilote. Toutes ces personnes mettent leurs connaissances en commun pour essayer de faire la meilleure voiture possible. Les r eseaux imposent une vision distribu ee. A lheure des r eseaux interplan etaires, o` u toute linformation et la puissance de traitement est r epartie sur un nombre consid erable de sites (le r eseau Internet comprend dores et d ej` a plusieurs dizaines de milliers de sites de par le monde), le g enie logiciel doit cesser de penser global. Comme lindique C. Hewitt (Hewitt 1985), il faut penser en termes de syst` emes ouverts, cest-` a-dire en termes dinterop erabilit e radicale des syst` emes informatiques. La t el einformatique mobile en particulier n ecessite une refonte compl` ete de nos pr esuppos es fond es sur la notion de machine de Von Neumann, s equentielle, xe et qui g` ere de fa con individuelle toute linformation dont elle a besoin. La proposition de M. Tokoro (Tokoro 1993) concernant la r ealisation dun champ calculatoire (computing eld) sinscrit dans ce courant. Il faut consid erer que lespace informatique nest quune gigantesque toile daraign ee (la World Wide Web du r eseau Internet en constitue une premi` ere approche) dans laquelle tout ordinateur, quil soit xe, portable ou mobile, est connect e` a lensemble des autres ordinateurs du monde entier. Les SMA se pr esentent ainsi comme des candidats s erieux pour la construction darchitectures ouvertes, distribu ees, h et erog` enes et souples, capables dorir une grande qualit e de service dans un travail collectif, sans imposer une structure a priori. La complexit e des probl` emes impose une vision locale. Lorsque les probl` emes sont trop vastes pour etre analys es globalement, les solutions fond ees sur des approches locales permettent souvent de les r esoudre plus rapidement. Par exemple, la r egulation de trac a erien est un probl` eme global complexe, dicile ` a r esoudre du fait du grand nombre de param` etres qui sont mis en jeu et de lensemble des contraintes qui doivent etre satisfaites. Comme nous le verrons au chapitre 8, des approches locales permettent de r esoudre el egamment et ecacement ce type de probl` eme. Evidemment, il est plus dicile (voire souvent impossible) de v erier th eoriquement la validit e de la solution. Mais les r esultats empiriques montrent que les solutions sont bonnes et paraissent souvent tr` es naturelles. La pens ee locale induite par la k en etique constitue ainsi une approche prometteuse pour la r esolution de grands probl` emes complexes, car elle permet ` a la fois de simplier lobtention des r esultats en evitant les dicult es li ees ` a linecacit e des algorithmes fonctionnant sur des espaces globaux, tout en orant des r esultats comparables qui emergent des interactions locales. Les syst` emes doivent pouvoir sadapter ` a des modications de structure ou
12
` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS denvironnement. Savoir concevoir des syst` emes informatiques ecaces, ables et corrects ne sut plus. Devant les d es de la complexit e, il faut aussi penser ` a ladaptabilit e dun logiciel ` a des modications du contexte de travail (changement de syst` eme dexploitation, de gestionnaire de bases de donn ees, dinterfaces graphiques, ajouts dautres logiciels, etc.), et sa n ecessaire capacit e d evolution face ` a des besoins sans cesse accrus (ajouts de fonctionnalit es, modications de lutilisation, int egration ` a dautres logiciels, etc.). Dans ce cadre, les SMA, de par leur nature distribu ee, parce quils supposent toujours un raisonnement local, quils permettent lint egration et lapparition ou la disparition dagents en cours m eme de fonctionnement, constituent des architectures particuli` erement aptes ` a prendre en compte l evolutivit e et ladaptation n ecessaires au fonctionnement du syst` eme. Le g enie logiciel va dans le sens dune conception en termes dunit es autonomes en interactions. Lhistoire du d eveloppement des logiciels montre que la r ealisation de programmes informatique suit une d emarche visant ` a la r ealisation de syst` emes con cus comme des ensembles dentit es de plus en plus distribu ees, mettant en jeu des composants davantage individualis es et autonomes. Le r ecent d eveloppement des langages ` a objets dans tous les secteurs de linformatique est l` a pour en t emoigner: le g enie logiciel passe par la r ealisation de modules autonomes capables dinteragir les uns avec les autres, m eme, et surtout, lorsque ceux-ci sont con cus par des personnes, des equipes ou des entreprises di erentes. Il faut donc associer la uidit e des calculs, la distribution des traitements et lh et erog en eit e des r ealisations. Les SMA ont ici un r ole essentiel ` a jouer en sinscrivant comme les possibles successeurs des syst` emes ` a objets, en ajoutant ` a la localit e des comportements lautonomie et la r epartition des prises de d ecision. On peut ainsi d ej` a parier que le g enie logiciel de demain sera orient e agent, comme celui daujourdhui commence a ` etre orient e objet.
1.2
Agent et soci et e
Toute la probl ematique de la k en etique se situe au carrefour des notions dagents et de soci et es, ou si lon pr ef` ere, de la relation entre les comportements individuels et les ph enom` enes observ es au niveau global. Cest ainsi que, dans la dialectique de lindividu et du groupe, les notions de coop eration, conit, collaboration et coordination dactions prennent tout leur sens. Mais avant dentrer plus avant dans cette probl ematique, nous devons essayer de circonscrire ce que lon entend par les termes dagent et de syst` eme multi-agent.
1.2.1
Quelques d enitions
Quest ce quun agent? Comme dans tous les domaines porteurs, le terme agent est utilis e de mani` ere assez vague. Cependant on peut d egager une d enition minimale commune qui est approximativement la suivante:
E 1.2. AGENT ET SOCIET D enition: On appelle agent une entit e physique ou virtuelle a. qui est capable dagir dans un environnement, b. qui peut communiquer directement avec dautres agents, c. qui est mue par un ensemble de tendances (sous la forme dobjectifs individuels ou dune fonction de satisfaction, voire de survie, quelle cherche ` a optimiser), d. qui poss` ede des ressources propres, e. qui est capable de percevoir (mais de mani` ere limit ee) son environnement, f. qui ne dispose que dune repr esentation partielle de cet environnement (et eventuellement aucune), g. qui poss` ede des comp etences et ore des services, h. qui peut eventuellement se reproduire, i. dont le comportement tend ` a satisfaire ses objectifs, en tenant compte des ressources et des comp etences dont elle dispose, et en fonction de sa perception, de ses repr esentations et des communications quelle re coit.
13
Chacun des termes de cette d enition est important. Une entit e physique est quelque chose qui agit dans le monde r eel: un robot, un avion ou une voiture sont des exemples dentit es physiques. En revanche, un composant logiciel, un module informatique sont des entit es virtuelles, car elles nexistent pas physiquement. Les agents sont capables dagir, et non pas seulement de raisonner comme dans les syst` emes dIA classique. Laction, qui est un concept fondamental pour les syst` emes multi-agents, repose sur le fait que les agents accomplissent des actions qui vont modier lenvironnement des agents et donc leurs prises de d ecision futures. Ils peuvent aussi communiquer entre eux, et cest dailleurs l` a lun des modes principaux dinteraction existant entre les agents. Ils agissent dans un environnement, sauf, comme nous le verrons, pour les agents purement communicants pour lesquels toutes les actions se r esument ` a des communications. Les agents sont dou es dautonomie. Cela signie quils ne sont pas dirig es par des commandes venant de lutilisateur (ou dun autre agent), mais par un ensemble de tendances (cf. chap. 5) qui peuvent prendre la forme de buts individuels ` a satisfaire ou de fonctions de satisfaction ou de survie que lagent cherche ` a optimiser. On pourrait dire ainsi que le moteur dun agent, cest lui-m eme. Cest lui qui est actif. Il a la possibilit e de r epondre par larmative ou le refus ` a des requ etes provenant des autres agents. Il dispose donc dune certaine libert e de manuvre, ce qui le di erencie de tous les concepts semblables, quils sappellent objets, modules logiciels ou processus. Mais lautonomie nest pas seulement comportementale, elle porte aussi sur les ressources. Pour agir, lagent a besoin dun certain nombre de ressources: energie, CPU, quantit e de m emoire, acc` es ` a certaines sources dinformations, etc. Ces ressources sont ` a la fois ce qui rend lagent non seulement d ependant de son environnement, mais aussi, en etant capable de g erer ces
14
ressources, ce qui lui donne une certaine ind ependance vis-` a-vis de lui. Lagent est ainsi ` a la fois un syst` eme ouvert (il a besoin d el ements qui lui sont ext erieurs pour survivre) et un syst` eme ferm e (car les echanges quil a avec lext erieur sont tr` es etroitement r eglement es). Les agents nont quune repr esentation partielle de leur environnement, cest-` adire quils nont pas de vision globale de tout ce qui se passe. Cest dailleurs ce qui se passe dans les r ealisations humaines denvergure (la fabrication dun Airbus par exemple) dans lesquelles personne ne conna t tous les d etails de la r ealisation, chaque sp ecialiste nayant quune vue partielle correspondant ` a son domaine de comp etence. Lagent est ainsi une sorte dorganisme vivant dont le comportement, qui se r esume ` a communiquer, ` a agir et, eventuellement, ` a se reproduire, vise ` a la satisfaction de ses besoins et de ses objectifs ` a partir de tous les autres el ements (perceptions, repr esentations, actions, communications et ressources) dont il dispose. D enition: On appelle syst` eme multi-agent (ou SMA), un syst` eme compos e des el ements suivants: 1. Un environnement E , cest-` a-dire un espace disposant g en eralement dune m etrique. 2. Un ensemble dobjets O. Ces objets sont situ es, cest-` a-dire que, pour tout objet, il est possible, ` a un moment donn e, dassocier une position dans E . Ces objets sont passifs, cest-` a-dire quils peuvent etre per cus, cr e es, d etruits et modi es par les agents. 3. Un ensemble A dagents, qui sont des objets particuliers (A O), lesquels repr esentent les entit es actives du syst` eme. 4. Un ensemble de relations R qui unissent des objets (et donc des agents) entre eux. 5. Un ensemble dop erations Op permettant aux agents de A de percevoir, produire, consommer, transformer et manipuler des objets de O. 6. Des op erateurs charg es de repr esenter lapplication de ces op erations et la r eaction du monde ` a cette tentative de modication, que lon appellera les lois de lunivers(cf. chap. 4). La gure 1.1 donne une illustration de la notion de syst` eme multi-agents. Il existe un cas particulier de syst` emes dans lequel A = O, et E est egal ` a lensemble vide. Dans ce cas, les relations R d enissent un r eseau: chaque agent est li e directement ` a un ensemble dautres agents, que lon appelle ses accointances (chap. 5). Ces syst` emes, que lon peut appeler SMA purement communicants3 , sont
3 Nous utiliserons le terme syst` eme multi-agent communicant ou SMA communicant, comme notation r eduite de ce que nous devrions appeler syst` eme multi-agent dont les agents communiquent directement entre eux par le biais de messages. Lorsquil ny a pas denvironnement et que les agents ne font que communiquer, on parlera de SMA purement communicant. Nous eectuerons le m eme raccourci avec le terme syst` eme multi-agent situ e ou SMA situ e, pour signier quil sagit dun syst` eme multi-agent dont les agents sont positionn es dans un environnement, et SMA purement situ e pour d esigner un SMA situ e dans lequel les agents ne communiquent pas par envois de messages, mais seulement par propagation de signaux (cf. chap. 6).
E 1.2. AGENT ET SOCIET
15
Objectifs
But: B
Le Monde
Moi Lui
Reprsentations
Je sais faire: C
Communications
Perceptions Ressources Actions
Agents Objets de l'environnement
Environnement
Figure 1.1: Repr esentation imag ee dun agent en interaction avec son environnement et les autres agents tr` es courants en intelligence articielle distribu ee. Leur domaine de pr edilection est la coop eration de modules logiciels dont la fonction est de r esoudre un probl` eme ou d elaborer une expertise (interpr etation de signaux ou conception dun produit par exemple) ` a partir de modules sp ecialis es, comme dans le cas dun syst` eme de contr ole distribu e, o` u E est d eni par la structure du r eseau sous-jacent. Ces syst` emes se caract erisent par le fait que les interactions sont essentiellement des communications intentionnelles (cf. chap. 6) et que le mode de travail ressemble ` a celui dun organisme social (groupe de travail, entreprise, administration, etc.). Lorsque les agents sont situ es, E est g en eralement un espace m etrique, et les agents sont capables de percevoir leur environnement, cest-` a-dire de reconna tre les objets situ es dans lenvironnement en fonction de leurs capacit es perceptives, et dagir, cest-` a-dire de transformer l etat du syst` eme en modiant les positions et les relations existant entre les objets. Nous verrons que la plupart des syst` emes multi-agents r eactifs consid` erent que la notion denvironnement est fondamentale pour la coordination des actions entre plusieurs agents. Par exemple, dans un univers de robots, les agents A sont les robots, E est lespace g eom etrique euclidien dans lequel se meuvent les robots et O se compose evidemment des agents, mais aussi de lensemble des objets physiques plac es ici et l` a, et que les robots doivent eviter, prendre ou manipuler. Les op erations Op sont les actions que les robots peuvent faire en se d epla cant, en bougeant les autres objets ou en communiquant, et R est lensemble des relations qui unissent certains agents ` a dautres, telles que des relations daccointances (certains agents en connaissent dautres) et les relations de communicabilit e (les agents peuvent communiquer avec certains agents mais pas n ecessairement avec tous). De ce fait, la dualit e agent/environnement est au cur des syst` emes multi-agents situ es. En agissant ` a partir de ses perceptions de lespace physique et des communications directes quil re coit, lagent se d enit comme limage duale de son en-
16
vironnement, cest-` a-dire par ce qui le distingue de ce qui lentoure. Inversement, lenvironnement dun agent est caract eris e par tout ce qui nest pas lui. Il est donc impossible de d enir la notion dagent situ e ind ependamment de celle denvironnement, les deux etant intrins` equement li ees et constituant deux aspects compl ementaires dun univers multi-agent. La r ealisation dun syst` eme multi-agent situ e passe ainsi par la d enition simultan ee de la structure des agents et de celle de leur environnement, les actions de ceux-l` a devant sex ecuter au sein de celui-ci. Lorsque les agents sont purement communicants ou purement situ es, la d enition que nous avons donn e des syst` emes multi-agents peut etre adapt ee. D enition: Par comparaison avec la d enition g en erale dun agent donn ee pr ec edemment, on appelle agent purement communicant (ou agent logiciel) une entit e informatique qui: a. se trouve dans un syst` eme informatique ouvert (ensemble dapplications, de r eseaux et de syst` emes h et erog` enes) b. peut communiquer avec dautres agents, c. est mue par un ensemble dobjectifs propres, d. poss` ede des ressources propres, f. ne dispose que dune repr esentation partielle des autres agents, g. poss` ede des comp etences (services) quelle peut orir aux autres agents, i. a un comportement tendant ` a satisfaire ses objectifs, en tenant compte des ressources et des comp etences dont elle dispose et en fonction de ses repr esentations et des communications quelle re coit. Un agent purement communicant se distingue donc de la notion dagent en g en eral par le fait quil ne poss` ede pas de perception des autres agents (la mention (e) nexiste plus), que ses tendances prennent laspect dobjectifs (ou intentions, cf. chap. 5), quil nagit pas dans un environnement4 et que son contexte d evolution est naturellement celui des r eseaux informatiques. D enition: On appelle agent purement situ e une entit e physique (ou eventuellement informatique si on la simule) qui: a. se trouve situ ee dans un environnement, c. est mue par une fonction de survie, d. poss` ede des ressources propres, sous la forme d energie et doutils,
4 Au sens o` u nous lentendons dans cet ouvrage, cest-` a-dire dun espace muni dune m etrique et dans lequel des agents sont positionn es. En revanche, les agents purement communicants vivent dans ce que lon appelle souvent un environnement informatique, cest-` a-dire un ensemble de processeurs, de logiciels et de ressources quils peuvent utiliser et avec lesquels ils interagissent. Pour eviter une confusion entre ces deux termes, nous utiliserons le terme contexte pour d ecrire le cadre dans lequel evoluent les agents.
E 1.2. AGENT ET SOCIET e. est capable de percevoir (mais de mani` ere limit ee) son environnement, f. ne poss` ede pratiquement aucune repr esentation de son environnement, g. poss` ede des comp etences, h. peut eventuellement se reproduire, i. a un comportement tendant ` a satisfaire sa fonction de survie, en tenant compte des ressources, des perceptions et des comp etences dont elle dispose.
17
Les agents purement situ es sont donc ` a loppos e des agents logiciels en ce qui concerne les capacit es de repr esentations (quasiment nulles) et le fait que les communications ne seectuent g en eralement pas directement, mais indirectement par le biais des perceptions et de leurs actions dans lenvironnement (cf. chap. 6).
1.2.2
Niveaux dorganisation
En reprenant la classication propos ee par G. Gurvitch (Gurvitch 1963), maintenant traditionnelle en sociologie (Rocher 1968), on peut distinguer trois niveaux dorganisation dans les syst` emes multi-agents: 1. Le niveau micro-social, o` u lon sint eresse essentiellement aux interactions entre agents et aux di erentes formes de liaison qui existent entre deux ou un petit nombre dagents. Cest ` a ce niveau que la plupart des etudes ont et e g en eralement entreprises en intelligence articielle distribu ee. 2. Le niveau des groupes, o` u lon sint eresse aux structures interm ediaires qui interviennent dans la composition dune organisation plus compl` ete. A ce niveau, on etudie les di erenciations des r oles et des activit es des agents, l emergence de structures organisatrices entre agents et le probl` eme g en eral de lagr egation des agents lors de la constitution dorganisations. 3. Le niveau des soci et es globales (ou populations) o` u lint er et se porte surtout sur la dynamique dun grand nombre dagents, ainsi que sur la structure g en erale du syst` eme et son evolution. Les recherches se situant dans le cadre de la vie articielle se situent assez souvent ` a ce niveau. Evidemment, ` a linstar de la plupart des classications, celle-ci ne doit pas etre consid er ee comme une norme xe d etude, mais plut ot comme un rep` ere destin e` a guider notre jugement et notre analyse. Elle sugg` ere notamment quil est possible danalyser et de concevoir des organisations articielles soit ` a partir dune sp ecication globale de la soci et e que lon veut obtenir et des propri et es recherch ees, soit au contraire a partir de la d ` enition ne des agents, la soci et e nale etant la cons equence recherch ee ou non des interactions entre les agents. La premi` ere approche est descendante et caract eristique dune d emarche ding enieur cherchant ` a obtenir un syst` eme qui r eponde ` a un besoin. La seconde est plus
18
exp erimentale: elle saccommode mieux dun travail exploratoire dans lequel on tente dobtenir des propri et es emergentes. Le travail portant sur les organisations articielles se situe donc au centre dune dualit e irr eductible agent/organisation: toute organisation est le r esultat dune interaction entre agents, et le comportement des agents est contraint par lensemble des structures organisatrices, comme le montre la gure 1.2.
Organisation
mergence de fonctionnalits
Systmes d'interactions
contraintes et objectifs sociaux
Agents
Figure 1.2: La relation micro-macro dans les syst` emes multi-agents Par exemple, si la di erenciation comportementale et la constitution de sp ecialistes peuvent etre vues comme des fonctionnalit e emergentes, lattribution dun r ole ` a un agent r eduit dautant la marge de manuvre des autres, ce qui impose des contraintes ` a chacun des agents quant ` a lensemble de ses comportements possibles (cf. chap. 7). De m eme, si des ph enom` enes emergents tels que des mouvements giratoires peuvent appara tre dans un syst` eme anti-collision fortement contraint (cf. chap. 8), tout agent venant sins erer dans ce mouvement doit n ecessairement tourner dans le sens giratoire impos e par le groupe. De ce fait, une soci et e nest pas n ecessairement une entit e donn ee, cest-` a-dire un objet pr eexistant ` a laction de ses membres. Si des organisations telles que des institutions publiques ou des entreprises poss` edent une individualit e propre qui se distingue de lensemble de celles de ses membres, il nen est pas n ecessairement ainsi de structures collectives plus simples tels que des groupes de travail ou des hordes danimaux. M eme des soci et es r eput ees complexes, telles que des colonies dabeilles ou de fourmis, ne doivent pas n ecessairement etre consid er ees comme des individus ` a part enti` ere si lon veut en comprendre lorganisation et les ph enom` enes de r egulation et d evolution qui y r` egnent. En termes de syst` emes multi-agents, cela signie quune organisation peut emerger de la rencontre dactions individuelles, sans quil soit n ecessaire de d enir un objet particulier (un el ement de lensemble O) qui le repr esente. A linverse, cela ne signie pas quil est impossible ou inutile, ou m eme impensable, de repr esenter les soci et es comme des entit es ` a part enti` ere. On peut tr` es naturellement concevoir un agent sous la forme dun syst` eme multi-agents, et donc consid erer les SMA comme des poup ees russes, cest-` a-dire comme des
19
embo tements dagents eux-m emes repr esent es sous la forme de SMA. Le processus de construction est alors r ecursif et se continue jusqu` a la r ealisation dagents primitifs ind ecomposables. Le rapport qui existe entre agent et organisation est donc une r ealit e mouvante. Sauf dans les cas o` u lorganisation est d ecrite int egralement par le concepteur du syst` eme, la r epartition du travail, la coordination des actions et lassignation des r oles r esultent des activit es de ses membres. Une organisation nest donc pas seulement une structure statique telle quon peut lanalyser si lon consid` ere un syst` eme multi-agent ` a un moment donn e, mais un processus organisateur dont la structure nest quun eet r esultant. Cette conception rejoint celle de M. Crozier et E. Friedberg sur les organisations humaines (Crozier et Friedberg 1977), o` u ces derni` eres sont consid er ees comme proc edant des syst` emes dactions des acteurs de ces organisations, cest-` a-dire des strat egies de prises de pouvoir, de repli et de n egociations d enissant des ordres locaux de r egulation (Friedberg 1993). Entre les individus qui en sont les acteurs et les organisations qui en r esultent, il existe donc des processus essentiels par lesquels cette dualit e sexprime. Il sagit des ph enom` enes dinteraction dont la logique d epend ` a la fois des capacit es des agents mais aussi des caract eristiques et des contraintes du syst` eme dans son ensemble. Cest dailleurs en mettant laccent sur les interactions et, plus exactement, en analysant les syst` emes dinteractions qui existent entre les agents que les syst` emes multi-agents se distinguent des consid erations syst emiques ou sociologiques plus classiques dont nous reparlerons plus loin. En eet, alors que nombre dapproches consid` erent les syst` emes dun point de vue global, holiste m eme, et dont lanalyse proc` ede de mani` ere descendante, les syst` emes multi-agents prennent le parti de l emergence, cest-` a-dire de laction et de linteraction, comme el ement moteur de la structuration de la soci et e dans son ensemble. Les syst` emes dinteractions constituent ainsi lobjet d etude essentiel des syst` emes multi-agents et servent ` a articuler le rapport qui existe entre lagent dune part et lorganisation dans sa globalit e dautre part.
1.2.3
Social ou biologique?
Faut-il concevoir les agents comme des entit es d ej` a intelligentes, cest-` a-dire capable de r esoudre certains probl` emes par eux-m emes, ou bien faut-il les assimiler a ` des etres tr` es simples r eagissant directement aux modications de lenvironnement? Agents cognitifs et r eactifs Ces deux conceptions ont donn e lieu ` a deux ecoles de pens ee. La premi` ere, l ecole cognitive, est la plus repr esent ee dans le domaine que lon appelle intelligence articielle distribu ee (IAD) car elle trouve son origine dans la volont e de faire communiquer et coop erer des syst` emes experts classiques. Dans ce cadre, un syst` eme multi-agent est compos e dun petit nombre dagents intelligent. Chaque agent dispose dune base de connaissance comprenant lensemble des informations et des savoir-faire n ecessaires ` a la r ealisation de sa t ache et ` a la gestion des interactions
20
avec les autres agents et avec son environnement. On dit aussi que les agents sont intentionnels, cest-` a-dire quils poss` edent des buts et des plans explicites leur permettant daccomplir leurs buts. Dans ce cadre, les probl` emes de coop eration ressemblent etonnamment ` a ceux de petits groupes dindividus, qui doivent coordonner leur activit e et sont parfois amen es ` a n egocier entre eux pour r esoudre leurs conits (Bond et Gasser 1988) (Demazeau et M uller 1991) (Chaib-Draa et al. 1992). Les analogies sont alors sociales et nombre de chercheurs dans ce domaine sappuient sur les travaux de sociologie et en particulier sur la sociologie des organisations et des petits groupes. Lautre tendance, l ecole r eactive, pr etend au contraire quil nest pas n ecessaire que les agents soient intelligents individuellement pour que le syst` eme ait un comportement global intelligent (Deneubourg et al. 1991) (Steels 1989) (Ferber et Drogoul 1992). Des m ecanismes de r eaction aux ev enements, ne prenant en compte ni une explicitation des buts, ni des m ecanismes de planication, peuvent alors r esoudre des probl` emes quali es de complexes. Lexemple le plus manifeste dorganisation emergente est celle de la fourmili` ere (Corbara et al. 1993): alors que toutes les fourmis se situent sur un plan d egalit e et quaucune dentre elles ne poss` ede de pouvoir dautorit e stricte sur les autres, les actions des fourmis se coordonnent de mani` ere que la colonie survive et fasse donc face ` a des probl` emes complexes tels que ceux pos es par la recherche de nourriture, les soins ` a donner aux ufs et aux larves, la construction de nids, la reproduction, etc. Intentions, pulsions et r eexes En r ealit e cette division cognitif/r eactif est parfois trop simpliste. Il nous faut laner en d egageant deux axes: 1. La conduite des agents est r egie par lopposition entre des comportements t el eonomiques dirig es vers des buts explicites et des comportements r eexes r egis par les perceptions. Nous lavons dit, tous les agents sont par d enition mus par des tendances. Mais, comme nous le verrons au chapitre 5, certaines tendances peuvent provenir de lenvironnement, alors que dautres sont explicitement exprim ees dans les agents. On parlera de comportements r eexes dans le premier cas et de comportements t el eonomiques dans le second. 2. La relation de lagent ` a son environnement pose la probl ematique classique du couple sujet/objet de savoir si lagent dispose dune repr esentation symbolique et explicite du monde ` a partir de laquelle il peut raisonner, ou si sa repr esentation se situe ` a un niveau sub-symbolique, cest-` a-dire int egr e dans ses capacit es sensori-motrices (Piaget et Inhelder 1966). Dans le premier cas, on parlera dagents cognitifs et, dans le second, dagents r eactifs. Ces deux axes peuvent se combiner pour distinguer quatre types dagents oppos es par leur mani` ere dagir et de concevoir le monde, comme le montre le tableau 1.1. La plupart des agents cognitifs sont intentionnels, cela signie quils poss` edent des buts explicites qui motivent leurs actions. On les dit aussi rationnels, cest-` a-dire que les

Relation au monde Conduites Tlonomiques Rflexes Agents intentionnels Agents "modules" Agents pulsionnels Agents tropiques Agents cognitifs Agents ractifs
21
Table 1.1: Les di erents types dagent en fonction de leurs capacit es repr esentationnelles et de leurs modes de conduite actions quils mettent en uvre suivent un principe de rationalit e par rapport aux buts qui les dirigent. Les agents modules (cognitifs r eexes) se situent ` a la limite de la notion dagent. Ils sont parfois utilis es comme agents auxiliaires capables de r epondre ` a des questions ou daccomplir des t aches qui leur sont command ees par dautres agents, sans que ces demandes viennent sinscrire comme des buts explicites de lagent. On peut penser ` a des bases de donn ees ou ` a des agents calculateurs, cesta-dire ` ` a des agents qui r epondent directement aux requ etes qui leur sont adress ees. Les agents r eactifs peuvent etre dirig es par des m ecanismes de motivation les poussant ` a accomplir une t ache, tels que la satisfaction dun besoin interne (par exemple maintenir leur niveau energ etique) ou laccomplissement dun but d eni par le constructeur, auquel cas on parlera dagents pulsionnels. On peut aussi ne les faire r epondre qu` a des stimuli de lenvironnement, leur comportement etant guid e int egralement par l etat local du monde dans lequel ils se trouvent plong es. On les qualiera alors dagents tropiques. Les syst` emes multi-agents ne comprenant que des agents tropiques seront appel es SMA tropiques. La di erence entre ces deux formes daction est due ` a la disparit e de provenance des sources de motivation. Dans le premier cas, celles-ci se trouvent ` a lint erieur de lagent alors que, dans le second, elles se situent dans lenvironnement. En r ealit e, cette distinction est parfois dicile ` a pr eserver. Les comportements de ces agents sont souvent d eclench es par des combinaisons de pulsions internes et de stimulations externes, et le passage du r eexe au pulsionnel est relativement arbitraire. De ce fait, par la suite, sauf lorsque les besoins sen feront sentir, nous parlerons essentiellement dagents r eactifs, sans distinguer entre pulsionnels et tropiques. Les agents cognitifs, en raison de leur sophistication et de leur capacit e ` a raisonner sur le monde, peuvent travailler de mani` ere relativement ind ependante. Les t aches quils accomplissent sont complexes au regard des facult es plus el ementaires des agents r eactifs. Ils peuvent ainsi r esoudre des probl` emes compliqu es de mani` ere relativement individuelle. Leur repr esentation interne et les m ecanismes dinf erence dont ils disposent leur permettent de fonctionner ind ependamment des autres agents et leur orent une grande souplesse dans lexpression de leur comportement. Inversement, la structure plus frustre des agents r eactifs leur impose des comportements plus rigides. De ce fait, les agents r eactifs ne sont pas tr` es puissants puisque r eduits ` a leur propre moyens. Individuellement ils sont tr` es faibles. Mais leur force vient de leur capacit e` a se mettre en groupe, cest-` a-dire de constituer des colonies capables de sadapter ` a leur environnement. Ainsi, ce nest pas au niveau de
22
lindividu que les agents r eactifs sont int eressants, mais au niveau de la population et des capacit es dadaptation et d evolution qui emergent des interactions entre ses membres. Les agents r eactifs nont pas ou peu dindividualit e: ils se fondent dans la masse, mais de par leur nombre et la redondance qui en d ecoule, ils peuvent faire face ` a des t aches complexes et ainsi rivaliser en termes de performances avec des agents plus sophistiqu es mais moins nombreux. Anticipations et r eaction Enn, et cest peut- etre ce qui constitue la distinction essentielle, lopposition cognitif/r eactif recouvre une autre dualit e: la capacit e ou non danticiper sur les ev enements futurs et de sy pr eparer. Les agents r eactifs, par le fait m eme quils nont pas de repr esentation de leur environnement et des autres agents, sont incapables de pr evoir ce qui va se passer et donc danticiper en planiant les actions ` a accomplir. Au contraire, les agents cognitifs, par leur capacit e de raisonner sur des repr esentations du monde, sont capables ` a la fois de m emoriser des situations, de les analyser, de pr evoir des r eactions possibles ` a leurs actions, den tirer des conduites pour les ev enements futurs et donc de planier leur propre comportement (toute planication suppose, en eet, que lon soit capable de traiter des actions en dehors de leur ex ecution, ` a partir de description de lenvironnement et de ces actions). Et cest donc gr ace ` a leurs capacit es cognitives qui leur permettent de se construire un monde virtuel quils peuvent manipuler que les agents cognitifs sont ` a m eme de produire des plans dactions. Cette capacit e danticipation et de planication permet ` a certains agents doptimiser leur comportement et de neectuer ainsi que les actions v eritablement n ecessaires. Par exemple, supposons quun robot veuille franchir une porte et que celle-ci soit ferm ee ` a clef. Sil sagit dun agent cognitif, il pourra construire un plan dans sa t ete tel que: Plan ouvrirPorte aller jusqu` a lendroit o` u se trouve la clef prendre la clef aller jusqu` a la porte ouvrir la porte avec la clef En ex ecutant ce plan, lagent cognitif ira directement au lieu o` u se trouve la clef pour la prendre, puis il se dirigera vers la porte pour louvrir ` a laide de la clef. Au contraire, un agent r eactif, du fait quil ne dispose pas de repr esentation de lunivers dans lequel il evolue, ne peut pas eectuer ce type de raisonnement a priori. Il ne r eagit que face ` a la situation. Pour r esoudre ce probl` eme, on pourra construire un agent r eactif qui dispose du comportement suivant: R1: si je alors R2: si je alors suis devant la porte et que jai une clef, louvrir suis devant la porte et sans clef, essayer de louvrir
E 1.2. AGENT ET SOCIET R3: si la porte ne souvre pas et que je nai pas la clef, alors aller chercher la clef R4: si je cherche une clef et quil y a une clef devant moi, alors prendre la clef et aller vers la porte
23
Ces quatre r` egles susent pour r egler le comportement dun robot r eactif: si lagent se trouve devant une porte ferm ee ` a clef, il essayera de chercher la clef, puis il reviendra pour ouvrir la porte5 . La di erence entre les deux comportements est caract eristique. Dabord, dans le premier cas, le plan est construit, alors que dans le second les r` egles sont donn ees par le concepteur de lagent. Ensuite, la palme de lecacit e, en termes de nombre dactions eectu ees, revient evidemment ` a lagent cognitif qui optimise le nombre de ses d eplacements puisquil peut pr evoir la suite des actions ` a entreprendre, alors que lagent r eactif est contraint daller dabord vers la porte avant de se rendre compte que la clef nest pas l` a et quil faut aller la chercher. En revanche, lagent r eactif est plus souple. Si la porte est ouverte, il louvre directement sans aller chercher la clef au pr ealable. On peut aussi dire que lagent r eactif contient une connaissance compil ee des actions ` a eectuer: il na pas besoin de construire une repr esentation mentale de son monde car il lui sut de simplement r eagir aux situations qui se pr esentent. Mais la simplicit e de ses comportements t emoigne plus de lintelligence des concepteurs que de la sienne propre. Cette opposition entre cognitif et r eactif, si elle permet de bien situer les probl` emes, ne doit cependant pas etre prise au pied de la lettre. En eet, o` u placer la limite entre cognitif et r eactif? O` u se situe la ligne de d emarcation entre les agents qui disposent de mod` eles explicites et ceux qui ne r eagissent quaux stimuli de leur environnement? Il existe en eet toute une graduation entre lagent r eactif pur, qui ne r eagit quaux stimuli, et lagent cognitif total qui poss` ede un mod` ele symbolique du monde quil met continuellement ` a jour et ` a partir duquel il planie toutes ses actions. Entre ces deux extr emes, tout un eventail de possibilit es est oert, de lagent qui sadapte en m emorisant certaines informations sous forme de param` etres num eriques ` a celui qui poss` ede une carte mentale, cest-` a-dire une repr esentation analogique de son environnement lui permettant ainsi de d eterminer des trajectoires lors de son d eplacement. Cette distinction, quoiquutile dans une premier temps ne repr esente donc que les extr emit es dun segment de droite, et non une opposition cat egorique (g. 1.3). En eet, lenjeu actuel est dune part dessayer de construire des agents cognitifs ` a partir dorganisations r eactives et dautre part de r ealiser des agents qui disposent ` a la fois de capacit es cognitives et r eactives. Nous ferons par la suite souvent mention de ce contraste cognitif/r eactif, mais il faudra toujours pond erer cette dichotomie et comprendre quil ne sagit que dune
5 Nous verrons au chapitre 4 quil existe plusieurs mani` eres de d enir le comportement dun agent r eactif, les r` egles donn ees ici etant caract eristiques dune technique fond ee sur les actions situ ees.
24
classication de travail, qui doit pouvoir etre d epass ee, par une synth` ese des deux termes, chaque fois que cela sav` ere n ecessaire.
Agents purement cognitifs Agents purement ractifs
Reprsentations Reprsentations mixtes symbolico/ uniquement numriques symboliques
Reprsentations non symboliques
Pas de reprsentations
Figure 1.3: La distinction cognitif/r eactif d enit un axe pratique d evaluation de la capacit e des agents ` a accomplir individuellement des t aches complexes et ` a planier leurs actions.
1.2.4
Architecture et comportement
Un agent se caract erise essentiellement par la mani` ere dont il est con cu et par ses actions, en dautres termes par son architecture et par son comportement. Larchitecture correspond ` a un point de vue de concepteur, qui peut se r esumer ainsi: comment assembler les di erentes parties dun agent de mani` ere quil accomplisse les actions que lon attend de lui? Certaines questions deviennent alors particuli` erement pertinentes: les agents disposent-ils dune repr esentation de leur environnement ou bien ne font-ils que r eagir ` a des stimuli quils per coivent? Les agents sont-ils capables de raisonner ` a partir de symboles ou bien nappliquent-ils que des actions pr e- etablies? Les r eponses ` a ces questions se trouvent ` a lint erieur des agents, dans leurs entrailles. Il faut soulever le capot pour savoir quels sont les choix dimpl ementation qui ont et e eectu es. Larchitecture dun agent caract erise ainsi sa structure interne, cest-` a-dire le principe dorganisation qui sous-tend lagencement de ses di erents composants. Nous verrons au chapitre 3 quil existe un grand nombre darchitectures envisageables. Certaines sav` erent plus ecaces en temps de calcul, dautres sont plus souples et permettent de coder un vaste eventail dactions, dautres encore pr esentent lavantage de la simplicit e. En revanche, le comportement est analysable sans conna tre les d etails dimpl ementation. Il sagit dun ph enom` ene qui peut etre appr ehend e par un observateur ext erieur, qui, au regard des actions quentreprend lagent, d ecrit la relation qui existe entre lagent, son environnement et les autres agents. Par exemple, le fait pour un avion d eviter un autre avion est une caract eristique de son comportement, quelle que soit la mani` ere dont il est impl ement e. Le comportement caract erise ainsi lensemble des propri et es que lagent manifeste dans son environnement, cest-` a-dire ce que lon nomme en biologie sa fonction. Ce nest plus en soulevant le capot que lon peut comprendre le comportement dun agent, mais en regardant sa mani` ere d evoluer et de r epondre aux sollicitations de son environnement. Cette approche conduit ` a la r ealisation de mod` eles comportementaux ind ependants de larchitecture, m eme si, comme nous
25
le verrons, certaines architectures se pr etent mieux que dautres ` a la r ealisation de certains comportements. Lopposition entre les points de vue du concepteur et de lobservateur recoupe le d ebat bien connu en biologie entre la structure et la fonction. Pour le concepteur, le probl` eme consiste ` a trouver une architecture qui lui permette dimpl ementer des robots capables de manifester un certain comportement. Ainsi, pour le concepteur, le comportement de lagent est la manifestation de la structure de lagent, cest-` a-dire de son architecture et de son programme. Le comportement appara t alors comme une sp ecication externe de lagent, larchitecture d enissant les relations internes permettant daboutir ` a cette sp ecication. Inversement, lobservateur per coit un comportement ` a partir duquel il peut induire ou sp ecier ce quune architecture est cens ee produire. Si lagent est naturel, alors les architectures que lon peut proposer ne sont que des mod` eles par rapport a ` la r ealit e. En revanche, si lagent est articiel, les mod` eles comportementaux agissent comme des sp ecications, cest-` a-dire comme des contraintes de conception lors de la r ealisation de la structure interne dun agent.
1.2.5
Langages, communications et repr esentations
Linformatique est avant tout aaire de langage et de description. On ne peut concevoir de programmes informatiques sans lemploi dun ensemble de langages destin es ` a repr esenter, d ecrire et impl ementer des structures informatiques et des processus. Les concepteurs de syst` emes multi-agents font ainsi usage dun grand nombre de langages et de formalismes an den cerner tous leurs aspects. On peut les classer en quatre grands types, selon quon sint eresse ` a limpl ementation ou a la formalisation de SMA, ` ` a la repr esentation des connaissances des agents, ` a la d enition de leur comportement ou ` a leurs communications (g. 1.4).
abstraction
Langages de formalisation et de spcification
type L5
Langages de communication entre agents Langages de description des comportements et des lois de l'environnement Langages de reprsentation des connaissances
type L2 ralisation
type L3
Langages d'implmentation
type L4
type L1
Figure 1.4: Les di erents langages et formalismes intervenant dans la r ealisation de SMA
26
Type L1: Langages dimpl ementation Ils sont utilis es pour programmer le syst` eme multi-agents. Ceci recouvre ` a la fois les structures informatiques utilis ees pour les agents et lenvironnement (sil est simul e), les m ecanismes informatiques pour permettre le parall elisme inter et intraagent, limpl ementation eective des comportements, les activit es denvois et de r eception de messages, la perception dobjets et lensemble des outils n ecessaires pour mettre au point un SMA. Les langages les plus utilis es ` a ce niveau sont le plus souvent des langages de programmation classiques tels que Lisp, C/C++, Prolog ou Smalltalk, des langages supportant d ej` a des m ecanismes dex ecution parall` eles tels que les langages dacteurs (cf. chap. 3), voire des syst` emes ` a base de r` egles. Type L2: Langages de communication Ils assurent les interactions entre agents (communicants) par le biais de transmissions dinformations et de demandes mutuelles de renseignements et de services. De ce fait, les langages de communication constituent la colle permettant ` a des agents eventuellement h et erog` enes de coordonner leurs actions, de coop erer ` a un but commun et de sint egrer ` a un groupe dagents. Type L3: Langages de description des comportements et des lois de lenvironnement D ecrire directement les comportements des agents ou les lois de lunivers de lenvironnement dans des langages dimpl ementation ajoute un certain nombre de d etails inutiles pour la compr ehension du syst` eme et masque les principes essentiels. Cest pourquoi, des formalismes adapt es peuvent etre utilis es pour d ecrire ces comportements ou ces lois a un niveau plus abstrait, de mani` ` ere ` a b en ecier de repr esentations ind ependantes de limpl ementation et de la nature des agents. N eanmoins, ces formalismes restent a un niveau op ` eratoire, cest-` a-dire quils d ecrivent eectivement ce qui se passe de mani` ere abstraite. On pourra utiliser des langages ` a base de r` egles de production, ou, comme nous le verrons au chapitre 3, b en ecier des capacit es dabstraction fournies par des formalismes issus de lautomatisme ou des syst` emes distribu es tels que les r eseaux de Petri. Nous pr esenterons au chapitre 4 le mod` ele Bric pour d ecrire les comportements des agents de mani` ere modulaire. Type L4: Langages de repr esentation des connaissances Les langages de repr esentation des connaissances sont utilis es par les agents cognitifs pour d ecrire des mod` eles internes du monde dans lequel ils evoluent et leur permettre de raisonner et de faire des pr evisions sur lavenir ` a partir des informations dont ils disposent. Ces langages sont le plus souvent associ es ` a des syst` emes logiques, cest-` a-dire ` a des syst` emes formels disposant dune syntaxe et dune s emantique d enie rigoureusement pour expliciter leurs inf erences. Ils servent non seulement ` a exprimer les etats mentaux des agents, et notamment ` a repr esenter le contenu de leurs buts et de leurs croyances, mais aussi ` a d ecrire le comportement des agents.
27
Lorsque les agents sont simples et r eactifs, on peut eventuellement se passer de cette couche de langage. Mais pour les agents cognitifs ou des agents un tant soit peu complexes, lusage de langages de ce type est presque imp eratif. Dans cette famille, on trouve essentiellement des langages dIA, tels que des langages ` a base de r` egles ou de tableaux noirs, et des langages de repr esentation structur ee des connaissances tels que les r eseaux s emantiques (Lehmann 1992) ou les frames (Masini et al. 1989).
Type L5: Langages de formalisation et de sp ecication Au niveau le plus abstrait se trouvent des langages qui servent dune part ` a formaliser ce que lon entend par syst` emes multi-agents, par la notion dinteraction, par le concept dintention, etc., et dautre part ` a sp ecier les conditions qui doivent etre respect ees lors de la mod elisation et de limpl ementation de tels syst` emes. Les langages de ce type, qui sont issus des math ematiques, ont donc une perspective m eta par rapport aux autres familles de langages. On verra notamment au chapitre 4 une formalisation de la notion daction et dinteraction dans les SMA et au chapitre 5 comment certains formalismes issus des logiques modales permettent de sp ecier les conditions qui doivent etre remplies pour des agents cognitifs intentionnels. Tous ces langages sont evidemment li es: un protocole de n egociations, par exemple, utilisera un langage de type L2, cest-` a-dire un langage de communication, comme support des conversations et un langage de type L3 pour d ecrire les m ecanismes dinterpr etation des messages et les fonctions d evaluation des propositions evoqu ees de part et dautre, le second interpr etant les enonc es du premier. Les composants de la cognition ainsi que le mode de raisonnement des agents pourront etre repr esent es dans des langages de type L1, linterpr` ete de ce langage etant g en eralement ecrit en un langage de type L3. Enn, le fonctionnement g en eral du syst` eme ainsi que la structure conversationnelle employ ee devront respecter les sp ecications ecrites en L4. Ces langages peuvent avoir des formes dissemblables: le langage de type L3 peut etre C++; le langage de type 1 un langage ` a base de r` egles; le langage de type L2 peut poss eder une syntaxe tr` es particuli` ere et celui de type L4 etre un langage modal issu de la logique modale. Mais ils peuvent aussi se ressembler: si le langage de type L3 est Prolog, ceux de type L1 et L4 des langages issus de la logique des pr edicats du premier ordre et celui de type L2 un langage ayant une syntaxe pr edicative, limpression g en erale sera de manipuler toujours le m eme langage. Cependant cette impression ne sera que tr` es supercielle car toutes ces formes dexpression se distinguent tr` es naturellement par leur s emantique, cest-` adire par ce quelles d esignent. En eet, alors quun langage de programmation d ecrit les s equences dinstructions permettant aux agents dex ecuter leur comportement, un langage de repr esentation se r ef` ere aux choses que lagent peut conna tre et un langage de communication d esigne des actes de langage comme nous le verrons cidessous. Enn, un langage de sp ecication repr esente les conditions que doivent respecter les entit es pr esentes dans lunivers multi-agent.
28
1.3
Un peu dhistoire
Lapproche multi-agent se situe au carrefour de nombreuses disciplines. Les deux plus importantes sont lintelligence articielle distribu ee (IAD) qui a pour objet de r ealiser des organisations de syst` emes capables de r esoudre des probl` emes par le biais dun raisonnement le plus g en eralement fond e sur une manipulation de symboles, et la vie articielle (ou VA) qui cherche ` a comprendre et ` a mod eliser des syst` emes dou es de vie, cest-` a-dire capable de survivre, de sadapter et de se reproduire dans un milieu parfois hostile.
1.3.1
Les premiers ages
LIAD a pris naissance aux Etats-Unis sous des formes multiples. Les premiers syst` emes ont explor e essentiellement la relation existant entre architecture et mode de raisonnement, en d egageant deux types de contr ole: 1. Le premier sest organis e autour dune communication par partage dinformations et a donn e lieu ` a l elaboration du mod` ele de syst` eme ` a tableau noir. Les travaux de F. Hayes-Roth, L. Erman et V. Lesser (Erman et al. 1980) avec Hearsay II ont et e ` a la base de toutes les recherches ult erieures portant sur ce type de syst` eme. En partant dune application de compr ehension automatique de la parole, ils ont d evelopp e la m etaphore du tableau noir fond ee sur lid ee que la r esolution de probl` emes peut r esulter de lactivation opportuniste de sp ecialistes, les KS (pour Knowledge Sources), sans quil soit n ecessaire de d enir une structure de contr ole a priori. Lactivit e des KS consiste ` a d eposer, ` a modier et ` a retirer des objets sur une zone de travail commune, le tableau noir, qui structure la mod elisation du domaine dapplication comme lespace des hypoth` eses et des solutions. Un dispositif de contr ole g` ere les conits dacc` es entre les agents et organise leur fonctionnement. Nous d ecrirons un peu plus longuement ces architectures au chapitre 3. Dans le m eme ordre did ees, les travaux de Kornfeld et Hewitt sur Ether (Kornfeld 1979) ont port e sur la r esolution de probl` emes en partant de la m etaphore des communaut es scientiques. Des lutins (sprites), qui pr esentent beaucoup de points communs avec les KS des syst` emes pr ec edents, d eposent des faits, des hypoth` eses et des d emonstrations sur une zone commune semblable ` a celle dun tableau noir. La di erence r esulte essentiellement de la d ecomposition en deux cat egories de lutins, les d efenseurs et les sceptiques, les premiers tentant de d emontrer quune hypoth` ese est vraie, les seconds cherchant ` a montrer leur fausset e en exhibant des contre-exemples. Enn, ` a partir dune id ee tr` es am ericaine, des sponsors r eglaient lallocation de temps a allouer ` ` a chaque lutin. Bien que lid ee g en erale soit tr` es s eduisante, les moyens mis en uvre ne permettaient pas de r epondre aux objectifs g en eraux, car il r egnait une certaine confusion entre architecture et technique de coordination. On ne d enit pas, en effet, une organisation capable de d emontrer ou de r efuter une hypoth` ese ` a partir de consid erations sur les mod` eles architecturaux et les modes de communication. Depuis, les travaux en IAD portant sur la coop eration, la coordination daction et la n egociation se sont de plus en plus d egag es des contraintes architecturales. Ces
1.3. UN PEU DHISTOIRE
29
limites ne doivent cependant pas masquer linuence consid erable de ces syst` emes sur les recherches ult erieures dans ce domaine. 2. Les travaux sur le second sont dus ` a Lenat et ` a Hewitt. Dans les ann ees 75, D. Lenat, le futur auteur des syst` emes AM et Eurisko (Lenat et Brown 1984) et linstigateur du projet CYC (Lenat et Guha 1990), d eveloppa un syst` eme appel e PUP6 qui comprenait une foule did ees dont la plupart furent d evelopp ees ult erieurement par dautres syst` emes (Lenat 1975). PUP6 impl ementait, pour peut etre la premi` ere fois, lid ee de r esolution par une communaut e de sp ecialistes, appel es etres (beings), travaillant ` a la synth` ese dun sp ecialiste sp ecique, conceptformation, capable de r esoudre une t ache par lui-m eme. Lutilisateur, via un sp ecialiste, r epond aux questions qui ne peuvent etre r esolues par lassembl ee. Ces sp ecialistes ne sont pas des KS, car ils sont perp etuellement modi es pendant lex ecution. Chaque sp ecialiste est compos e dun ensemble de couples attribut/valeur, semblables ` a ceux des frames et peut demander des informations aux autres sp ecialistes sans avoir ` a les conna tre. Lenat na en fait r ealis e quune maquette du syst` eme g en eral Beings, lapplication Pup6 se bornant ` a etre capable de reconna tre une arche en utilisant le programme, ` a l epoque particuli` erement fameux, de P.H. Winston. Les travaux sur les acteurs de Hewitt, bien quinitialement eectu es au sein de lintelligence articielle, ont, comme beaucoup dautres, rejoint celui de la programmation. Au d ebut des ann ees 70, apr` es avoir con cu un syst` eme, Planner, d edi e` a la d emonstration de th eor` emes, il se rendit compte que la probl ematique du contr ole etait centrale pour comprendre le d eroulement dun raisonnement. Plut ot que de consid erer ce contr ole comme une suite s equentielle de choix, il sorienta vers une vision distribu ee en consid erant les structures de contr oles comme des patterns denvois de messages (Hewitt 1977) entre entit es actives appel ees acteurs. Il eut ainsi lid ee de consid erer la r ealisation dun probl` eme comme lactivit e dune assembl ee dexperts, en consid erant le d eveloppement dun raisonnement comme une confrontation de points de vue. De ces id ees naquirent toute une s erie de langages dacteurs, caract eris es par leurs mode de communication par messages asynchrones bueris es et par le passage de la continuation du calcul. Ces langages sont encore consid er es comme de bonnes bases pour la r ealisation de plates-formes multi-agents. Mais linuence de ces travaux s etendit bien au-del` a de lIAD. Par le d eveloppement des acteurs comme mod` eles ` a part enti` ere de programmation parall` ele et par ses travaux de visionnaire dans le domaine des syst` emes ouverts (open systems) (Hewitt 1991), C. Hewitt est lune des gures les plus brillantes du paysage de linformatique en g en eral et de lintelligence articielle en particulier.
1.3.2
L age classique
Dans la phase qui suivit, que lon pourrait qualier d age classique de lIAD, trois syst` emes eurent un impact consid erable. Le premier, DVMT (Distributed Vehicule Monitoring Test), qui fut d evelopp e par l equipe de V. Lesser ` a luniversit e du Massachusetts (Lesser et Corkill 1983), est un grand projet de recherche portant sur la perception et la reconnaissance de situations distribu ees. Des capteurs envoient
30
des informations ` a des agents de traitements, impl ement es sous la forme de tableaux noirs. Le probl` eme consiste pour les agents ` a avoir une vue coh erente dune situation de trac routier et donc ` a identier et ` a suivre des v ehicules ` a partir des informations redondantes, contradictoires et bruit ees qui leur arrive des capteurs. Lint er et de cette etude porte en particulier sur le fait davoir examin e un grand nombre de congurations entre les capteurs et les agents de traitement, davoir analys e la probl ematique de la planication multi-agent ` a laide de plans partiels, davoir d eni les bases des m ecanismes de coop eration et de n egociation et dune mani` ere g en erale davoir concouru ` a la d enition de lIAD en tant que domaine d etude ` a part enti` ere. Cependant, si DVMT inuen ca consid erablement la communaut e am ericaine, il eut moins de retentissements en Europe que Mace. Autre monstre sacr e de lIAD, le syst` eme Mace d evelopp e par L. Gasser eut un impact consid erable sur lensemble des recherches ult erieures en IAD (Gasser et al. 1987). Pour la premi` ere fois, il etait expliqu e clairement comment r ealiser un syst` eme dIAD et quels etaient les composants essentiels dune plate-forme g en erique pour le d eveloppement de syst` emes dIAD. L. Gasser, en reliant ses travaux ` a ceux de Hewitt sur les acteurs, montrait non seulement quil etait possible de r ealiser un SMA ` a partir de la notion denvoi de message, mais aussi que cela n etait pas susant, une organisation sociale ne pouvant se ramener ` a un simple m ecanisme de communication. Il faut en plus introduire des notions telles que les repr esentations dautrui et faire en sorte quun agent puisse raisonner sur ses comp etences et ses croyances. En outre, on doit distinguer, comme le faisait Mace, la comp etence eective, le savoir-faire directement applicable, de la connaissance quun agent peut avoir de sa propre comp etence. On peut dire que, peu ou prou, toutes les plates-formes actuelles de d eveloppement de SMA sont des descendants directs ou indirects de Mace. Au d ebut des ann ees 80, R. Smith d eveloppa un mod` ele de distribution des t aches et des probl` emes appel e r eseau contractuel (contract net) dont le retentissement est encore actuel. Il sagit dun syst` eme opportuniste dallocation de t aches fond e sur le protocole des appels dore des march es publics. En permettant ` a chaque agent d etre un d ecideur ou un ex ecutant et en diusant les demandes le long dun r eseau, R. Smith r esolvait le probl` eme de la r epartition des t aches sans utiliser une zone de m emoire commune, comme dans les tableaux noirs, et sans avoir la n ecessit e de bien identier le receveur du message comme dans les syst` emes ` a base dacteurs (Smith 1979). Aujourdhui le r eseau contractuel fait partie du paysage traditionnel des etudes en IAD; son fonctionnement est examin e au chapitre 7. A c ot e de ces travaux, on peut citer aussi ceux r ealis es par Steeb, Cammarata et F. Hayes-Roth au sein de la Rand Corporation (Cammarata et al. 1983), o` u ils etudi` erent limpact de nombreuses organisations sur la r esolution de probl` emes de coop eration, tels que le contr ole de trac a erien, et surtout la foisonnante moisson de formalisation de laction coop erative au travers des notions dintentions de croyances et dengagements dont nous reparlerons plus loin. On trouvera une tr` es bonne pr esentation des recherches men ees en IAD jusquen 1988 dans (Bond et Gasser 1988).
31
1.3.3
Linuence de la vie articielle
Lhistoire de la vie articielle est ` a la fois plus longue et plus r ecente. Plus longue parce que ses soubassements plongent dans lhistoire de linformatique elle-m eme avec les travaux de Von Neumann sur les automates cellulaires, ceux de Grey Walter sur les robots r eactifs, ceux de Warren McCulloch sur la r ealisation de neurones formels ou ceux de Ross Ashby sur lhom eostasie (Dupuy 1994), mais plus r ecente parce que sa constitution en tant que champ d etude ne date que de quelques ann ees. On ne d ecrira donc que bri` evement quelques points cl es de la vie articielle, laissant au lecteur le soin de se r ef erer aux ouvrages suivants (Langton 1988; Langton et al. 1990; Langton 1994) (Varela et Bourgine 1992) (Meyer et Guillot 1989; Meyer et al. 1993; Meyer et Wilson 1991), sil d esire en savoir plus long sur la question, et ` a (Heudin 1994) pour une bonne introduction du domaine. La probl ematique de la vie articielle a et e lanc ee par C. Langton, comme l etude de la vie telle quelle pourrait etre, et non de la vie telle quelle est, cette derni` ere etant r eserv ee ` a la biologie classique. Il sagit donc dabstraire les principes sousjacents ` a lorganisation du vivant et de les impl ementer dans un ordinateur an de pouvoir les etudier et les tester (Langton et al. 1990). Aujourdhui, le domaine de la vie articielle s etend le long de plusieurs grands th` emes de recherches, dont on peut distinguer les principaux: Lanalyse de la dynamique des ph enom` enes complexes ` a laide dautomates cellulaires ou d equations di erentielles non lin eaires, men ees par Wolfram, Kaufman et Langton. L evolution de populations par utilisation dalgorithmes g en etiques, dont les principaux leaders sont Wilson et Koza. La r ealisation danimats, cest-` a-dire de cr eatures autonomes capables dagir et donc de survivre dans un environnement non enti` erement sp eci e, dont les repr esentants principaux sont Brooks, Meyer et Husbands. L etude des ph enom` enes collectifs ` a partir de linteraction dun ensemble dagents r eactifs, avec essentiellement Steels, Deneubourg, Mataric, Ferber et Drogoul. Ce quatri` eme th` eme est evidemment le plus en rapport avec la probl ematique k en etique et nous le traiterons abondamment dans cet ouvrage, mais de mani` ere g en erale tous les autres contiennent des travaux dans lesquels lid ee de collectif est pr esente. La vie articielle, contrairement aux travaux dIAD qui suivent le paradigme cognitiviste et consid` erent que lintelligence proc` ede dune manipulation de symbole, met laccent sur le comportement, sur lautonomie et surtout sur la probl ematique de la viabilit e. J.P. Aubin, P. Bourgine et F. Varela ont d evelopp e lid ee de viabilit e. Pour quun etre reste vivant, il faut que son etat demeure ` a lint erieur de son domaine de viabilit e K au cours de son evolution, cest-` a-dire, si f est sa fonction d evolution, que: s(t + 1) = f (s(t)) avec s, f (s) K
32
Ceci ne peut se faire que pour lune des deux raisons suivantes: soit lentit e vivante ne se trouve jamais dans une conguration pour laquelle elle na pas et e cr e ee, soit il lui est possible de sadapter au fur et ` a mesure de son evolution et donc denvisager des comportements viables en devinant l etat suivant, cest-` a-dire en etant capable davoir un comportement dabduction (Varela et Bourgine 1992). A la di erence des approches cognitives, caract eristiques de lIAD, celles des tenants de la vie articielle sont minimalistes et sub-cognitives: elles tentent de comprendre les m ecanismes de coop eration et de coordination dactions ` a partir de crit` eres ne faisant pas intervenir de symboles. Les agents ont un comportement de type stimulus/r eponse, leurs communications seectuent ` a laide de simples propagations de signaux sans signication intrins` eque et ils ne disposent g en eralement pas de repr esentations. Ceci montre quil etait possible dobtenir un comportement collectif complexe sans que les agents eux-m emes ne disposent de facult es evolu ees. Les travaux dans ce domaine ont ainsi donn e une nouvelle vigueur ` a la notion de syst` eme multi-agent en permettant un dialogue stimulant entre les tenants cognitivistes et les partisans du r eactif, et ainsi de mieux comprendre ce qui revient de droit ` a chacun. Nous en ferons bien evidemment part dans cet ouvrage, ces deux approches etant trait ees sur un m eme pied. A ces deux domaines forts, il faut ajouter linuence des syst` emes distribu es pour tout ce qui touche aux communications et ` a la mod elisation du parall elisme et a celle de lautomatisme et de la robotique, pour tout ce qui a trait ` ` a la r egulation des actions dans un univers r eel.
1.3.4
Les temps modernes
Il est dicile de faire un panorama exact des tendances actuelles sur les SMA, car ce domaine se d eploie dans plusieurs directions avec des options fondamentales parfois tr` es di erentes. Il ne sagit pas ici de donner une liste exhaustive des recherches men ees sur ce sujet, mais seulement de pr esenter quelques points de rep` ere an de comprendre les tendances actuelles de la recherche ainsi que certaines ecoles de pens ee qui tendent ` a se dessiner. L ecole IAD am ericaine. L ecole dominante en IAD est certainement l ecole am ericaine group ee toujours autour de Victor Lesser (Lesser et Corkill 1983) et de ses disciples, Ed Durfee (Durfee et al. 1987) et Susan Conry (Conry et al. 1988) notamment. A c ot e de ce groupe, quelques francs tireurs particuli` erement importants sont L. Gasser (Gasser 1991), M. Huhns (Huhns 1987), et K. Sycara (Sycara 1989). Plut ot tourn ee vers lanalyse de SMA cognitifs compos es dun petit nombre dagents ` a tendance tr` es Intelligence Articielle, l ecole IAD am ericaine a tr` es peu de contacts avec les chercheurs sp ecialis es en agents r eactifs et notamment avec la communaut e vie articielle, pourtant particuli` erement f econde dans ce pays (cf. ci-dessus). En revanche, des relations tr` es fortes se sont nou ees entre lIAD et les sciences de lorganisation, sous limpulsion notamment de K. Sycara et L. Gasser. On trouvera une tr` es bonne pr esentation de cette ecole de pens ee (et aussi dautres approches) et des recherches men ees dans ce domaine en IAD jusquen 1988 dans (Bond et Gasser 1988).
33
La formalisation logique. A c ot e de cette ecole IAD, il existe une ecole tr` es importante consacr ee essentiellement ` a la formalisation des agents rationnels autonomes, que ces agents travaillent collectivement ou non. Ces recherches suivent le courant th eorique initi e par Cohen et Levesque qui formalise les intentions et les croyances ` a partir de logiques modales. Les tenants les plus importants actuellement, Y. Shoham (Shoham 1993) et George (Rao et George 1992), ajoutent ` a leur d emarche th eorique une dimension pratique qui les conduit ` a r ealiser des syst` emes qui impl ementent leurs th eories. En Europe, cette ecole est particuli` erement illustr ee par J. Galliers (Galliers 1988), E. Werner (Werner 1989), C. Castelfranchi et R. Conte (Conte et al. 1991), Wooldridge et Jennings (Wooldridge et Jennings 1994), Coelho (Corr ea et Coelho 1993), et, au Qu ebec, par Chaib-Draa (Chaib-Draa 1989). Actes de langages et SMA. Les liens qui existent entre les actes de langages (cf. chap. 6) et les communications dans les syst` emes multi-agents sont tr` es etroits. Si des travaux th eoriques concernant les liens entre ces deux domaines se poursuivent (Moulin et Cloutier 1994) (Brassac 1992), une tendance tr` es nette consiste ` a d enir eectivement des protocoles de communication ` a laide de la th eorie des actes de langage, comme le montre lensemble des travaux portant sur le standard KQML (Finin et al. 1994). IAD et th eorie des jeux. Uniquement repr esent ee par J. Rosenschein (Zlotkin et Rosenschein 1992) et des chercheurs issus de son enseignement tels que Zlotkin, cette ecole, essentiellement isra elienne, analyse les SMA ` a partir dun point de vue de th eorie des jeux. Une synth` ese de leur approche peut etre trouv ee dans (Rosenschein et Zlotkin 1994). R eseaux de Petri et SMA. Essentiellement fran caise, ce courant de recherche vise ` utiliser les outils th a eoriques des syst` emes distribu es et en particulier les r eseaux de Petri, pour lanalyse, la conception et la validation des SMA. Elle comprend notamment les equipes de P. Estraillier (Bachat` ene et Estraillier 1992), J. Ferber (Ferber et Magnin 1994), S. Pinson et S. Haddad (El Fallah-Seghrouchni et Haddad 1994) et P. Azema (Vernadat et Azemat 1993). Langages dacteurs et SMA. Dans la m eme veine que les recherches pr ec edentes, ce courant, particuli` erement illustr e au Japon par M. Tokoro (Maruichi et al. 1990), T. Ishida (Ishida 1989) et A. Yonezawa (Yonezawa 1990), ` a la R eunion par S. Giroux (Giroux 1993) (initialement au Qu ebec) et en France par P. Carle et J. Ferber (Ferber et al. 1993), tente dint egrer les recherches portant sur le parall elisme en g en eral et les langages dacteurs en particulier, avec les concepts et les objectifs des SMA. Agents r eactifs. De R. Brooks ` a L. Steels, en passant par J.-L. Deneubourg, J. Ferber et A. Drogoul, Y. Demazeau, P. Bourgine et J.A. Meyer, cette approche sinscrit dans la mouvance vie articielle d evelopp ee ci-dessus. Les activit es scientiques sont regroup ees au sein de conf erences et workshops internationaux: le DAI Workshop aux Etats-Unis, Maamaw (Modeling Autonomous Agents in Multi-Agent Worlds) en Europe et Macc (Multi-Agent and Concurrent Computing) au Japon. Ces trois conf erences se sont r eunies pour cr eer une conf erence internationale, ICMAS (International Conference on Multi-Agent Systems) dont la
34
premi` ere session sest tenue en juin 1995 ` a San Francisco. Les pr esentations des Maamaw ont et e int egralement publi ees dans des ouvrages facilement disponibles (Castelfranchi et Werner 1994; Demazeau et M uller 1990; Demazeau et M uller 1991; Werner et Demazeau 1992), ce qui nest pas totalement le cas des conf erences am ericaines dont deux seulement ont fait lobjet de publications (Gasser et Huhns 1989; Huhns 1987). Il existe aussi des conf erences nationales dans la plupart des pays europ eens. Dans les pays francophones, une conf erence, intitul ee Journ ees Francophones sur lIntelligence Articielle Distribu ee et les syst` emes Multi-Agents (JFIADSMA), regroupe chaque ann ee la communaut e scientique de langue fran caise, ce qui inclut, outre la France, la Belgique, la Suisse, le Qu ebec, des chercheurs individuels provenant dEurope occidentale (Italie, Espagne, Portugal), de pays dAfrique de lOuest (S en egal, Cameroun, B enin, Mali, C ote dIvoire) et dEurope de lEst (Pologne notamment) parlant fran cais.
1.4
Domaines dapplication
Les domaines dapplication des syst` emes multi-agents sont particuli` erement riches. Nous en citerons seulement les principales directions, toute recherche dexhaustivit e aboutissant ` a une scl erose a priori dun domaine de recherche en pleine evolution. On peut consid erer quil existe cinq grandes cat egories dapplications des syst` emes multi-agents: la r esolution de probl` emes au sens large, la robotique distribu ee, la simulation multi-agent, la construction de mondes hypoth etiques et la conception k en etique de programmes (g. 1.5).
1.4.1
La r esolution de probl` emes
La r esolution de probl` emes au sens large concerne en fait toutes les situations dans lesquelles des agents logiciels accomplissent des t aches utiles aux etres humains. Cette cat egorie soppose aux applications de robotique distribu ee en ce sens que les agents sont purement informatiques et nont pas de structure physique r eelle. La terminologie anglo-saxonne en appelant ces techniques distributed problem solving reste assez ambigu e. Il existe en eet deux mani` eres de traduire cette appellation: soit par r esolution distribu ee de probl` emes, soit par r esolution de probl` emes distribu es. Ces deux traductions se rapportent ` a deux grandes classes dapplications. Dans la premi` ere, lexpertise globale est distribu ee parmi lensemble des agents, chacun nayant quune comp etence restreinte par rapport ` a lensemble du probl` eme ` a r esoudre. On appelle aussi cette forme coop eration de sp ecialistes. Dans la seconde au contraire, cest le probl` eme qui est lui-m eme distribu e, les agents pouvant avoir des comp etences semblables. Enn, il existe une autre classe de probl` emes dans laquelle on utilise des agents en interaction pour r esoudre des probl` emes classiques, et je les pr esenterai sous lappellation de r esolution par coordination (cf. chap. 8).
1.4. DOMAINES DAPPLICATION

Rsolution distribue de problmes Rsolution de problmes distribus Techniques distribues de rsolution de problmes Simulation multi-agent
35
Rsolution de problmes
Systme multi-agent
Construction de mondes hypothtiques
Robotique distribue
Conception kntique de programmes
Figure 1.5: Une classication des di erents types dapplication des syst` emes multiagents La r esolution distribu ee de probl` emes Toutes les applications relevant de la r esolution distribu ee de probl` emes supposent quil est possible deectuer une t ache complexe en faisant appel ` a un ensemble de sp ecialistes disposant de comp etences compl ementaires et donc, lorsque cest lexpertise ou le mode de r esolution qui sont distribu es, sans que le domaine le soit. Lorsque lexpertise est en eet si vaste et complexe quelle ne peut appartenir qu` a une seule personne, il faut faire appel ` a plusieurs sp ecialistes qui doivent travailler ensemble ` a la poursuite dun objectif commun. Comme nous lavons dit pr ec edemment, la construction dune voiture de course n ecessite plusieurs sp ecialistes: lun conna tra mieux les moteurs, un autre soccupera du choix et du test des pneumatiques, un troisi` eme sint eressera au ch assis et aux suspensions, un quatri` eme saura trouver de bons carburants et un dernier se chargera de la gestion de la course et de la d enition des interfaces avec le pilote. Ces sp ecialistes coop` erent entre eux pour r esoudre un probl` eme g en eral, tel quun diagnostic m edical, la conception dun produit industriel (Ienecker et Ferber 1992), lacquisition de connaissances, le diagnostic de r eseaux (Jennings et al. 1995), la reconnaissance de formes (Demazeau et al. 1994), la compr ehension de
36
langage naturel (Sabah 1990), le syst` eme de contr ole et de surveillance dun r eseau de t el ecommunications (Weihmayer et Brandau 1990), etc. Le syst` eme Condor con cu par C. Ienecker ` a la soci et e T el em ecanique pour laide ` a la conception de produits electrom ecaniques constitue un bon exemple de SMA tourn e vers la coop eration de sp ecialistes (Ienecker 1992). Des sp ecialistes en cahier des charges, en conception, en assemblage, en mat eriaux, en planication, en marketing et bien dautres, qui prennent part ` a la conception dun produit industriel, sont repr esent es sous la forme dun ensemble dagents dans le syst` eme Condor. Ces derniers, qui sont bien entendu cognitifs, sont con cus autour dune architecture de tableau noir (cf. chap. 3) comprenant trois tableaux: celui des connaissances du domaine, celui du contr ole et celui des communications. Tous ces agents poss` edent leur propre expertise et interviennent ` a di erents moments lors de la r ealisation du produit. La particularit e de ce syst` eme r eside dans son organisation g en erale qui prend elle-m eme la forme dune architecture de tableau noir. On y repr esente ainsi des groupes de travail, tels que le groupe qualication, le groupe d ecisionnel ou le groupe bureau d etude, qui travaillent ` a partir de leurs propres protocoles dautomatisation de ux dinformation, ` a la mani` ere des syst` emes de work ow actuels. Le syst` eme Kbs-Ship, issu dun programme Esprit, est con cu comme une plateforme int egrant plusieurs experts travaillant en commun. Ce syst` eme est d edi e` a la surveillance et ` a la maintenance des equipements dun navire de commerce. Il int` egre plusieurs syst` emes experts distincts (pilotage, chargement du fret, maintenance des equipements electroniques, diagnostic de pannes, etc.) qui travaillent au sein dune architecture multi-agent, sous le contr ole dun expert charg e de la gestion des communications via un r eseau Ethernet et de la r esolution des conits entre agents. Dans le cadre du contr ole de processus industriel, le syst` eme Flavors Paint Shop, utilis e pour peindre des camions, montre assez simplement lint er et des syst` emes multi-agents pour lindustrie (Morley 1993) (lint er et de ce syst` eme a et e d ecrit dans (Parunak 1993)) et leur comp etitivit e par rapport ` a des approches centralis ees. A la sortie dune cha ne de montage, des camions doivent etre peints dune couleur particuli` ere en fonction des d esirs des clients. Le nombre des postes de peinture est inf erieur au nombre des couleurs disponibles. De ce fait, il est parfois n ecessaire de changer la couleur dun poste de peinture, ce qui consomme ` a la fois beaucoup de temps et de peinture. Initialement, la gestion de loptimisation des couleurs utilisait un programme classique dont la mise au point et la maintenance co utaient tr` es cher. De plus, il n ecessitait une planication rigoureuse et avait du mal ` a prendre en compte les pannes eventuelles des postes. Le syst` eme a alors et e r e ecrit sous la forme dun syst` eme multi-agent dans lequel chaque poste de peinture a et e repr esent e sous la forme dun agent. Lorsquun poste est libre, il accepte un nouveau camion ` a partir dune le dattente contenant une centaine de camions en attente d etre peints. Cette s election seectue ` a partir des trois r` egles suivantes: 1. Prendre le premier camion de la le qui r eclame la m eme couleur que celle qui est disponible actuellement.
37
2. Sil ny a pas de camion de cette couleur, prendre le camion le plus prioritaire et aecter au poste la couleur du camion. 3. Sil ny a pas de camion prioritaire, prendre le camion suivant dans la le et aecter au poste la couleur du camion. Malgr e la simplicit e de ce syst` eme, il a r eduit de moiti e les op erations de changement de peinture par rapport au syst` eme centralis e, ce qui a conduit ` a une economie de plus dun million de dollar par an. De plus, le syst` eme peut prendre en compte sans probl` eme les pannes de postes de peinture. R esolution distribu ee de probl` emes distribu es Si le domaine est lui aussi distribu e, on parle alors de r esolution (distribu ee) de probl` emes distribu es. Il sagit essentiellement dapplications telles que lanalyse, lidentication, le diagnostic et la commande de syst` emes physiquement r epartis, pour lesquelles il est dicile davoir une vision totalement centralis ee. Par exemple, sil sagit de contr oler un r eseau de communication ou d energie, le domaine, qui est repr esent e par le r eseau lui-m eme, constitue un syst` eme r eparti quil sagit de surveiller, voire de superviser, en d ecentralisant au maximum les t aches de surveillance au sein des nuds du r eseau. La perception distribu ee, telle quelle a et e initi ee par DVMT, ou la surveillance de r eseaux d energie ou de t el ecommunications dans lesquels la supervision est r epartie sur chacun des nuds constitue un bon exemple de r esolution de probl` emes distribu es. Le syst` eme Ideal, con cu par lOnera et Alcatel-Alsthom, est un exemple caract eristique de SMA d edi e` a la surveillance et au diagnostic dun r eseau de t el ecommunication. Il comprend trois sortes dagents: des superviseurs, charg es de localiser et de diagnostiquer des pannes, des agents de suivi, qui doivent maintenir la coh erence entre l etat r eel du r eseau et la vision quen ont les agents, et des op erateurs de maintenance charg es dex ecuter des tests et de r eparer des el ements du r eseau. Les agents, qui pr esentent une architecture de tableau noir (chap. 3), comportent cinq modules: un module de communication qui g` ere les protocoles de communication, un module expert qui contient les connaissances concernant la supervision du r eseau, un module de coop eration qui g` ere les tables daccointances (chap. 5), la repr esentation de soi et des mod` eles de dialogue (chap. 6), un module pour linterface graphique permettant ` a un utilisateur de suivre le fonctionnement de lagent et dintervenir si besoin, et un module de contr ole qui g` ere lensemble des activit es de lagent. R esolution par coordination Les agents peuvent aussi servir dune mani` ere beaucoup plus el ementaire ` a r esoudre des probl` emes au sens classique du terme, cest-` a-dire ` a tenter de trouver une solution a quelque chose dont l ` enonc e est bien pos e et dont lensemble des informations est enti` erement disponible, comme, par exemple, trouver une aectation de t aches pour une machine-outil ou d enir un emploi du temps pour un coll` ege, donner la suite des actions ` a accomplir pour sortir dun labyrinthe ou pour faire partir une
38
fus ee, assembler des cubes ou des composants m ecaniques, r esoudre un casse-t ete ou d emontrer un th eor` eme. Dans ce cas, le domaine nest pas distribu e et lexpertise ne lest pas non plus. Et pourtant lapproche multi-agent peut apporter un mode de raisonnement nouveau en d ecomposant le probl` eme de mani` ere totalement di erente. Par exemple, sil sagit dempiler des cubes ou dassembler des pi` eces m ecaniques, on peut consid erer que les cubes ou les pi` eces sont des agents qui doivent satisfaire des buts pr ecis donn es par le plan impos e par le concepteur et que les liaisons sont des contraintes que les agents doivent respecter. Cest exactement le type de probl` eme que sait r esoudre de mani` ere tr` es ecace l eco-r esolution d ecrite au chapitre 8. De m eme, sil sagit de r esoudre un probl` eme ` a base de contraintes, on peut consid erer, comme lont fait K. Ghedira (Ghedira 1993) et K. Sycara (Liu et Sycara 1993), que les t aches et les ressources sont des agents qui tentent de satisfaire leurs objectifs propres: une t ache d esire etre plac ee et une ressource souhaite etre utilis ee au mieux, sans avoir trop ni trop peu de travail. En adoptant une technique semblable ` a celle de l eco-r esolution, et en lui associant le principe du recuit simul e, K. Ghedira est capable de r esoudre des probl` emes de contraintes tr` es rapidement et en limitant les modications lors dun changement de donn ee. Ces approches abordent les probl` emes ` a traiter avec un tel changement dattitude que m eme des sp ecialistes en r esolution de probl` emes sont initialement totalement d erout es par elles. De plus, elles sont souvent peu formalis ees et il est donc dicile de conna tre a priori leur validit e: sont-elles d ecidables, semi-d ecidables, incompl` etes? M eme si lon dispose de r esultats partiels, dans bien des cas, il est dicile de trancher. Leur avantage fondamental r eside dans leur rapidit e dex ecution. Fond ees sur des consid erations tr` es di erentes des approches classiques par exploration despace d etat, elles utilisent beaucoup mieux certaines caract eristiques structurelles des probl` emes, ce qui les rend souvent tr` es ecaces. Elles ont et e utilis ees notamment dans le domaine de la robotique distribu ee (cf. section 1.4.4). Nous d evelopperons certaines de ces techniques au chapitre 8.
1.4.2
La simulation multi-agent
La simulation est une branche tr` es active de linformatique qui consiste ` a analyser les propri et es de mod` eles th eoriques du monde environnant. La physique, la chimie, la biologie, l ecologie, la g eographie et les sciences sociales notamment font un grand usage des simulations pour essayer dexpliquer et de pr evoir les ph enom` enes naturels. Pour cela, les chercheurs de ces di erentes disciplines construisent des mod` eles de la r ealit e, puis testent leur validit e en les faisant tourner sur des ordinateurs. G en eralement, ces mod` eles sont donn es sous la forme de relations math ematiques entre des variables repr esentant des grandeurs physiques mesurables dans la r ealit e. Les mod` eles les plus utilis es sont les equations di erentielles, les matrices de transitions, etc. Elles reposent sur la d enition dune relation de cause ` a eet entre des variables dentr ees et des variables de sorties. Lun des exemples fameux, utilis e en ecologie, est celui du mod` ele math ematique de dynamique des populations introduit par Lotka et Volterra (Volterra 1926) qui exprime le taux de croissance de populations de proies
1.4. DOMAINES DAPPLICATION et de pr edateurs occupant un m eme territoire. dN1 = r 1 N1 P N 1 N 2 dt dN2 = aP N1 N2 d2 N2 dt
39
o` u P est le coecient de pr edation, N1 et N2 sont les eectifs des proies et des pr edateurs, a est lecacit e avec laquelle les pr edateurs convertissent la nourriture en descendants, r1 d etermine la f econdit e des proies et d2 le taux de mortalit e des pr edateurs. Bien quayant permis de nombreuses avanc ees sur le plan th eorique et pratique (Pav e 1994), ces mod` eles et les techniques de simulation num erique associ ees pr esentent n eanmoins certains probl` emes, dont on peut donner ici les principaux: Etanch eit e du niveau danalyse. Les mod` eles math ematiques relient des param` etres qui se situent tous au m eme niveau danalyse. Par exemple, il nest pas possible de relier la taille dun eectif aux prises de d ecision eectu ees par les individus. On peut dire que ces niveaux danalyse sont etanches puisquil nest pas possible de faire correspondre des comportements eectu es au niveau micro ` a des variables globales mesur ees au niveau macro. Complexit e et r ealisme des param` etres. Pour etre utilisables et correspondre a ` la r ealit e, ces equations comportent souvent un grand nombre de param` etres diciles ` a estimer et manquent surtout de r ealisme. Par exemple, dans le mod` ele Proie-Pr edateur de l equation pr ec edente, le coecient a qui indique lecacit e avec laquelle les pr edateurs transforment la nourriture en descendance semble bien appauvrissant quand on pense ` a lensemble des comportements complexes (hi erarchies et dominances, strat egies sexuelles, utilisation du territoire et construction dabris) qui peuvent avoir un impact direct sur leur f econdit e. Dicult e` a mod eliser laction. La critique peut- etre majeure que lon pourrait faire aux mod` eles math ematiques actuels porte sur leur dicult e (voire leur impossibilit e) ` a prendre en compte les actions des individus, et donc les modications eectives de lenvironnement qui d ecoulent de leur comportement. La plupart des ph enom` enes collectifs (que lon pense par exemple aux ph enom` enes boursiers) sont le r esultat dun ensemble de prises de d ecisions individuelles qui tiennent compte des comportements des autres acteurs du syst` eme. En ne consid erant les actions que par leurs cons equences mesurables au niveau global ou par leur probabilit e dapparition, il sav` ere dicile dexpliquer les ph enom` enes emergents dus ` a linteraction de ces comportements individuels, en particulier tous ceux portant sur la coop eration intra et inter-sp ecique. La carence qualitative. Par leur nature m eme, les simulations num eriques ne peuvent consid erer que des param` etres quantitatifs et apparaissent d esarm ees devant la multitude dinformations qualitatives recueillies par les chercheurs de terrain, les naturalistes notamment. Devant lintrication des jeux de r egulation qui s etablissent entre les habitudes comportementales des esp` eces et leurs
40
` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS m ecanismes de reproduction et doccupation de lespace, les mod` eles math ematiques abandonnent et laissent ainsi de nombreux domaines de recherche dans lincapacit e de b en ecier des avantages que procure la simulation.
Les syst` emes multi-agents apportent une solution radicalement nouvelle au concept m eme de mod` ele et de simulation dans les sciences de lenvironnement, en orant la possibilit e de repr esenter directement les individus, leurs comportements et leurs interactions. La simulation multi-agent est fond ee sur lid ee quil est possible de repr esenter sous forme informatique le comportement des entit es qui agissent dans le monde et quil est ainsi possible de repr esenter un ph enom` ene comme le fruit des interactions dun ensemble dagents disposant de leur propre autonomie op eratoire. Par exemple, dans un mod` ele multi-agent de population, on repr esentera directement les individus sous la forme dagents et la quantit e dindividus dune esp` ece donn ee sera le r esultat des confrontations (coop eration, lutte, reproduction) des comportements de tous les individus repr esent es dans le syst` eme. Lint er et de ces simulations est de pouvoir consid erer aussi bien des param` etres quantitatifs (cest-` a-dire des param` etres num eriques) que qualitatifs (des comportements individuels faisant eventuellement appel ` a des raisonnements strat egiques). On utilise aussi parfois le terme de mod` eles micro-analytiques (Collins et Jeerson 1991) ou de simulation individu-centr ee pour bien indiquer que les repr esentations se situent au niveau de lindividu, ces derniers interagissant aussi bien entre eux quavec lenvironnement simul e. Ce sont des constructions de micro-mondes articiels, dont il est possible de contr oler toutes les caract eristiques et de reproduire des s eries dexp erimentations comme sil sagissait de situations de laboratoire. On se trouve donc en pr esence dune mod elisation analogique, semblable aux maquettes de format r eduit utilis ees en a eronautique ou en construction navale, la di erence essentielle provenant du fait que le mod` ele r eduit est exprim e sous la forme dune entit e informatique et non dune structure physique. De ce fait, lutilisateur dun tel simulateur a un r ole actif. Il emploie un syst` eme multi-agent comme sil sagissait dun laboratoire miniature, d epla cant des individus, changeant leur comportement et modiant les conditions environnementales. Chaque agent est evidemment marqu e comme pourrait l etre un etre naturel, mais ce marquage est evidemment plus facile, puisque lindividu peut etre suivi ` a tout moment dans son evolution et avec le degr e de nesse d esir e. On exploite alors les capacit es des ordinateurs pour traiter les donn ees obtenues, les agr eger et les exploiter ` a laide de techniques statistiques an de v erier les hypoth` eses emises. Ainsi, ` a la di erence des approches classiques, la simulation multi-agent ne se r eduit pas ` a limpl ementation dun mod` ele puis ` a lanalyse de la r eponse de ce mod` ele en fonction des param` etres dentr ees, mais participe au processus de recherche de mod` eles. Les principales qualit es des mod elisations multi-agents sont leur capacit e dint egration et leur exibilit e. En eet, il est possible dint egrer dans la m eme mod elisation des variables quantitatives, des equations di erentielles, et des comportements fond es sur des r` egles symboliques. Il est aussi tr` es facile dint egrer des modications, chaque enrichissement du mod` ele etant r ealis e par ladjonction de r` egles comportementales qui agissent au niveau de lindividu. De plus, les individus etant toujours distingu es
41
les uns des autres, il est possible dajouter de nouveaux types dagents disposant de leur propre mod` ele de comportement, qui viennent interagir avec les agents d ej` a d enis. Par exemple, dans une mod elisation foresti` ere, on peut introduire de nouvelles esp` eces animales ou v eg etales et analyser leurs interactions avec celles d ej` a mod elis ees. Enn, les syst` emes multi-agents permettent la mod elisation de situations complexes dont les structures globales emergent des interactions entre individus, cesta-dire de faire surgir des structures du niveau macro ` ` a partir de mod elisations du niveau micro, brisant ainsi la barri` ere des niveaux, si criante dans les mod elisation classiques. Nous pr esentons ici deux syst` emes caract eristiques de simulation multiagent qui sont le r esultat de collaboration entre informaticiens et chercheurs ecologues. Il existe bien evidemment un grand nombre dautres applications de simulation comportementale, mais ces deux-ci, plus le syst` eme Manta d evelopp e au chapitre 7, donnent un aper cu des domaines vari es dans lesquels les SMA peuvent etre employ es. SIMDELTA Le simulateur SimDelta a et e utilis e pour synth etiser les connaissances dun ensemble de sp ecialistes (halieutes, ecologistes, p edologues, biologistes, anthropologues, etc.) ayant travaill e pendant plusieurs ann ees sur l etude du syst` eme de p eche du delta central du Niger au Mali. Il sagissait de pouvoir mod eliser des informations tant quantitatives (concernant l evolution des crues du Niger par exemple) que qualitatives (telles que les techniques de p eches). Ce simulateur, r ealis e par F. Bousquet et C. Cambier (Cambier et al. 1992), permet de simuler en m eme temps la dynamique de population des poissons, en tenant compte des nombreux facteurs biologiques et topologiques qui peuvent aecter son evolution, et la prise de d ecision des p echeurs. Les agents sont ici les bancs de poissons et les p echeurs. La technique employ ee met en pr esence trois types dagents (g. 1.6): les biotopes qui repr esentent des portions denvironnement, les poissons qui ont un comportement plut ot r eactif et les p echeurs qui se comportent comme des agents cognitifs. Lenvironnement est constitu e de biotopes dont les connexions peuvent etre modi ees dynamiquement lorsque le niveau de leau change. Pour chaque biotope, une fonction de ressource indique la quantit e de nourriture disponible pour une population de poissons en fonction du temps. Les bancs de poissons sont des agents qui repr esentent des ensembles de poissons et dont les param` etres (taille et nombre dufs, processus de migration, r egime, etc.) caract erisent leur strat egie dadaptation. Chaque p echeur est repr esent e sous la forme dun agent cognitif et son comportement est d ecrit par un syst` eme ` a base de connaissances compos e dune base de donn ees qui contient ses croyances et sa m emoire de p echeur et dun syst` eme de r` egles qui repr esente sa strat egie cognitive pour exploiter les biotopes. Deux s eries dexp erimentations ont et e r ealis ees. La premi` ere a port e sur l etude de la dynamique de population des poissons en fonction dun eort de p eche de plus en plus grand. La simulation de la dynamique de ces poissons est fond ee
42
Biotopes Fishermen
schools of fish
Village
Figure 1.6: Le monde articiel de SimDelta sur le comportement des poissons deau douce sah eliens et, en particulier, sur les connaissances des biologistes concernant la reproduction, la croissance, la migration et la mortalit e de ces poissons. Cette simulation a permis de reproduire la courbe en trois phases caract eristiques de l evolution dun syst` eme de p eche limit e et surtout de faire appara tre des variations portant sur la composition sp ecique et la taille des poissons. La seconde a eu pour objet de mod eliser des p echeurs qui prennent des d ecisions et agissent sur la r eserve renouvelable. Cette mod elisation a montr e limportance du m ecanisme de d ecision sur la dynamique des poissons. Des strat egies fond ees sur des crit` eres de rationalit e economique sont, notamment, globalement moins performantes ` a terme que celles qui int egrent des r` egles dacc` es ` a lespace (Bousquet et al. 1993; Cambier 1994). SIMPOP Si les entit es mobiles peuvent naturellement proter des avantages des simulations multi-agents, il en va de m eme pour les agents xes. Lexemple du syst` eme SimPop en constitue une bonne illustration (Bura et al. 1993). Il sagit ici de mod eliser la dynamique de l evolution dun syst` eme de villes et, plus particuli` erement, la gen` ese, le d eveloppement et la concentration des fonctions urbaines ` a di erents niveaux durant une longue p eriode de temps (environ 2000 ans). Lenvironnement est repr esent e par un ensemble de places de tailles et de formes vari ees (essentiellement des carr es et des hexagones). Elles sont caract eris ees par leur nature (plaines, montagnes, mer, marais), leurs ressources naturelles (agriculture, p eche, minerai) ainsi que par des el ements divers tels que la pr esence dune voie de communication (rivi` ere, route, etc.). Les ressources correspondent au potentiel quune population peut exploiter, la productivit e d ependant de facteurs tels que les possibilit es techniques ou lactivit e dun peuplement voisin. Chaque place comporte un agent peuplement que lon appelle commun ement une ville (en fait ces villes peuvent aller dun simple hameau ` a une grande m etropole). Les villes sont caract eris ees par la taille de leur population, leur richesse economique et les fonctions quelles poss` edent (agriculture, economie, industrie, ad-
43
ministration). Le comportement dune ville est donn e par la somme des comportements de ses habitants, ces derniers etant repr esent es par des fonctions economiques correspondant aux principaux groupes sociaux. Par exemple, les hameaux voient la majeure partie de leur population associ ee ` a la fonction agricole. Les villes sont donc les principaux agents du syst` eme et, du fait quelles ne bougent pas, les interactions seectuent essentiellement par des transferts de biens, de monnaies, de services et dhabitants qui sexpriment sous la forme de m ecanismes dores et de demandes entre villes. De ce fait, certaines villes tendent ` a grossir et de nombreux ph enom` enes locaux viennent renforcer les di erences apparaissant entre elles de mani` ere ` a former ce que lon nomme une hi erarchie de villes, portant sur leur taille et leur richesse, comme le montre la gure 1.7.
Figure 1.7: L etat dun peuplement apr` es mille ann ees simul ees dans SimPop
1.4.3
La construction de mondes synth etiques
Bien quil ne sagisse pas dapplications ` a proprement parler, puisquelles ne permettent pas de r esoudre un probl` eme concret, nutilisent pas dagents physiques et ne simulent aucun monde r eel, la construction de mondes synth etiques tient une large part dans les recherches portant sur les syst` emes multi-agents parce quelle permet danalyser certains m ecanismes dinteraction de mani` ere plus ne que ne pourrait le faire une v eritable application. Par exemple, lanalyse de protocole de coop eration ou la compr ehension de linuence du comportement sur la r egulation dune soci et e sont souvent plus parlant sur des mondes virtuels que sur des applications imm ediatement rentables. De plus, du fait de la diversit e des syst` emes multi-agents et du nombre des domaines dans lesquels ils peuvent etre utilis es, il sav` ere tr` es important de d enir des situations montrant les probl` emes trait es et les dicult es rencontr ees par une
44
approche k en etique. Certaines de ces situations sont des situations-jouets, cest-` adire des situations d epouill ees ` a lextr eme de toutes les asp erit es de la r ealit e mais qui, du fait de leur aust erit e, orent les conditions id eales ` a une bonne compr ehension des m ecanismes mis en uvre. Dautres correspondent ` a des situations r eelles, m eme si leur expression est souvent simpli ee pour que lon puisse saisir les enjeux et lemploi des syst` emes multi-agents dans des applications grandeur nature. Un exemple caract eristique: la poursuite Lun des exemples les plus connus est celui de la poursuite (que lon appelle aussi le probl` eme des proies et des pr edateurs6 ). Ce probl` eme vient dun jeu lui-m eme tir e dune histoire, Octobre Rouge, dans laquelle un sous-marin sovi etique doit essayer d echapper ` a des torpilleurs am ericains. Evidemment, la situation qui est analys ee dans le jeu est un peu plus simple. Les agents, cest-` a-dire les proies (sous-marins ou herbivores) comme les pr edateurs (torpilleurs ou carnassiers), se d eplacent sur un espace repr esent e sous la forme dune grille. Le but de ce jeu est de parvenir ` a ce que les pr edateurs capturent les proies en lentourant, comme le montre la gure 1.8.
Prdateurs
Proie capture par des prdateurs Proies libres
Figure 1.8: Le jeu de la poursuite: les pr edateurs doivent entourer des proies pour les capturer. On pose les hypoth` eses suivantes: 1. Les dimensions de lenvironnement (cest-` a-dire de la grille) sont nies. 2. Les pr edateurs et les proies se d eplacent ` a des vitesses xes, et g en eralement la m eme.
6 Il existe un probl` eme du m eme nom en ecologie des populations, comme nous lavons vu ` a la section pr ec edente. Mais bien que son appellation soit semblable et que, dans les deux cas, il sagisse de pr edateurs et de proies, la probl ematique est totalement di erente: en ecologie th eorique, on sint eresse ` a l evolution de la d emographie des agents, alors que, dans la version de la poursuite, on etudie les m ecanismes de coop eration des pr edateurs pour entourer les proies.
45
3. Les proies evoluent de mani` ere al eatoire en eectuant ce que lon appelle un mouvement brownien, cest-` a-dire qu` a chaque moment elles choisissent al eatoirement une position. 4. Les pr edateurs peuvent utiliser les coins et les bords pour bloquer une proie. 5. Les pr edateurs ont une perception limit ee du monde qui les entoure, ce qui signie quils ne peuvent voir la proie que si elle se trouve dans des cases ` a une distance inf erieure ` a leur champ de perception. Evidemment, il existe de nombreuses variantes ` a ce jeu: il sut de rendre le monde non born e, par exemple en repliant les bords de mani` ere quun agent sortant du damier a ` lest rentre par louest, ou de faire en sorte que les vitesses de d eplacement entre les proies et les pr edateurs soient di erentes, ou encore que la proie se dirige de mani` ere moins al eatoire, en cherchant ` a rejoindre une case d etermin ee par exemple, pour que les strat egies des pr edateurs soient totalement modi ees. Enn, le nombre respectif des proies et des pr edateurs et evidemment la qualit e de perception des pr edateurs sont aussi des param` etres importants pour le succ` es de la capture (Benda et al. 1986) (Gasser et al. 1989) (Bouron 1992). Le probl` eme consiste ` a coordonner les actions des pr edateurs an quils puissent entourer les proies le plus rapidement possible, une proie entour ee etant consid er ee comme morte. Lint er et de ce probl` eme est d etre ` a la fois tr` es bien d eni et de laisser cependant ouvert tous les modes de coop eration possibles. En eet, de nombreuses strat egies peuvent etre mises en uvre et cet exemple illustre bien les di erences dapproches qui existent entre syst` emes cognitifs et syst` emes r eactifs. Les strat egies cognitives proc` edent g en eralement dune analyse descendante en d enissant les di erentes fonctions que doit remplir le syst` eme: d etection des proies, elaboration des equipes de chasse, allocation des r oles (prendre la proie par le nord, louest, lest ou le sud), r eorganisation des equipes si le nombre des chasseurs est mal distribu e (deux equipes de trois chasseurs par exemple), etc. Toutes ces fonctions sont bien identi ees et impl ement ees dans les agents sous forme de comportements adapt es n ecessitant un syst` eme de communication permettant le dialogue et la prise de d ecision distribu ee. On suppose alors que les agents ont des buts et quils agissent rationnellement par rapport ` a ces buts en d esignant, si n ecessaire, un agent leader pour organiser la r epartition du travail et coordonner les actions comme nous le verrons au chapitre 8. En revanche, la r ealisation dun syst` eme r eactif pour r esoudre ce probl` eme proc` ede dune tout autre d emarche. On supposera que les proies emettent un signal dont lintensit e d ecro t proportionnellement ` a la distance et qui joue le r ole dattracteur pour les chasseurs. De ce fait, plus un agent se trouve pr` es dune proie, plus le signal re cu sera fort. Les chasseurs se trouvant pr` es dune proie P auront donc plus tendance ` a se diriger vers P que vers toute autre proie dont ils pourraient percevoir les emanations et dont ils sont plus eloign es. De plus, an que les chasseurs ne se retrouvent pas tous au m eme endroit et quils entourent donc eectivement la proie, on fait emettre par chaque chasseur un signal servant de r epulseur pour les autres chasseurs. Ainsi, chaque chasseur est ` a la fois attir e par les proies et
46
(faiblement) repouss e par les autres chasseurs (g. 1.9). La capture des proies emerge ainsi de la combinaison de ces di erentes r eactions aux stimuli envoy es par les proies et les chasseurs. On peut dire que, si la coop eration induite par les agents cognitifs est
Rpulsion des autres chasseurs Comportement rsultant
Chasseur A
Proie Attirance vers la proie Chasseur B
Figure 1.9: Les chasseurs sont attir es par les proies et repouss es par les autres chasseurs. de type intentionnelle, puisquils disposent de capacit es de dialogue et dallocation de t aches explicites, les agents r eactifs introduisent un autre type de coop eration que lon pourra qualier de r eactive et qui nappara t que comme un simple eet de bord du comportement individualiste de chaque agent. Lanimat: moiti e robot, moiti e animal Ces mondes hypoth etiques reposent souvent sur deux m etaphores quasiment interchangeables: celle du robot et celle de lanimal. Dans la premi` ere on suppose que les agents sont des robots qui accomplissent des actions dans un monde virtuel. Mais ces robots nont aucune r ealit e physique et lappellation robot est donc trompeuse. De plus, on leur donne la possibilit e daccomplir des actions, telles que de se reproduire avec dautres robots, que lon serait bien en mal de demander ` a de v eritables etres de m etal et d electronique! Dun autre c ot e, appeler ces cr eatures des animaux nest pas plus r ealiste que dappeler humain un personnage de jeu daventure, puisque ces pr etendus animaux nont que des rapports lointains avec ceux que lon rencontre dans la nature. Cest pourquoi, J.-A. Meyer et S. Wilson ont invent e le terme animat par contraction des mots animal et artefact (Meyer et Guillot 1989), pour bien indiquer ` a la fois que ces agents descendent m etaphoriquement des animaux et quils nont quune existence virtuelle, celle que veut bien leur donner limagination de leur concepteur (et de ses coll` egues) au regard des traces visuelles de quelques processus informatiques. Il existe donc un grand nombre de situations qui font intervenir un ensemble danimats dans un environnement repr esent e g en eralement sous la forme dun ensemble de cases et qui nont comme tout objectif que de satisfaire leurs besoins: prendre de la nourriture, boire, se reproduire, comme le montre la gure 1.10 qui repr esente un instantan e typique dun tel monde. Nous reverrons, en particulier dans le chapitre 5, des exemples de comportements danimats explorant leur espace
47
an den tirer les el ements nutritifs n ecessaires ` a leur survie tout en evitant les pr edateurs.
Espce A
Espce B
eau
Prdateur Nourriture
Figure 1.10: Un monde caract eristique de lapproche animat: un ensemble dindividus desp` eces di erentes cherchent ` a survivre
Des robots explorateurs ` a lassaut de Mars Lorsque la m etaphore met plus laccent sur le robot que sur lanimal, il est possible dinventer toute une gamme de comportements qui di` erent de la survie dun animal, tel que laction de rapporter du minerai. Au d ebut tout commen ca par une application r eelle: lorsque la NASA d ecida dinvestir dans la r ealisation dun projet spatial conduisant ` a lexploration de la plan` ete Mars, il fut clair que cette exploration ne pourrait se faire dans un premier temps qu` a laide de robots. Mais du fait de la distance de Mars ` a la Terre, les 7 liaisons radios durent au moins 3 ` a 5 mn , un d elai bien trop grand pour pouvoir t el ecommander les robots depuis la Terre. Les robots devaient donc etre autonomes, cest-` a-dire capables de se d ebrouiller par leurs propres moyens dans un univers peut- etre hostile. La NASA d ecida alors de nancer des recherches permettant de concevoir et de construire de tels robots autonomes. Cest l` a que Brooks entra en jeu et lan ca lid ee dune invasion de Mars par un grand nombre de petits robots tr` es simples dans leurs capacit es et bon march es (Brooks 1990). Dans ce cas, la coordination des actions entre les robots devient cruciale et peut donc etre envisag ee selon une perspective multi-agent. J.-L. Deneubourg (Deneubourg et al. 1986) et L. Steels (Steels 1989) avanc` erent alors, chacun de son c ot e, lid ee quil etait possible de r ealiser ecacement des t aches avec des robots dont le comportement ressemblait ` a celui des fourmis. En les simulant dabord, puis en construisant de v eritables robots, ils montr` erent quil etait eectivement possible de r ealiser des groupes de robots r eactifs dont le comportement etait calqu e sur celui du comportement animal. La collaboration entre L. Steels et D. McFarland, ethologue de renom (McFarland 1990), comme celle que nous avons entreprise
7 Cela ne prend en compte que le trajet dans un sens. Pour r eagir ` a une situation p erilleuse depuis la Terre, il faut au moins le double de temps entre le moment o` u la situation est per cue par le robot et celui o` u il re coit ses commandes.
48
A. Drogoul et moi-m eme avec des biologistes sp ecialistes du comportement animal (Drogoul et al. 1992), est caract eristique de cette fusion qui peut exister entre les points de vue des sp ecialistes des sciences de la vie et ceux des sciences de larticiel, informatique et robotique notamment. Depuis, de nombreux laboratoires relevant de ces deux derni` eres sciences ont relev e le d e et semploient ` a la d enition de soci et es de robots autonomes ecaces dans des conditions semblables ` a celles dune exploration martienne. Le probl` eme de la r ecup eration d echantillons de minerai a particuli` erement capt e lattention des chercheurs en d enissant une situation-jouet imm ediatement compr ehensible et sur laquelle il est possible de comparer di erentes organisations coop eratives. Le probl` eme g en eral peut etre d ecrit ainsi: on suppose quil existe une base xe (ou tr` es peu mobile) ` a partir de laquelle plusieurs robots mobiles doivent explorer un espace a priori inconnu (on suppose quil nexiste pas de cartes du terrain) pour trouver, r ecup erer et transporter le minerai d ecouvert jusqu` a la base. Le probl` eme consiste donc ` a d enir la structure et le comportement des robots ainsi que lorganisation de la soci et e de mani` ere ` a obtenir les meilleurs r esultats possibles, en termes de temps mis par lensemble des robots pour r ecup erer le plus de minerai possible (g. 1.11).
Lgende Lgende Robots
Base Minerai
Figure 1.11: Les robots explorateurs Pour r esoudre un tel probl` eme, il faut passer par les etapes suivantes: 1. D enir les di erents types de robot ` a construire: doit-on supposer quils sont tous identiques ou au contraire quils sont sp ecialis es? Il est peut- etre pr ef erable de d enir des robots sp ecialistes en transport de minerai dont les capacit es de d etection sont plus faibles mais qui peuvent transporter des charges plus importantes que des robots g en eralistes. 2. D eterminer les capacit es cognitives des agents: peuvent-ils m emoriser le terrain quils traversent et construire des cartes? Sont-ils purement r eactifs et capables
49
uniquement de perceptions locales ou peuvent-ils communiquer entre eux par messages sur de longues distances? 3. D ecrire les structures collectives de travail: travaillent-ils en groupe ou de mani` ere solitaire? Les equipes sont-elles xes ou dynamiques? Peuvent-ils recruter des aides et, si oui, comment, ou doivent-ils sen remettre uniquement a leurs ressources propres? ` 4. D enir les m ecanismes de coop eration et les protocoles dinteractions permettant ` a ces agents daccomplir collectivement leur travail en r eduisant le nombre de conits potentiels. Par exemple, que se passe-t-il lorsque deux robots d ecouvrent en m eme temps un tas de minerai? 5. Etre capable d evaluer les choix retenus et de les comparer ` a dautres organisations. Lint er et de cette application est donc de soulever, dans le cadre dune situation simple a ` appr ehender et ` a evaluer, lensemble des probl` emes que lon peut se poser lors de la r ealisation dun SMA. Nous reprendrons cet exemple au chapitre 3 en analysant quelques organisations possibles pour r esoudre ce probl` eme. A c ot e des probl` emes de poursuite et dexploration, il existe de nombreuses situations qui mettent en uvre ces animaux-robots que sont les animats et qui peuvent servir de point de d epart pour lanalyse et la compr ehension des syst` emes multi-agents. Nous en citerons trois: les robots d em enageurs, latelier de production, les robots constructeurs. Tous ces exemples, hormis le dernier, rel` event pour linstant plus de la science ction que dune r ealit e industrielle, mais ils orent lavantage de pr esenter des situations relativement complexes qui mettent en jeu des probl` emes de coop eration et de coordination dactions. Des robots d em enageurs On suppose que vous vouliez d em enager de votre maison et aller vous installer ailleurs. Vous avez ` a votre disposition une equipe de robots capables de porter des meubles et de transporter des objets fragiles, ainsi quun certain nombre de v ehicules autonomes. Comment programmer ces robots de mani` ere que votre d em enagement seectue dans de bonnes conditions, que vos d em enageurs ne laissent pas tomber votre piano ` a queue et prot` egent bien vos vases de chine? Le type de comportement requis est tr` es semblable ` a celui de lexploration de Mars. Il sy ajoute des contraintes sur la nature des objets (certains meubles peuvent etre trop lourds pour quun robot puisse les porter seul) et sur la topologie de lenvironnement (les couloirs sont etroits et il est parfois impossible ` a deux robots de se croiser; la conguration des pi` eces des maisons et celle du r eseau routier peuvent etre complexes, etc.), m eme si le probl` eme de lexploration du terrain peut etre supprim e en supposant connues la localisation et la topographie des deux maisons.
50
Un atelier de production autonome Construire une cellule autonome de production est un exemple particuli` erement int eressant pour tester des hypoth` eses concernant les di erentes mani` eres de concevoir des syst` emes multi-agents. Le probl` eme peut etre d eni ainsi: supposons que lon doive construire des produits manufactur es, A1 , .., Ak ` a partir dun ensemble de robots machines M1 , .., Mn et de mati` ere premi` ere, P1 , .., Pj et que lon dispose dun ensemble de robots transporteurs T1 , .., Tm pour porter les produits interm ediaires dune machine ` a une autre. Sachant que la mati` ere premi` ere arrive ` a un bout de latelier de production et que les produits manufactur es partent dun autre bout, comment organiser cette unit e de production, de mani` ere quelle puisse r eagir ` a toute modication de la demande? M eme si ce probl` eme ressemble beaucoup ` a un probl` eme de recherche op erationnelle, il en di` ere n eanmoins par le fait que lon ne demande pas seulement de pr evoir la meilleure mani` ere darranger les di erentes unit es de latelier, mais aussi de d enir les programmes de chacune de ces unit es de fa con quelles puissent travailler ensemble et donc coordonnent leur travail en r eagissant ` a des pannes eventuelles tout en p enalisant le moins possible lensemble de la production.
1.4.4
La robotique distribu ee
La robotique distribu ee porte sur la r ealisation non pas dun seul robot, mais dun ensemble de robots qui coop` erent pour accomplir une mission. A la di erence du domaine dapplication pr ec edent (la construction de mondes hypoth etiques), la robotique distribu ee utilise des agents concrets qui se d eplacent dans un environnement r eel. Le domaine de la robotique distribu ee recouvre en fait deux types de robotique bien distincte, la robotique cellulaire et la robotique mobile:
B, bouge-toi B A, bouge-toi A C, bouge-toi
But Tte
Figure 1.12: Un bras manipulateur consid er e comme un syst` eme multi-agents 1. La robotique cellulaire sint eresse ` a la constitution modulaire de robots. Dans ce cadre, un robot sera consid er e comme un syst` eme multi-agent et chacun de ses composants sera regard e comme un agent. La r ealisation dun mouvement sera alors le r esultat de la coordination dun ensemble dagents. Des techniques semblables
51
` celle que nous verrons avec l a eco-r esolution (chap. 8) permettent daccomplir des gestes complexes avec un minimum de calcul. A partir did ees semblables, les recherches men ees parall` element par l equipe de J. Perram au Danemark (Overgaard et al. 1994) et de D. Duhaut en France (Regnier et Duhaut 1995) ont produit des mod` eles de d eplacement de bras manipulateur dans lesquels chaque el ement du bras est consid er e comme un agent, les articulations d ecrivant des contraintes pour lensemble des mouvements acceptables (g. 1.12). Lagent de t ete cherche ` a satisfaire le but qui lui est donn e, par exemple souder deux pi` eces entre elles ou prendre un objet sur une table. Sil peut le faire lui-m eme, il eectue le d eplacement et le syst` eme sarr ete. Sinon, il entra ne lagent qui le suit (lagent A sur la gure) en lui donnant des buts pour que lagent de t ete se rapproche de son objectif. Le processus se r ep` ete r ecursivement, chaque agent cherchant ` a satisfaire les buts quon lui propose en transmettant ses desiderata ` a lagent suivant. Les calculs sexpriment simplement et sex ecutent tr` es rapidement. De plus, a ` lencontre des techniques classiques utilis ees en robotique, laugmentation du nombre de degr es de libert es (cest-` a-dire du nombre darticulations) am eliore la vitesse de r esolution du probl` eme. Ce type de mod` ele est susamment souple pour etre eectivement utilis e dans des environnements industriels. Le syst` eme de J. Perram, par exemple, est utilis e pour programmer des robots soudeurs au chantier naval dOdense. 2. La robotique mobile fait intervenir au moins deux robots qui doivent coordonner leurs d eplacements et coop erer ` a laccomplissement de t aches telles que nettoyer le plancher, surveiller des b atiments, intervenir pour secourir des personnes, r eparer des canalisations ou explorer des espaces lointains ou dangereux. Pour linstant, tous ces projets sont plut ot ` a l etat de recherches, mais de nombreuses contributions ont et e avanc ees dans ce domaine, notamment par M. Mataric (Mataric 1994), L. Steels (Steels 1994) et J.-L. Deneubourg (Beckers et al. 1994). La coordination de v ehicules, quil sagisse davions, de voitures ou de bateaux, fait aussi partie de ce domaine dapplication. Plusieurs v ehicules, en se d epla cant, risquent de se g ener mutuellement. Par exemple, deux avions qui evoluent dans des secteurs voisins, ou deux voitures qui sont sur la m eme route, doivent faire attention de ne pas se rencontrer. Les risques de collision sont dautant plus importants que les v ehicules sont proches les uns des autres et que leurs trajectoires les am` enent ` a se croiser. Il sagit alors de coordonner leurs mouvements de mani` ere ` a ce que chacun dentre eux puisse aller l` a o` u il d esire aller sans entrer en collision (g. 1.13). Dans une variante de ce probl` eme, on demande ` a certains v ehicules davancer en formation ` a la mani` ere des oies sauvages ou des escadrilles a eriennes. Le probl` eme est alors plus complexe puisquil sagit de faire evoluer ensemble des v ehicules de mani` ere que la structure de la formation reste constante. Les premi` eres tentatives de r esolution ont et e eectu ees dans le domaine du contr ole de trac a erien et mirent en uvre des agents cognitifs (Cammarata et al. 1983; Chaib-Draa 1989) mais avec des r esultats tr` es limit es. Les approches plus actuelles (Zeghal et al. 1993) utilisent des agents r eactifs et des m ecanismes de champs de force, comme nous le pr esenterons au chapitre 8.
52
Figure 1.13: Le probl` eme de l evitement de collision. Comment ces avions peuvent-ils se croiser sans se t elescoper tout en conservant leurs objectifs initiaux?
1.4.5
La conception k en etique de programmes
La k en etique a aussi pour ambition de pr oner un nouveau mode de conception de syst` emes informatiques, cherchant ` a d epasser les techniques informatiques actuelles pour r ealiser des logiciels distribu es fonctionnant avec une grande souplesse et une grande adaptabilit e ` a leur environnement. Lobjectif alors de ce que jappellerai la conception k en etique de logiciels est de donner naissance ` a des syst` emes informatiques capables d evoluer par interaction, adaptation et reproduction dagents relativement autonomes et fonctionnant dans des univers physiquement distribu es. L etendue de grands r eseaux informatiques tels que Internet, lextension des r eseaux locaux et lint egration des donn ees aussi di erentes que du texte, de limage, du son ou de lanimation laissent encore de c ot e la question cruciale de lutilisation de cette information de mani` ere automatique. Il devient en eet tr` es dicile de sy retrouver dans cette gigantesque toile daraign ee (la bien nomm ee World Wide Web), dans laquelle tout nud est un serveur dinformations et de ressources fonctionnant de mani` ere relativement autonome par rapport aux autres. Nul ne g` ere globalement lensemble qui est dailleurs ing erable , mais chaque nud est responsable de ses propres informations et des liens quil peut avoir avec dautres nuds. La k en etique propose une nouvelle technologie de construction de logiciels ` a partir des concepts dagent et dinteraction. Par exemple, chaque unit e de programme peut prendre la forme dun agent qui dispose de sa propre autonomie, de ses propres objectifs et vit sur le r eseau comme un animal dans un ecosyst` eme naturel, coop` ere ou n egocie avec dautres unit es de m eme nature. Les utilisateurs deviendraient alors des bergers donnant des consignes ` a leur troupeau dagents pour recueillir ensuite les fruits de leur labeur. Cette m etaphore, qui donne encore une impression de science-ction, a toutes ses chances de devenir bient ot une r ealit e, car les technologies de base n ecessaires ` a cette evolution de la programmation sont d ej` a pr esentes. On verra donc appara tre bient ot ces agents, dabord simples et encore peu autonomes puis bient ot plus elabor es et complexes, aider les utilisateurs dans leurs t aches quotidiennes en r ecup erant des donn ees, en g erant les rendez-vous et les t aches communes, en orant et en demandant des services ` a dautres agents, le tout de mani` ere int egr ee et naturelle. La notion dagent circulant dans un r eseau ne constitue quune des facettes,
53
peut- etre la plus visible, de la conception k en etique de programmes. Lautre aspect concerne larchitecture des programmes eux-m emes. Si, pour linstant, la conception par objets semble etre la panac ee universelle de l ecriture de programmes (Booch 1991; Ferber 1990), elle nest en fait quune etape vers une conception encore plus modulaire de l ecriture de logiciels. Chaque composant dun programme pourra etre envisag e comme un agent disposant de ses propres comp etences et de ses propres buts, lensemble cherchant ` a r epondre aux besoins de lutilisateur et aux extensions nouvelles qui apparaissent continuellement.
Figure 1.14: Larchitecture g en erale du syst` eme Archon Lun des syst` emes les plus connus en Europe pour avoir tent e de donner un cadre op erationnel ` a ces id ees est le syst` eme Archon (Architecture for Cooperating Heterogeneous On-line Systems), issu dun projet Esprit qui propose une architecture g en erale de SMA pour int egrer di erents programmes devant coop erer ensemble (Burg et Arlabosse 1994; Wittig 1992). Larchitecture g en erale du syst` eme est pr esent ee gure 1.14. La t ete dun agent comprend un gestionnaire de communications de haut niveau qui sappuie sur les recommandations de la norme OSI, un mod` ele des comp etences des autres et de soi sous la forme dun gestionnaire daccointances (cf. chap. 5) et un syst` eme de planication et de coordination. Un moniteur fait linterface et la gestion entre la t ete et le corps dun agent compos e dun ensemble de t aches, chacune correspondant ` a un module logiciel pr eexistant. Il est ainsi possible dencapsuler des programmes existants ` a laide dagents ARCHON et faire ainsi coop erer des programmes h et erog` enes, initialement non coop erants. Le syst` eme Archon a et e test e dans de nombreuses congurations industrielles, en particulier dans des domaines de surveillance de r eseaux de distribution d energie
54
electrique et dans celui de lanalyse de pannes dans un acc el erateur de particules. Il sagit maintenant dun logiciel v eritablement industriel commercialis e par la soci et e fran caise Framentec. Louvrage (Jennings 1994) donne une pr esentation d etaill ee du fonctionnement de ce syst` eme8 .
1.5
Les grands th` emes de la k en etique
Concevoir un syst` eme multi-agent, cest avant tout analyser et r esoudre un tr` es grand nombre de probl` emes. La conception dun syst` eme anti-collision, par exemple, soul` eve un grand nombre de questions qui recouvrent des domaines tr` es divers. Comment les agents se repr esentent-ils leur environnement et les autres agents? Comment coop` erent-ils? Peuvent-ils assurer leur viabilit e? Sont-ils capables dadapter leur comportement ` a des modications du milieu dans lequel ils evoluent? Sontils pris dans des rapports hi erarchiques ou dautorit es entre eux? Ces di erentes questions peuvent etre class ees en cinq cat egories principales: la probl ematique de laction, lagent et sa relation au monde, linteraction, ladaptation, la r ealisation et limpl ementation de SMA.
1.5.1
La probl ematique de laction
La probl ematique de laction est souvent peu consid er ee, car il sagit dune question subtile qui donne limpression d etre ais ee ` a r esoudre alors quelle pose de nombreuses dicult es. La question peut se poser ainsi: comment plusieurs agents peuvent-ils agir simultan ement et quelles sont les cons equences de leurs actions dans lenvironnement? La r eponse a lair evidente: l etat de lenvironnement est la cons equence directe de la combinaison des actions des agents. Mais comment ces actions se combinent-elles? Comment se fait-il quun agent qui d ecide davancer et qui est bloqu e par un obstacle ne puisse pas bouger? Comment deux agents peuvent-ils entrer en collision ou au contraire s eviter? Comment les contraintes environnementales se combinent-elles ` a laction des agents? Toutes ces questions soul` event dimportants probl` emes th eoriques qui doivent etre soulev es d` es que lon met en uvre des agents situ es, ou d` es que lon cherche ` a faire de la planication multi-agent.
1.5.2
Lindividu et sa relation au monde
Les di erents th` emes relatifs ` a lindividu portent, dune part, sur son architecture et son organisation interne et, dautre part, sur lensemble des moyens quil met en uvre pour assurer sa viabilit e et satisfaire ses objectifs. Il sagit evidemment de th` emes essentiels car la r ealisation dun syst` eme multi-agent passe n ecessairement pas la description de larchitecture des agents et des fonctionnalit es dont ils disposent pour accomplir leurs t aches.
8 Bien que le syst` eme pr esent e dans cet ouvrage ait pour nom Grate, il sagit bel et bien de la description dArchon.
` ETIQUE 1.5. LES GRANDS THEMES DE LA KEN
55
Cest ` a ce niveau que lon sint eresse aux el ements cognitifs dont lorganisation permet la constitution dun comportement adapt e. Sauf pour des agents r eactifs simples, un agent se trouve ` a un certain moment dans un certain etat mental qui r esulte de sa propre histoire, de sa perception du monde et de ses interactions avec le monde et avec les autres agents. Ces etats mentaux sont souvent tr` es complexes et font intervenir un grand nombre d el ements dont la combinaison explique le comportement dun agent de lint erieur. Ces el ements cognitifs, que nous appellerons cognitons au chapitre 5, sont aux etats mentaux des agents ce que les corpuscules el ementaires sont aux corps physiques: des composants de base dont la combinaison permet dexprimer l etat mental dun agent et dont les lois dinteraction servent ` a d ecrire l evolution future du comportement dun agent et de ses etats mentaux ult erieurs. Ils r egissent lensemble des aspects de lactivit e int erieure dun agent: perception et ex ecution daction, croyances, d esirs et tendances, intentions, m ethodes et plans, etc. Cest a ` ce niveau aussi que sont d ecrits les engagements. En sengageant ` a accomplir une action aupr` es dun tiers, lagent contraint lensemble des actions quil peut r ealiser et donne la possibilit e au tiers de planier son propre comportement en diminuant son incertitude sur lensemble des etats futurs.
1.5.3
Linteraction
Pour un agent, interagir avec un autre constitue ` a la fois la source de sa puissance et lorigine de ses probl` emes. Cest en eet parce quils coop` erent que des agents peuvent accomplir plus que la somme de leurs actions, mais cest aussi ` a cause de leur multitude quils doivent coordonner leurs actions et r esoudre des conits. Pour un agent, lautre est ` a la fois le pire et la meilleure des choses. Traiter le probl` eme de linteraction, cest se donner les moyens non seulement de d ecrire les m ecanismes el ementaires permettant aux agents dinteragir, mais aussi danalyser et de concevoir les di erentes formes dinteraction que des agents peuvent pratiquer pour accomplir leurs t aches et satisfaire leurs buts. Tout dabord, les agents doivent etre capables, par le biais de la communication, de transmettre des informations, mais surtout dinduire chez lautre un comportement sp ecique. Communiquer est donc une forme daction particuli` ere qui, au lieu de sappliquer a la transformation de lenvironnement, tend ` ` a une modication de l etat mental du destinataire. Par exemple, demander ` a un autre dex ecuter une t ache tend a ` provoquer chez lautre une intention daccomplir cette t ache et constitue donc une mani` ere de satisfaire un objectif sans r ealiser la t ache soi-m eme. Les di erentes formes dinteraction que nous etudierons plus particuli` erement sont la collaboration (cf. chap. 7) et la coordination dactions (cf. chap. 8). La premi` ere sint eresse ` a la mani` ere de r epartir le travail entre plusieurs agents, quil sagisse de techniques centralis ees ou distribu ees, et la seconde analyse la mani` ere dont les actions des di erents agents doivent etre organis ees dans le temps et lespace de mani` ere ` a r ealiser les objectifs. Enn, lorsque des conits apparaissent, il est important de pouvoir en limiter les eets. Les techniques de n egociation servent ainsi a satisfaire les parties impliqu ` ees en etablissant des compromis ou en d epassant la
56
nature du conit. La coop eration est la forme g en erale dinteraction la plus etudi ee dans les syst` emes multi-agents (Ferber 1995). Nous verrons en particulier que, contrairement au sens commun qui consid` ere que la coop eration demeure lapanage des etres capables davoir un projet explicite, donc des agents cognitifs, il est possible de parler de coop eration de mani` ere aussi bien r eactive que cognitive si lon envisage uniquement le r esultat des actions et non les intentions des agents. De mani` ere simpli ee, le probl` eme de la coop eration peut se ramener ` a d eterminer qui fait quoi, quand, o` u, avec quels moyens, de quelle mani` ere et avec qui, cest-` a-dire en fait ` a r esoudre les di erents sous-probl` emes que constituent la collaboration par r epartition de t aches, la coordination dactions et la r esolution de conits. Nous r esumerons cela par la formule: Coop eration = collaboration + coordination dactions + r esolution de conits
1.5.4
Ladaptation
On peut voir le probl` eme de ladaptation structurelle et comportementale dun ensemble dagents de deux mani` eres di erentes: soit comme une caract eristique individuelle des agents, et on parle alors dapprentissage, soit comme un processus collectif mettant en jeu des m ecanismes reproductifs, ce que lon appelle evolution. Bien que les deux approches soient g en eralement trait ees de mani` ere distincte, il est possible de les consid erer globalement comme un processus ` a la fois individuel et collectif dadaptation. Ces probl ematiques font lobjet de recherches importantes dans les domaines de lintelligence articielle distribu ee et de la vie articielle, le premier se consacrant plus naturellement ` a lapprentissage, par des techniques symboliques ou neuronales, et le second ` a l evolution, en utilisant des algorithmes g en etiques. Bien que ladaptation soit un th` eme particuli` erement important dans l etude des syst` emes multi-agents (Lestel et al. 1994), nous ne le d evelopperons que tr` es partiellement, en ne labordant quau travers des comportements collectifs, ladaptation r esultant alors de m ecanismes de r egulation issus des actions conjointes dun ensemble dagents (cf. chap. 7).
1.5.5
La r ealisation et limpl ementation des SMA
Enn, il reste un grand domaine qui ne sera pas trait e dans cet ouvrage et qui porte sur limpl ementation des syst` emes multi-agents. Ce th` eme, qui englobe ` a la fois les langages dimpl ementation (les langages de type L1 de la section 1.2.5), les architectures informatiques, les plates-formes de d eveloppement et les aspects m ethodologiques de la mise en uvre de ces syst` emes, est si vaste quil m eriterait un volume ` a lui tout seul. Il ne sera queeur e ici.
` 1.6. DOMAINES VOISINS DES SYSTEMES MULTI-AGENTS
57
1.6
Domaines voisins des syst` emes multi-agents
La k en etique voisine avec un grand nombre dautres domaines scientiques sans pour cela etre confondue avec eux. Il sagit essentiellement de lintelligence articielle, de la syst emique, des syst` emes distribu es et de la robotique.
1.6.1
Lintelligence articielle
A la di erence de lintelligence articielle et de la plupart des programmes informatiques, les syst` emes multi-agents ne sont plus des penseurs renferm es sur leur propre raisonnement qui ignorent leur environnement, mais constituent de v eritables soci et es d etres qui doivent se mouvoir, planier, communiquer, percevoir, agir et r eagir et, dune mani` ere g en erale, vivre et travailler dans un milieu dans lequel ils entrent parfois en conit avec dautres agents. Par rapport ` a lIA, la k en etique fait appel ` a un grand nombre de concepts nouveaux pour le domaine, tels que la coop eration, la coordination daction, la n egociation, les conits, la satisfaction, lengagement, laction et la r eaction ou la perception. Ces concepts ne trouvent plus uniquement leur origine dans la psychologie cognitive individuelle, comme pour lIA classique, mais egalement dans la sociologie et dans la biologie, voire dans l ethologie. Alors que pour lIA, cest lindividu qui est intelligent, pour la k en etique, cest lorganisation qui pr esente des fonctionnalit es que lon peut caract eriser comme intelligente. Concevoir des etres intelligents nest pas un but pour la k en etique, puisquelle sint eresse essentiellement aux relations entre individus et aux cons equences de leurs interactions, mais seulement un moyen pour d evelopper des organisations articielles plus performantes en r eduisant la redondance et en augmentant lecacit e des actions eectu ees. Dans le domaine des syst` emes multi-agents, une blague consiste dailleurs ` a dire que lIA est une forme dIAD mono-agent! Bien quil sagisse dune boutade, cela exprime bien que lIA et la k en etique travaillent ` a des niveaux d etude di erents, un peu comme la psychologie et la sociologie.
1.6.2
La syst emique
Le courant syst emique, bien quayant toujours consid er e limportance des interactions pour la d enition des syst` emes, a plus mis laccent sur lanalyse des ux entrants et sortants que sur laspect comportemental des interactions. En eet, la partie proprement op eratoire de lanalyse syst emique, depuis ses d ebuts avec V. Bertalany (Bertalany 1968), N. Wiener (Wiener 1948) et surtout J.W. Forrester (Forrester 1980), sest surtout consacr ee ` a lanalyse des syst` emes biologiques, economiques et articiels sous langle de transfert de ux de mati` eres, d energies, dinformations ou dargent entre di erents el ements de stockage, de commande ou de r egulation. M emes les premiers travaux de J.-L. Le Moigne sur la th eorie du syst` eme g en eral (Le Moigne 1977) ou ceux de P. Delattre sur les structures organis ees (Delattre 1971)
58
avaient repris cette id ee devenue classique de consid erer un syst` eme comme un ensemble de sous-syst` emes interconnect es par des liens servant ` a transf erer des ux ou ` a contr oler leur activit e. Bien que tr` es utile dans de nombreux domaines, tels que lorganisation dentreprise ou la r ealisation de dispositifs electroniques, cette approche, malgr e son universalit e proclam ee, sav` ere en fait limitante puisque les seules notions v eritablement f econdes que lon y trouve sont celles de r egulation, de stabilisation et de fonction de transfert. Comme lindique en eet un ouvrage r ecent sur lanalyse des syst` emes (Lapierre 1992), Le concept de syst` emes tel que nous le concevons ici nest pas un concept dobjet, cest un concept doutils. (...) Ces syst` emes sont des entit es abstraites, non des parties concr` etes de cette totalit e. Dans cette approche, un syst` eme, quil sagisse dun etre humain, dune entreprise ou de nimporte quelle organisation, est d ecompos e en sous-syst` emes, chaque soussyst` eme r epondant ` a une fonction particuli` ere du syst` eme telle que la consommation, la production, la recherche, la conception (design), l echange et la gestion (Charest 1980). Ces sous-syst` emes r esument les caract eristiques du syst` eme etudi e au travers dune approche analytique, pourtant r ecus ee, qui ne permet pas de comprendre l evolution du syst` eme ni de comprendre les facteurs internes dune organisation. Le syst emisme devient alors un concept fourre-tout qui se r eduit parfois ` a du fonctionnalisme d eguis e. Il existe n eanmoins un deuxi` eme courant fort repr esent e actuellement, de E. Morin (Morin 1977) ` a F. Varela (Varela 1989), en passant par H. Atlan (Atlan 1979), I. Prigogine (Prigogine et Stengers 1979) ou E. Bernard-Weil (Bernard-Weil 1988), qui consiste ` a comprendre les syst` emes comme des entit es auto-organisatrices, dont le fonctionnement et l evolution sont les produits du comportement dun ensemble dentit es en interactions. Cependant, ` a part peut- etre avec la notion dautopo ` ese de Maturana et Varela (Maturana et Varela 1987) qui postule quun syst` eme autoorganisateur na pas dautre fonction que de maintenir sa structure organis ee, laccent est toujours mis sur les ux dinterconnexion et sur la mod elisation des boucles de r etroaction. Quelques travaux remarquables, tels que ceux de F. Le Gallou (Le Gallou 1992) ou dE. Schwartz (Schwartz 1993), tentent dunier ces deux voies. Mais ces entreprises, qui cherchent plus ` a expliquer de mani` ere qualitative les ph enom` enes qu` a en donner un mod` ele op erationnel, abordent les syst` emes de mani` ere holiste (un syst` eme est un tout) et ne tiennent compte que de mani` ere marginale du comportement des entit es qui les composent. Car, d enir un syst` eme par ses relations globales nexplique pas la gen` ese de sa structure mais seulement les formes g en erales de son evolution ` a partir dun point de vue macroscopique. Cette approche ignore ainsi limportance des actions individuelles qui concourent ` a l elaboration de la structure et donc ` a lorganisation du syst` eme en tant que tel. Au contraire, la k en etique met en avant les interactions locales et les ph enom` enes d emergence qui en r esultent. Il sagit donc dune forme de syst emique, plus exactement une n eo-syst emique fond ee sur lanalyse des comportements dagents interagissants, lauto-organisation des syst` emes etant alors le produit des actions transformatrices de ces agents.
59
1.6.3
Les syst` emes distribu es
Il existe de nombreux points communs entre la probl ematique soulev ee par la k en etique et les questions que se posent les syst` emes distribu es. Mais ces deux champs pr esentent n eanmoins des traits distincts. Les syst` emes distribu es cherchent a concevoir des syst` ` emes informatiques capables de g erer lex ecution de t aches en employant au mieux des ressources physiquement r eparties (m emoire, processeur, gestionnaires dinformations). Les techniques mises en uvre (client/serveur, distribution des applications) rel` event plus sp eciquement de la pratique informatique ou, plus exactement, dune op erationnalisation de syst` emes informatiques que ne le fait la k en etique. Par exemple, les syst` emes distribu es cherchent ` a faire des syst` emes dexploitation r epartis dans lesquels lutilisateur na pas ` a sp ecier sur quel processeur son programme va tourner, ni ` a v erier que les ressources n ecessaires a son ex ` ecution sont bien pr esentes sur sa machine, laissant au syst` eme le soin de g erer ces d etails. Les probl` emes qui se posent alors n ecessitent de pouvoir concevoir, sp ecier et valider des applications r eparties, en d enissant des protocoles permettant ` a plusieurs modules informatiques r epartis dutiliser mutuellement leurs services. La probl ematique de la k en etique est beaucoup plus ouverte: elle ne se cantonne pas ` a la gestion dapplications informatiques r eparties ou ` a la d enition de syst` emes dexploitation transparents pour lutilisateur. Les SMA tentent dappr ehender le probl` eme de linteraction entre entit es individualis ees de mani` ere g en erale et abstraite, consid erant que les syst` emes distribu es ne sont quune application ou quune r ealisation possible (et particuli` erement importante) de ce concept g en eral. Le probl` eme de lautonomie, de la coop eration (au sens vrai du terme et non dans le sens restreint de partage de t aches ou de ressources informatiques), et de la constitution dorganisations articielles emergentes capables daccomplir des travaux quune entit e unique serait incapable (ou dicilement capable) daccomplir constitue le fondement de cette approche. De ce fait, la perspective de type r esolution de probl` emes, coordination dactions ou partage de connaissances que soul` event les syst` emes multi-agents ne correspond pas du tout aux syst` emes distribu es. Le rapport qui existe entre processus et agent est ` a cet egard particuli` erement int eressant: alors que la notion de processus est relative ` a celle dex ecution, celle dagent correspond ` a une individualisation des comp etences et des objectifs, a une autonomie des capacit ` es daction et dinteraction. Ainsi, un agent peut-il simpl ementer sous la forme de plusieurs processus sans perdre de son individualit e, le niveau conceptuel ne devant pas etre confondu avec le niveau physique de son impl ementation. N eanmoins, les liens qui unissent ces deux domaines sont tr` es etroits: les SMA utilisent un grand nombre de techniques provenant des syst` emes distribu es, en se situant ` a un niveau plus conceptuel et m ethodologique. Certains algorithmes quemploient les SMA, tels que les algorithmes dallocation de t aches, et certains formalismes de repr esentation, tels que les r eseaux de Petri, font partie du bagage naturel des syst` emes distribu es. De ce fait, les SMA et les syst` emes distribu es entretiennent plus un rapport synergique quune v eritable opposition, les seconds apportant leur rigueur et leurs algorithmes, les premiers donnant une
60
conceptualisation et une approche plus g en erale, moins centr ee sur les m ecanismes dex ecution. Il nest donc pas etonnant que des recherches en cours tendent vers une collaboration de plus en plus etroites entre les sp ecialistes des syst` emes distribu es et ceux des syst` emes multi-agents.
1.6.4
La robotique
Les syst` emes multi-agents entretiennent aussi de tr` es nombreux rapports avec la robotique. Mais dans ce cas, les relations sont tr` es claires: la robotique, et surtout la robotique distribu ee, est une application possible des syst` emes multi-agents, ces derniers d ecrivant ce que les robots doivent etre capables daccomplir pour coop erer a des t ` aches mettant en uvre plusieurs robots. En revanche, la robotique etudie tout un ensemble de probl` emes m ecaniques, electroniques, g eom etriques et, dune mani` ere g en erale, de commandes de mouvement qui ne font pas partie des int er ets de la k en etique. De ce fait, sauf pour de tr` es rares applications qui consistent ` a d ecomposer un robot manipulateur en un ensemble dagents (Overgaard et al. 1994) et (Regnier et Duhaut 1995), la k en etique ne se tourne vers la robotique que lorsquil sagit de faire interagir un ensemble de robots mobiles ensembles. Cest dans ce sens que les probl` emes abord es aux chapitres 7 et 8 peuvent concerner la robotique.
1.6.5
Ce qui ne rel` eve pas de la k en etique
An d eviter toute equivoque, voici quelques el ements permettant de dire ce qui ne rel` eve pas de la k en etique. Dune mani` ere g en erale, on peut dire que tout ce qui est de lordre dune conception individualiste des syst` emes nappartient pas au domaine des SMA. Dautre part, tout syst` eme d ecompos e en un ensemble de sous-syst` emes nest pas du ressort de la k en etique. Pour quun syst` eme puisse etre consid er e comme un syst` eme multi-agent, il faut: 1. quil dispose dagents autonomes fonctionnant en parall` ele et cherchant ` a satisfaire un but ou une fonction de satisfaction (ce que nous appellerons des tendances au chapitre 5); 2. que ces agents poss` edent un m ecanisme dinteraction de haut niveau ind ependant du probl` eme ` a r esoudre (protocoles de communications ou m ecanismes dinteraction avec lenvironnement). On peut ainsi r epondre ` a certaines questions: Est-ce que les r eseaux sont des syst` emes multi-agents? Non, puisque les nuds du r eseau ne disposent g en eralement ni de but, ni de fonction de satisfaction. N eanmoins, les r eseaux sont bien plac es pour evoluer vers une conception multi-agent, du fait de leur nature d ej` a distribu ee et de leurs probl` emes de gestion qui n ecessitent une approche locale. Cest pourquoi de nombreuses applications multi-agents utilisent les r eseaux comme support de leur activit e.
61
Est-ce quune d ecomposition modulaire dun programme constitue un syst` eme multi-agents? Non. Pour les m emes raisons que pr ec edemment (les modules nont ni but ni fonction de satisfaction) et, dautre part, parce que les m ecanismes dinteraction que lon impl emente dans les modules sont de bas niveau (par exemple des appels de proc edure ou des envois de message pour demander un service que les modules sont oblig es de rendre au risque, sinon, de produire une erreur). Est-ce quun programme dIA qui sex ecute en parall` ele est un syst` eme multiagent? Non, pour les m emes raisons que pr ec edemment. On pose aussi souvent la question suivante: Quelle est la di erence entre objet, acteur et agent? La r eponse est simple. Dans le domaine de linformatique, les termes objet et acteur d esignent des entit es informatiques caract eris ees par leur structure et leurs m ecanismes dex ecution. La notion dobjet est d enie par trois concepts: la relation classe/instance, qui d ecrit la classe comme un mod` ele structural et comportemental et linstance comme un repr esentant dun mod` ele; lh eritage, qui permet de d eriver une classe dune autre et de faire b en ecier la premi` ere des caract eristiques de la seconde; et lenvoi de message, qui autorise la d enition de proc edures polymorphes, cest-` a-dire de proc edures dont le code di` ere en fonction du receveur du message (Ferber 1990). Les objets se situent donc, dune part, ` a un niveau dimpl ementation avec les langages ` a objets et, dautre part, ` a un niveau logique, dans le cadre de lanalyse et de la conception par objet. Dans tous les cas, les objets ne sont pas des agents car ils ne remplissent pas les deux crit` eres mentionn es ci-dessus: ils nont ni but ni recherche de satisfaction et le m ecanisme denvoi de message se r esume ` a un appel de proc edure. Les m ecanismes dinteraction sont donc ` a la charge du programmeur. Les acteurs en informatique sont des entit es qui sex ecutent en parall` ele, qui communiquent par envois de messages asynchrones bueris es et qui, g en eralement, nattendent pas le retour dun calcul mais demandent au receveur du message de renvoyer la r eponse ` a un autre acteur appel e la continuation locale du calcul (Agha 1986). Bien quil sagisse de mod` eles parall` eles dex ecution, et pour les m emes raisons que pour les objets, les acteurs ne peuvent etre identi es ` a des agents. La di erence essentielle qui existe entre les objets et les agents (purement communicants) est illustr ee ` a la gure 1.15. Un objet est d eni par un certain nombre de services (ses m ethodes) quil ne peut refuser dex ecuter si un autre objet le lui demande et les messages sont donc n ecessairement des invocations de m ethodes. Le d eveloppeur dun logiciel ecrit ` a laide dobjets doit donc v erier que tous les objets recevront bien des ordres sens es quils seront eectivement capables dex ecuter. Par rapport aux objets, les agents peuvent recevoir des messages qui ne sont pas uniquement des demandes dex ecution mais aussi des informations ou des demandes dinformations sur leurs capacit es, etc. De ce fait, les services que peuvent rendre un objet sont donc ltr es par une couche logicielle qui d ecouple les demandes et le fonctionnement interne de lagent. Enn, comme nous lavons dit, les agents tentent de satisfaire des objectifs, ce qui leur procure une autonomie suppl ementaire par rapport aux objets. En eet, lagent, ` a lencontre de lobjet,
62
peut refuser daccepter deectuer un certain travail, ce refus pouvant sexpliquer par son manque de comp etence (il ne poss` ede pas le savoir-faire n ecessaire) ou par sa trop grande occupation ` a une autre t ache ou par toute autre raison. La gure 1.15 repr esente la di erence fondamentale qui existe entre un agent et un objet. Un agent encapsule les m ethodes quun objet peut orir sous la forme dun ensemble de services qui ne sont accessibles que par un langage particulier connu de lensemble des agents et qui utilise g en eralement la th eorie des actes de langages (cf. chap. 6). Mais le lien qui existe entre objets et agents ne doit pas non plus etre sous-estim e.
Mthodes Requte Rponse Services Objectifs Acte de langage
Acte de langage
Objet
Agent
Figure 1.15: Un objet r epond directement ` a des requ etes correspondant ` a ses m ethodes, alors quun agent encapsule ses comp etences (ou services) par des m ecanismes suppl ementaires qui ltrent les communications externes et g` erent les dialogues. De plus, les agents sont mus par des objectifs (ou tendances) personnels. Si un agent purement communicant peut etre consid er e comme une sorte dobjet am elior e, inversement, un objet peut passer pour un agent d eg en er e, cest-` a-dire un agent dont le langage dexpression se r esume ` a lemploi des mots cl es correspondant ` a ses m ethodes. Enn, et cest dailleurs ce qui augmente encore la confusion possible, on impl emente souvent, pour des raisons pratiques, les agents sous la forme dobjets ou dacteurs. Ceci nest pourtant quune des impl ementations possibles. On peut de la m eme mani` ere impl ementer des agents en Fortran, C ou Lisp, qui ne sont pas naturellement des langages ` a objets, sans que cela modie en quoi que ce soit leur caract` ere dagent. On peut donc dire, pour r esumer, que les agents sont d enis ` a un niveau conceptuel et les objets ou les acteurs aux niveaux dimpl ementation et dex ecution. Cest dailleurs pour eviter cette confusion que lon ne parlera pratiquement pas dobjets ni dacteurs dans cet ouvrage.
Chapter 2 Interactions et coop eration

2.1 Situations dinteraction
La notion dinteraction est au centre de la probl ematique des syst` emes multi-agents et de la k en etique. Mais quest-ce quune interaction? Une interaction est une mise en relation dynamique de deux ou plusieurs agents par le biais dun ensemble dactions r eciproques. Les interactions sexpriment ainsi a partir dune s ` erie dactions dont les cons equences exercent en retour une inuence sur le comportement futur des agents. Les agents interagissent le long dune suite d ev enements pendant lesquels les agents sont dune certaine mani` ere en contact les uns avec les autres, que ce contact soit direct ou quil seectue par linterm ediaire dun autre agent ou de lenvironnement. Les situations dinteractions sont nombreuses et diverses: laide dun robot par un autre, l echange de donn ees entre serveurs informatiques, la mise en commun des comp etences de plusieurs sp ecialistes pour porter un diagnostic, lutilisation dune imprimante par deux programmes simultan ement, la r epartition des charges sur plusieurs processeurs, la collision de deux v ehicules sont autant dexemples de situations dinteractions. Les interactions sont non seulement la cons equence dactions eectu ees par plusieurs agents en m eme temps, mais aussi l el ement n ecessaire ` a la constitution dorganisations sociales. Cest par les echanges quils entretiennent, par les engagements qui les lient, par linuence quils exercent les uns sur les autres que les agents sont des entit es sociales et que de nouvelles fonctionnalit es peuvent emerger de ces syst` emes dactions mutuelles. Les groupes sont donc ` a la fois les r esultats dinteractions et les lieux privil egi es dans lesquels saccomplissent les interactions. Cest pourquoi il est g en eralement impossible danalyser des organisations sociales sans tenir compte des interactions entre leurs membres. Si lon prend lexemple des robots transporteurs, d eplacer une masse de 300 kilos alors que chacun ne peut en porter que 100 suppose dune part quil existe un nombre de robots susant pour porter cette charge, et dautre part que leurs actions vont etre coordonn ees de telle mani` ere que la charge soit eectivement d eplac ee et arrive ` a bon port. Il en est de m eme pour des v ehicules qui se meuvent sur un r eseau routier: leurs actions doivent etre coordonn ees pour quils puissent parvenir
64
CHAPTER 2. INTERACTIONS ET COOPERATION
` leur destination sans entrer en collision. Plus pr a ecis ement, la notion dinteraction suppose: 1. La pr esence dagents capables dagir et/ou de communiquer. 2. Des situations susceptibles de servir de point de rencontre entre agents: collaboration, d eplacement de v ehicules amenant ` a une collision, utilisation de ressources limit ees, r egulation de la coh esion dun groupe. 3. Des el ements dynamiques permettant des relations locales et temporaires entre agents: communication, choc, champ attractif ou r epulsif, etc. 4. Un certain jeu dans les relations entre les agents leur permettant ` a la fois d etre en relation, mais aussi de pouvoir se s eparer de cette relation, cest-` adire de disposer dune certaine autonomie. Si des agents sont totalement li es par un couplage xe, leur interaction devient rigide et ils ninteragissent plus au sens plein du terme. Linteraction est ` a la base de la constitution dorganisations (Morin 1977) et simultan ement les interactions supposent la d enition dun espace et g en eralement dune organisation pr e etablie dans lesquels ces interactions peuvent se produire. De ce fait, linteraction est le composant de base de toute organisation, ` a la fois source et produit de la permanence de cette organisation, et la dissolution dune organisation est concomitante de la disparition (ou en tout cas de la diminution) des interactions des individus pr esents dans cette organisation. Enn, linteraction est la cons equence de laspect pluriel des soci et es multiagents, en apportant une dimension suppl ementaire ` a lindividu. Ce dernier nest plus le centre de lunivers, comme dans les conceptions ego-centr ees caract eristiques de lintelligence articielle classique dans laquelle lintelligence peut etre comprise du point de vue de lindividu seul, mais le nud dun ensemble d echanges et dinterd ependances qui, en retour, le fa connent et lui donnent tout son sens: un agent sans interaction avec dautres agents nest plus quun corps isol e, quun syst` eme de traitement dinformations, d epourvu de caract eristiques adaptatives. Cette prise en compte de linteraction comme el ement essentiel et fondateur des formes dintelligence, bien quapparaissant comme novateur pour les sciences cognitives, nest pourtant pas une nouveaut e. L ethologie, qui sint eresse aux comportements animaux et humains, montre que lapparition des formes cognitives est le produit dune s erie de comportements complexes dans lesquels l echange et linteraction avec des individus de sa propre esp` ece jouent un r ole essentiel dans le d eveloppement dun etre vivant (McFarland 1990) (Lannoy et Feyereisen 1987) (Cyrulnik 1989). Lorsque cet echange nexiste pas, les individus ne peuvent saccomplir totalement et restent dans un etat primitif. Les interactions entre agents sexpriment sous diverses formes. Mais au-del` a de la diversit e supercielle, il est possible de d egager des di erences et des points communs a un niveau plus profond. En eet, comment comparer des interactions de marins ` en train de manuvrer une voile et des ouvriers qui construisent une maison? Des automobilistes qui se croisent sur la route et des robots qui recherchent et r ecup` erent
2.2. COMPOSANTES DES INTERACTIONS
65
du minerai? La premi` ere etape consiste ` a consid erer di erentes situations dans lesquelles plusieurs agents sont en interaction. An de d ecrire ces activit es, nous recourrons ` a la notion de situation dinteraction qui permet de d ecrire des types dinteraction en les reliant aux el ements qui la composent. D enition: On appellera situation dinteraction un ensemble de comportements r esultant du regroupement dagents qui doivent agir pour satisfaire leurs objectifs en tenant compte des contraintes provenant des ressources plus ou moins limit ees dont ils disposent et de leurs comp etences individuelles. Par exemple, la construction dune maison est une situation dinteraction (en loccurrence une situation de coop eration n ecessitant une certaine coordination des actions) d enie par lensemble des comportements des agents (les ouvriers, larchitecte, le propri etaire, le ma tre duvre) caract eris es par leurs objectifs (la r ealisation de la maison envisag ee suivant les di erents points de vue des agents) et leurs comp etences (le savoir-faire de larchitecte et des di erents corps de m etier) en tenant compte des ressources disponibles (les mat eriaux de constructions, les nances, les outils, lespace constructible, le temps). Cette notion de situation dinteraction sert ` a d enir des cat egories abstraites ind ependantes de leurs r ealisations concr` etes, en d egageant dune part les principaux invariants que lon retrouve partout et, dautre part, les rapports de di erence quils entretiennent. A partir de cette d enition des cat egories, il est possibles de les classer, cest-` a-dire de les ordonner les uns par rapport aux autres. Cependant, nous ne nous attacherons pas ` a consid erer toutes les interactions possibles, mais seulement celles caract eristiques de la k en etique ` a lheure actuelle. Par exemple, malgr e leur importance dans les interactions humaines, nous ne prendrons pas en compte les ph enom` enes dus aux emotions et aux relations de tendresse ou damour.
2.2
Composantes des interactions
Quels sont les di erents types dinteraction? Est-il possible de d enir des param` etres dinteraction permettant de classer les situations? Dans les sections qui suivent nous allons d ecrire plusieurs crit` eres par lesquels il sera possible de classier di erents types dinteraction et ainsi parvenir ` a une meilleure compr ehension ` a la fois des potentialit es et des probl` emes que pr esente cette notion. Les principales situations dinteraction peuvent etre class ees par rapport ` a trois crit` eres: les objectifs ou intentions des agents, les relations que les agents entretiennent envers les ressources quils poss` edent ainsi que les moyens (ou comp etences) dont ils disposent pour parvenir ` a leurs ns.
2.2.1
Buts compatibles et incompatibles
Les objectifs et interactions des agents sont evidemment au centre des probl ematiques de linteraction: les agents ont-ils des buts concordants, cest-` a-dire allant dans le m eme sens, ou bien leurs objectifs sont-ils contradictoires, voire oppos es?
66
Par exemple, lorsquun couple veut prendre des vacances et que lun des conjoints veut aller ` a la montagne quand lautre d esire aller ` a la mer, les buts sont contradictoires. Il y aussi contradiction dans les objectifs lorsque deux associ es ne sont pas daccord sur la strat egie ` a suivre pour d evelopper leur entreprise, lun voulant augmenter la productivit e en licenciant du personnel et le second, au contraire, voulant embaucher parce quil estime que l evolution du march e est en croissance. De m eme, la plupart des sports et des jeux sont fond es sur une situation de comp etition, cesta-dire sur le fait que les buts des participants sont incompatibles: tous veulent gagner ` mais il ny aura quun seul vainqueur. Autrement dit, il y a plusieurs objectifs locaux qui ne peuvent etre fusionn es en un seul au niveau global. Dune mani` ere g en erale, on dira que des buts sont incompatibles si la satisfaction de lun entra ne linsatisfaction de lautre, la r eciproque etant automatiquement vraie. D enition: Le but dun agent A est incompatible avec celui dun agent B si les agents A et B ont comme buts respectifs datteindre les etats d ecrits respectivement par p et q et que p q , cest-` a-dire que: satisf ait(but(A, p)) satisf ait(but(B, q )). Cette distinction entre buts compatibles et incompatibles est ` a la base dune premi` ere classication: on dira que des agents sont dans une situation de coop eration ou dindi erence si leurs buts sont compatibles et dans une situation dantagonisme dans le cas contraire. Bien que la notion de but soit caract eristique des agents cognitifs, il est possible d etendre cette notion de compatibilit e aux agents r eactifs. Lorsquil sagit dagents pulsionnels (cf. chap. 1), il est permis de distinguer des pulsions compatibles et incompatibles en d enissant la possibilit e de co-satisfaire ou non les d esirs de ces agents. Dans le cas dagents tropiques , on ne consid erera que leur viabilit e et lon dira, par extension, que les objectifs des agents sont compatibles si le comportement de survie de lun nentra ne pas la mort de lautre. De ce fait, les situations de coop eration (ou dindi erence) sont celles pour lesquelles la viabilit e de lun nest pas aect ee n egativement par celle de lautre. Dans les situations dindi erence, la viabilit e de lun nest pas aect ee (ni n egativement ni positivement) par le comportement de lautre, alors que dans les situations de coop eration, la viabilit e de lun est renforc ee par la viabilit e de celle de lautre. Dans le r` egne animal et v eg etal, les cas de symbiose sont caract eristiques de coop eration r eactive. Par exemple, dans certains cas de symbiose animale, lorsquun organisme A nourrit un autre organisme B et que ce dernier d efend A des pr edateurs, on peut dire que ces deux animaux coop` erent puisque leur viabilit e est renforc ee par la pr esence et le comportement de lautre. De ce fait, tout ce qui ressort de la survie dun groupe est caract eristique de situations de coop eration. Lexemple du mod` ele Proie-Pr edateur est une bonne illustration des m ecanismes de coop eration et dantagonisme: les pr edateurs, en formant un groupe, coop` erent pour chasser leurs proies, mais ils se situent dans un rapport antagonistes avec les proies: la satisfaction des pr edateurs entra nant la mort des proies et la survie des proies l echec des pr edateurs.
2.2. COMPOSANTES DES INTERACTIONS
67
2.2.2
Relations aux ressources
Une autre composante importante des interactions est relative aux ressources ext erieures dont disposent les agents. On entend par ressources tous les el ements environnementaux et mat eriels utiles ` a la r ealisation dune action. Il peut sagir de valeurs energ etiques, de possibilit e nanci` eres, doutils, de mati` eres premi` eres, mais aussi de la prise en compte de notions plus g en erales telles que lespace et le temps disponibles pour laccomplissement dune t ache. Tout agent a besoin de ressources pour r ealiser ses actions, lesquelles se d eroulent dans un espace-temps quadridimensionnel, consomment de l energie (et de largent) et n ecessitent des instruments comme catalyseur dactivit e.
Espace des ressources Zone de conflit Ressources daccs aux dsires par A ressources
Ressources dsires par B
Figure 2.1: Lagent A d esire des ressources qui recoupent celles qui sont d esir ees par B, ce qui engendre un conit. Cette quantit e de ressources, n ecessairement limit ee, est ` a lorigine de conits. Dans ce cas, les interactions sont perturbantes: du point de vue de chaque agent, lautre est un g eneur quant ` a laccomplissement de ses propres actions. Les conits apparaissent essentiellement lorsque plusieurs agents ont besoin des m emes ressources en m eme temps et au m eme endroit, cest-` a-dire lorsque les zones correspondant aux ressources dont ils ont besoin sintersectent (g. 2.1). Deux ouvriers ayant besoin du m eme outil, deux robots devant se r eapprovisionner ` a la m eme prise de courant, deux personnes voulant imprimer en m eme temps ou deux programmes partageant le m eme processeur constituent autant de cas de conits caus es par manque de ressources. Un autre exemple est donn e par la circulation automobile, o` u la simple pr esence dautrui constitue une g ene. Dans un embouteillage, cest parce que lautre se situe sur mon passage que je suis en conit avec lui. Sil y avait plus de place ou si le nombre de v ehicules etait moindre, les conits dispara traient. Le probl` eme vient donc du nombre de v ehicules et de la place disponible, cest-` a-dire des ressources mises ` a la disposition de chacun. Si le trac est uide, cest-` a-dire si la densit e des voitures nest pas trop importante, tout se passe bien, mais si cette densit e vient a augmenter de mani` ` ere trop brutale la circulation devient bloqu ee, les actions de chaque automobiliste etant contrari ees par celles des autres. Les situations conictuelles peuvent etre r esolues dune mani` ere ou dune autre par linterm ediaire de m ecanismes de coordination daction et de r esolution de
68
conit. Certaines de ces m ethodes sont particuli` erement frustres: par exemple la loi du plus fort est une technique de r esolution de conit qui d enit un ordre de priorit e en fonction de la force de lagent, le plus fort dominant le plus faible pour lacc` es aux ressources. Dautres m ethodes sont plus elabor ees. Les techniques de n egociation par exemple sont utilis ees pour sortir dune situation de conit par des compromis qui mod` erent les satisfactions et les frustrations des uns et des autres. Enn les techniques de coordination dactions sont utilis ees pour anticiper les conits ` a venir et faire en sorte quils soient g er es avant m eme quils napparaissent. Elles comportent un ensemble de dispositifs, de r` eglements et dactions suppl ementaires quil est n ecessaire daccomplir pour que les actions des di erents agents soient possibles. Les feux de signalisation et le code de la route sont des exemples de dispositifs et de r` eglements permettant de r eguler le trac routier et de diminuer les risques de conits entre automobilistes. Par exemple, un feu rouge ` a un carrefour sert ` a coordonner les actions des v ehicules et ` a faire en sorte quil ny ait pas de conits de passage entre les v ehicules. En labsence de syst` eme de r egulation de trac, si chaque voiture cherche ` a passer sans se pr eoccuper de la g ene quelle peut causer aux autres voitures, des conits appara tront, pouvant aller jusqu` a laccident. Le constat amiable (n egociation) ou le passage devant un tribunal (arbitrage) serviront alors ` a r esoudre les conits dint er ets caus es par laccident. Des conits peuvent na tre m eme si tous les agents sont dans les meilleures dispositions du monde et sils d ecident a priori de collaborer. Par exemple, lorsque plusieurs amis viennent vous donner un coup de main pour d em enager et porter les meubles de votre salon, leurs actions ne vous g enent pas. Au contraire, elles sont les bienvenues! Cependant, du fait de lexigu t e de votre appartement et du nombre de porteurs volontaires, les all ees et venues de vos amis doivent etre plus ou moins coordonn ees pour que les meubles arrivent ` a bon port et en bon etat et que cette assistance ne se transforme pas en d esordre perturbateur. Nous discuterons plus en d etail des probl` emes de coordination au chapitre 8. Il sut ici de comprendre que les limitations de ressources peuvent etre causes de conit que lon peut eviter dans une certaine mesure en coordonnant les actions des agents.
2.2.3
Capacit es des agents par rapport aux t aches
Le rapport entre les capacit es des agents et les t aches ` a accomplir constitue la troisi` eme composante fondamentale des interactions entre agents. Est-ce quun agent peut r ealiser seul une t ache ou bien a-t-il besoin des autres pour parvenir ` a son but? Dans de nombreuses situations, un agent isol e sav` ere capable de faire face seul ` a la r ealisation de son but. Par exemple, aller chercher une bi` ere dans le frigo ou du pain ` a la boulangerie sont des t aches simples qui peuvent etre eectu ees par une personne seule. Dautres plus complexes peuvent etre eectu ees par un individu unique, m eme si leur accomplissement est facilit e par la pr esence dautres personnes qui sapportent ainsi mutuellement une aide. Traverser lAtlantique ` a la voile, faire un diagnostic m edical ou r eparer une voiture sont des exemples de telles situations. Enn, certaines requi` erent imp erativement les capacit es de plusieurs personnes: l edication dun monument ou la construction dune navette spatiale n ecessitent les
2.3. TYPES DINTERACTION
69
eorts conjugu es et coordonn es de plusieurs individus pour aboutir ` a la r ealisation de luvre commune, aucun n etant capable de laccomplir seul. Sans les autres, le ma con, l electricien et le plombier dans un cas, ling enieur en propulsion et lexpert en a erodynamique dans lautre, sont incapables de mener ` a bien lobjectif quils se sont assign e. Dans ces deux derni` eres situations, les interactions sont b en eques, les actions des uns venant aider celles des autres. Le syst` eme r esultant dispose alors de propri et es nouvelles qui sexpriment parfois comme une fonctionnalit e emergente. Une maison ce nest pas simplement construire des murs plus mettre des conduites deau plus mettre de l electricit e, un avion ne peut se r esumer ` a la juxtaposition dun fuselage et de moteurs. Dans tous ces cas, la chose produite est un plus par rapport ` a la simple somme des comp etences de chacun des agents et cette somme appara t dans linteraction de chaque el ement.
2.3
Types dinteraction
Ces trois composantes principales de linteraction, ` a savoir la nature des buts, lacc` es aux ressources et les comp etences des agents, vont permettre de faire une premi` ere typologie des situations dinteractions, comme le montre le tableau 2.1, en envisageant tous les cas possibles.
Buts compatibles compatibles compatibles compatibles
Ressources suffisantes suffisantes insuffisantes insuffisantes
Comptences suffisantes insuffisantes suffisantes insuffisantes suffisantes insuffisantes suffisantes insuffisantes
Types de situation indpendance collaboration simple emcombrement collaboration coordonne comptition individuelle pure comptition collective pure
Remarques situation d'indiffrence situations de cooprations
incompatibles suffisantes incompatibles suffisantes incompatibles insuffisantes incompatibles insuffisantes
situations
conflits individuels d'antagonismes pour des ressources conflits collectifs pour des ressources
TAB.SIT.INTER Table 2.1: Classication des situations dinteractions
70
2.3.1
Ind ependance
Buts compatibles, ressources susantes, comp etences susantes. La situation dind ependance ne pose aucun probl` eme du point de vue multi-agent et se r esume ` a la simple juxtaposition des actions des agents pris ind ependamment, sans quil y ait eectivement dinteraction. Par exemple, des personnes qui se croisent dans la rue sachant quil y a assez de place pour se croiser ou des ing enieurs qui ne travaillent pas sur le m eme projet sont dans une situation dind ependance totale. Il sagit dune situation neutre qui ne r eclame en fait aucune interaction sp ecique du point de vue de la k en etique. Nous nen parlerons donc pas.
2.3.2
Collaboration simple
Buts compatibles, ressources susantes, comp etences insusantes. La collaboration simple consiste en une simple addition des comp etences ne n ecessitant pas dactions suppl ementaires de coordination entre les intervenants. Cette situation est caract eristique de syst` emes communicants dans lesquels toute linteraction sexprime sous la forme dallocation de t aches et de partage de connaissances. Les syst` emes multi-sp ecialistes (cf. chap. 1), dont les agents ne font que partager des connaissances pour aboutir ` a la r esolution dun probl` eme, ne font g en eralement intervenir que de la collaboration simple. Le chapitre 7 traite essentiellement de ces cas de gure.
2.3.3
Encombrement
Buts compatibles, ressources insusantes, comp etences susantes. Lencombrement est caract eristique de toutes les situations dans lesquelles les agents se g enent mutuellement dans laccomplissement de leurs t aches alors quils nont pas besoin les uns des autres. Lexemple caract eristique est celui de la circulation de voitures, de la r egulation du trac a erien, de lutilisation optimale des ressources telles que la d enition demplois du temps, la gestion des stocks, le placement des t aches sur un processeurs, etc. La r esolution de ce type de probl` eme fait appel ` a des techniques sp eciques de coordination dactions dont quelques-unes sont pr esent ees au chapitre 8.
2.3.4
Collaboration coordonn ee
Buts compatibles, ressources insusantes, comp etences insusantes. La collaboration complexe suppose que les agents doivent coordonner leurs actions pour pouvoir disposer de la synergie de lensemble de leurs comp etences. Presque toutes les activit es industrielles n ecessitant une approche distribu ee, telles que le contr ole de r eseaux, la conception et la fabrication de produits industriels, la r egulation distribu ee ou la r ealisation de soci et es de robots autonomes un tant soit peu elabor ees, se situent dans le cadre de la collaboration coordonn ee. Il sagit donc de la plus complexe des situations de coop eration, puisque elle ajoute aux probl` emes dallocation de t aches des aspects de coordination dus aux ressources limit ees. Le chapitre 8 en
71
abordant le probl` eme des coordinations dactions apportera quelques lumi` eres sur la r esolution de ce type de situation.
2.3.5
Comp etition individuelle pure
Buts incompatibles, ressources susantes, comp etences susantes. Quand les buts sont incompatibles, les agents doivent lutter ou n egocier pour atteindre leurs buts. La comp etition sportive suppose que les agents ont tous les m emes ressources a leur disposition et quils sont plac ` es dans des situations initiales identiques. On parle de comp etition pure lorsque les ressources ne sont pas limit ees, plus exactement lorsque lacc` es aux ressources ne constitue pas lenjeu du conit. La course ` a pied est un exemple de comp etition pure: chaque joueur jouit dun espace susant et similaire, seules ses caract eristiques sportives intrins` eques feront la di erence. Il ny a pas de probl` emes sp eciques dinteraction li es ` a ce type de situation. Simplement, que le meilleur gagne.
2.3.6
Comp etition collective pure
Buts incompatibles, ressources susantes, comp etences insusantes. Lorsque les agents nont pas la comp etence susante, ils doivent se regrouper au sein de coalitions ou dassociations pour parvenir ` a atteindre leurs objectifs. Ce regroupement est eectu e le long dun double mouvement: le premier tend ` a liguer les individus au sein de groupes unis par des liens de collaboration coordonn ee et le second ` a opposer les groupes entre eux. Un exemple caract eristique de ce type de situation est donn e par la comp etition par equipe, telle que la course de relais par equipe ou la coupe de lAmerica en voile, cest-` a-dire des oppositions dans lesquelles les equipes ne se g enent (normalement) pas.
2.3.7
Conit individuel pour des ressources
Buts incompatibles, ressources insusantes, comp etences susantes. Lorsque les ressources ne peuvent etre partag ees, on se trouve dans une situation caract eristique de conit dont les ressources sont lenjeu, chacun voulant les acqu erir pour lui seul. Lobjet du conit peut etre un territoire, une position nanci` ere dominante, etc. Il existe un grand nombre dexemples de ce type de situation dans le monde animal ou humain, depuis la d efense du territoire chez les animaux jusqu` a lobtention dun poste hi erarchiquement sup erieur chez les humains.
2.3.8
Conits collectifs pour des ressources
Buts incompatibles, ressources insusantes, comp etences insusantes. Ce type de situation combine la comp etition collective aux conits individuels pour des ressources. Les coalitions luttent les unes contre les autres pour obtenir le monopole dun bien, dun territoire ou dune position. Toutes les formes de guerres, de chasses, de comp etitions industrielles et, dune mani` ere g en erale, de conits collectifs ayant
72
pour objectif lobtention dun territoire ou dune ressource en sont des exemples caract eristiques.
2.3.9
Niveau danalyse des situations dinteraction
Evidemment, cette classication ne constitue quune premi` ere approche dans lanalyse des situations. Il serait possible de laner en d ecrivant dautres param` etres pour rendre compte plus en d etail de certains cas. En particulier, on pourrait prendre en compte des caract eristiques telles que la reconnaissance cognitive de buts communs ou la volont e de modier l etat cognitif des autres agents (exemple: chercher ` a les convaincre), lexistence dune structure dautorit e et de m ecanismes dinuence permettant ` a un agent de faire agir dautres agents dans le sens quil d esire, les types et modes de communication, les capacit es cognitives des agents ` a anticiper les actions des autres, lexistence dune r ecompense apr` es laction (ou au cours de celle-ci), la pr esence dactivit es r ep etitives ou isol ees, etc. Les situations peuvent etre analys ees ` a di erents niveaux. Une situation dinteraction complexe est compos ee de situations plus el ementaires. Par exemple, lactivit e dune entreprise r esulte de tout un ensemble de situations plus simples dans lesquelles les employ es de lentreprise interagissent pour produire des biens et des services. On peut ainsi distinguer des macro-situations1 dinteraction qui sont caract eristiques dune analyse globale de lactivit e dun ensemble dagents et les micro-situations dinteraction qui se situent ` a un niveau de d etail plus n. Les relations qui existent entre les micro-situations et les macro-situations sexpriment comme le rapport des parties au tout, suivant un point de vue syst emique: la macro-situation, tout en etant la r esultante des micro-situations qui la compose, introduit un ensemble de probl` emes dont la r esolution passe par la production dune quantit e de microsituations elles-m emes porteuses de probl` emes, comme le montre la gure 2.2. Ainsi, une situation consid er ee au niveau macroscopique comme une situation de collaboration peut produire au niveau microscopique des situations locales de comp etition ou dencombrement. Et inversement une situation de conit de territoire peut r esulter de situations locales de collaboration. En particulier, nous verrons au chapitre 8 que certaines m ethodes utilis ees pour g erer des situations de collaboration et dencombrement passent par la d enition de situations locales de comp etition. Et cest pourquoi, m eme si lon nest int eress e que par les situations ne comprenant que des objectifs compatibles, il ne faut pas n egliger l etude des situations dans lesquelles les agents poss` edent des buts incompatibles. Il nen est pas moins vrai que les situations de coop eration constituent un ensemble majeur de situations dinteraction et nous ne traiterons pas dans cet ouvrage des probl` emes li es aux situations faisant intervenir des buts antagonistes. Par la suite, on supposera:
1 Les termes macro et micro ne renvoient pas ` a des echelles globales mais d ecrivent ici des positions relatives. Une situation peut donc appara tre comme macro dun certain point de vue (par exemple lentreprise est consid er ee comme macro par rapport aux interactions de ses employ es) et micro dun autre point de vue (une entreprise interagit avec dautres entreprises pour constituer des structures economiques plus vastes).

Macro-situation entrane
73
Problmes/contraintes
Proprits mergentes a pour rsultat
Micro-situation
Figure 2.2: Les actions des agents qui se situent au niveau micro dun syst` eme produisent des macro-situations relatives engendrant des contraintes au niveau micro. 1. que les buts des agents sont compatibles; 2. que les agents sont bienveillants et quils cherchent ` a saider les uns les autres ou ` a parvenir ` a un compromis si des int er ets portant sur des ressources sont en jeu. Bien que le probl` eme de la coop eration entre agents ait et e soulev e depuis longtemps, peu de th eories ont tent e, avant lapparition des syst` emes multi-agents, de d ecrire de mani` ere op eratoire les diverses formes de coop eration ni de montrer la relation entre les individus, les t aches quils accomplissent et lint er et global pour le groupe2 . La plupart des travaux traitant de la coop eration portent sur lint er et quil y a ou non ` a coop erer avec autrui, comme dans le cadre du dilemme du prisonnier (Axelrod 1992), ou sur la mani` ere de communiquer dans les groupes restreints en psychologie sociale (Stoetzel 1978). Mais alors que ces travaux mettent laccent soit sur la d ecision et lint er et quil y a de coop erer pour un agent, soit sur les rapports dautorit e et sur les relations aectives qui am` enent les individus ` a coop erer et a ` travailler ensemble, les syst` emes multi-agents reformulent le probl` eme en mettant en avant les caract eristiques cognitives et comportementales n ecessaires ` a la mise en uvre dun travail collectif. La coop eration est souvent avanc ee comme lun des concepts cl es de lintelligence articielle distribu ee (Demazeau et M uller 1991). Actuellement, les travaux les plus en pointe en ce qui concerne la coop eration dans les syst` emes multi-agents sont dus ` a Lesser et Durfee (Durfee et al. 1987), Galliers (Galliers 1991), Castelfranchi et Conte (Conte et al. 1991) et Bouron (Bouron 1992). Mais la plupart ne fournissent que des r eponses partielles et ne sint eressent de toute mani` ere qu` a des agents cognitifs, cest-` a-dire ` a des agents capables davoir des repr esentations et de planier leurs
2 Il existe n eanmoins tout un courant de travaux philosophiques portant sur la coop eration et laction collective dans une perspective cognitive. On pourra se r ef erer ` a (Livet 1994) pour une pr esentation r ecente et en fran cais de ces r eexions.
74
actions. Les travaux sur la coop eration r eactive, cest-` a-dire sur la coop eration par des agents qui ne font que r eagir aux stimuli provenant de leur environnement, nen sont encore qu` a leurs d ebuts. Les travaux de Deneubourg (Deneubourg et al. 1993), Theraulaz (Theraulaz et al. 1991), Steels (Steels 1994), Drogoul (Drogoul 1993) et Ferber (Ferber 1995) t emoignent cependant de limportance du domaine.
2.4
Formes de coop eration
Il existe plusieurs points de vue sur la coop eration, selon que lon consid` ere que la coop eration est une attitude des agents qui d ecident de travailler en commun ou que lon se pose comme un observateur qui interpr` ete a posteriori les comportements en les qualiant de coop eratifs ou non ` a partir de crit` eres sociaux (ou physiques), tels que linterd ependance des actions ou le nombre de communications eectu ees.
2.4.1
La coop eration comme attitude intentionnelle
Dans le premier cas, la coop eration est caract eristique dune attitude (posture) des agents. On dit que des agents coop` erent sils sengagent dans une action commune apr` es avoir identi e et adopt e un but commun. La cr eation dune association, telle quune association de d efense de lenvironnement par exemple, correspond ` a ce sch ema: les membres de lassociation ont identi e un objectif commun, lutter contre les sources de pollution, et ils sengagent ` a participer ` a une t ache commune, la d efense de la nature. La constitution de lassociation r esulte de la prise de conscience de lexistence dun but commun et de lengagement de chacun de ses membres. De m eme, lorsque des individus acceptent de travailler dans une entreprise, ils sengagent pour participer ` a un travail en commun, en consid erant non seulement que leurs buts sont compatibles avec ceux de lentreprise, mais aussi que les employ es comme lorganisme qui les emploie peuvent y trouver leur int er et, lentreprise en utilisant les comp etences de ceux quelle engage et les employ es en recevant une r emun eration. Le probl` eme de lengagement envers un but collectif est appel e adoption de but (goal adoption) par J. Galliers (Galliers 1991), C. Castelfranchi et R. Conte (Conte et al. 1991), laquelle est consid er ee comme un el ement essentiel de lactivit e sociale. En particulier pour J. Galliers, il y a coop eration si les agents sengagent dans une action et identient un but commun, cest-` a-dire reconnaissent que les autres agents sont engag es dans le m eme but. Cependant, toute forme de coop eration est-elle le fruit dune intention de coop erer, et toute intention de coop erer conduit-elle n ecessairement ` a la coop eration? Ainsi, dans lhistoire suivante: Ga etan d esire aider Ambroise qui construit un hangar pour sa voiture. Mais Ga etan nest pas tr` es adroit de ses mains, et il narrive pas ` a monter les moellons comme le lui demande Ambroise. De ce fait Ambroise doit passer derri` ere Ga etan pour refaire le travail de ce dernier et voit donc son ecacit e r eduite par rapport ` a ce quil faisait quand il etait seul.
2.4. FORMES DE COOPERATION
75
Peut-on dire que Ga etan et Ambroise sont dans une situation de coop eration? Dapr` es Galliers (et la plupart des chercheurs en IAD travaillant sur des agents cognitifs), Ga etan et Ambroise coop` erent parce quils sont conscients que leurs actions sont engag ees dans un but commun, ou une intention commune. Cette conception pr esente deux inconv enients: dune part, m eme si le r esultat de la coop eration est moins bon que la performance des agents pris individuellement, on pr etend quil existe une coop eration et, dautre part, toute possibilit e pour des agents r eactifs (qui nont pas dintention explicite et encore moins de mod` eles des autres) de pouvoir coop erer est supprim ee. Pourtant on reconna t souvent (en ethologie en particulier) que des insectes sociaux tels que des fourmis qui travaillent ensemble pour r ecup erer de la nourriture au dehors de leur nid coop` erent m eme si elles nen ont pas conscience (Fresneau 1994). De mani` ere plus g en erale, des agents r eactifs qui parviennent ` a accomplir des t aches complexes ` a plusieurs peuvent-ils etre coop eratifs? Si lon r epond positivement, alors il faut supposer que la coop eration ne r esulte pas seulement dune attitude, m eme si une attitude pour coop erer peut etre un tr` es bon catalyseur de coop eration, mais quelle doit etre comprise en termes de comportement et de r esultat. Dans ce cas, la coop eration nest plus directement le produit dune intention de coop eration mais le b en ece positif obtenu gr ace aux interactions des agents.
2.4.2
La coop eration du point de vue de lobservateur
Cest pourquoi, certains auteurs, (Durfee et al. 1989) et (Bouron 1992) notamment, consid` erent la coop eration comme une qualication de lactivit e dun ensemble dagents par un observateur ext erieur qui naurait pas acc` es aux etats mentaux des agents. Par exemple, si lon qualie le comportement des fourmis de coop eratif, cest parce que, en tant quobservateur, on observe un certain nombre de ph enom` enes que lon utilise comme des indices dune activit e de coop eration. Lid ee dindice de coop eration (MIRIAD 1992) est particuli` erement int eressante, car elle permet de saranchir des caract eristiques internes des agents et de ne soccuper que de leur comportement observable. Par exemple, voici un ensemble dindices propos es par T. Bouron pour qualier les activit es de coop erations: 1. La coordination dactions, qui concerne lajustement de la direction des actions des agents dans le temps et lespace. 2. Le degr e de parall elisation, qui est fonction de la r epartition des t aches et de leur r esolution concurrente. 3. Le partage des ressources, qui concerne lutilisation des ressources et des comp etences. 4. La robustesse, qui concerne laptitude du syst` eme ` a suppl eer la d efaillance dun agent. 5. La non-redondance des actions, qui caract erise le faible taux dactivit es redondantes.
76
CHAPTER 2. INTERACTIONS ET COOPERATION 6. La non-persistance des conits, qui t emoigne du faible nombre de situations bloquantes.
La d enition dun tel ensemble repose en premier lieu sur des consid erations dobservabilit e et de quantiabilit e. Ces indices doivent pouvoir etre examin es et mesur es pour que lon puisse caract eriser le degr e de coop eration qui existe entre di erents agents. Mais lapplication de ces contraintes nest pas evidente: Quelle mesure donner ` a la coordination des actions? Comment quantier la robustesse dun syst` eme? Proposer des crit` eres objectifs et mesurables est fondamentale si lon veut donner un statut pr ecis ` a la coop eration. Autrement, on risque de sp ecier ce concept en termes dautres concepts tout aussi vagues, ce qui emp echerait toute d enition de crit` eres eectifs de coop eration. Cet ensemble dindices doit de plus etre coh erent: la mesure de la robustesse est plut ot une caract eristique de la capacit e dun syst` eme ` a sadapter et la nonredondance des activit es vient en opposition avec le degr e de parall elisation des t aches: plus on parall elise, plus on tend ` a ce que les t aches soient dupliqu ees pour etre ex ecut ees plus rapidement et plus on introduit de redondance. Enn, ces indices doivent etre hi erarchis es: le degr e de parall elisation ou la coordination dactions sont des cons equences dindices plus fondamentaux tels que le partage des ressources ou l evitement de conits. Peut-on alors donner un ensemble minimal dindices ` a partir desquels il serait possible de construire dautres indices plus complexes? Nous pensons que cela est possible et, par la suite, nous ne retiendrons que deux indices qui semblent n ecessaires et susants pour caract eriser sil y a ou non activit e de coop eration: lecacit e du travail en groupe, dune part, et lexistence de m ecanismes de r esolution de conit daccession ` a des ressources, dautre part. Ces crit` eres sont facilement mesurables et viennent sint egrer naturellement ` a la typologie des situations dinteraction pr esent ees pr ec edemment. D enition: On dira que plusieurs agents coop` erent, ou encore quil sont dans une situation de coop eration, si lune des deux conditions est v eri ee: 1. Lajout dun nouvel agent permet daccro tre di erentiellement les performances du groupe. 2. Laction des agents sert ` a eviter ou ` a r esoudre des conits potentiels ou actuels. Le premier indice recouvre un crit` ere di erentiel: si les agents coop` erent, un nouvel agent est consid er e comme une aide pour lensemble du groupe. Lorsque ce crit` ere est v eri e, on dit que les agents collaborent ou quils sont dans une situation de collaboration. Accro tre les performances peut avoir pour objectif de simplement am eliorer un certain param` etre, tel que la quantit e de minerai rapport ee ` a la base pour des robots explorateurs. Mais, plus fondamentalement, le gain en performance sous-tend un objectif plus primordial qui est celui de la survie. La survie, quil sagisse de la pr eservation dune esp` ece, dun ecosyst` eme, dun groupe ou de chacun
77
de ses membres, constitue la nalit e ultime des syst` emes naturels o` u les probl` emes dadaptation et de reproduction sont en jeu et, en particulier, de tous les syst` emes biologiques. Par exemple, les membres dune horde coop` erent parce quil leur est plus facile de survivre et de se d evelopper en commun quindividuellement. Les ethologistes consid` erent en eet que la sp ecialisation des individus dune collectivit e et la coop eration qui lui est sous-jacente sont de bons indices de leur d eveloppement sur l echelle de l evolution. Par exemple, les colonies de fourmis les plus primitives vivent g en eralement dans des nids de quelques unit es, alors que les fourmis les plus evolu ees peuvent comporter plusieurs millions dindividus (Corbara 1991). Si au contraire lintroduction dun agent nam eliore pas les performances du groupe, cet agent sera consid er e comme un g eneur pour les activit es collectives. Dans ce cas, le second crit` ere permet n eanmoins de reconna tre quil y a coop eration m eme sil ny a pas daccroissement di erentiel de performances. Les agents coop` erent alors pour faire en sorte que la diminution de performances ne soit pas trop radicale. Cest g en eralement le cas lorsque la quantit e de ressources est limit ee: lintroduction de nouveaux agents peut avoir des cons equences n egatives sur le fonctionnement du groupe et les actions coop eratives, telles que l evitement, l etablissement de techniques de r esolution de conit, la constitution dorganisations de production et de transport de ressources ou, tout simplement, la formation de les dattentes, sont alors des r eponses collectives pour limiter la d egradation des performances individuelles et collectives. Dans ce cas, on dira que lon se trouve dans une situation de r esolution de conit. Ce type de situation est caract eristique des situations dencombrement, telles que la circulation routi` ere ou a erienne, lacc` es ` a un photocopieur par un ensemble de personnes, la recherche dun taxi ` a un a eroport, lacc` es a un point deau ou ` ` a un processeur par un ensemble de t aches, etc. Il existe de nombreuses mani` eres de r esoudre des conits. Certaines reposent simplement sur la d enition dactions permettant d eviter a priori lapparition de conits, tels que les comportements d evitement, l etablissement de dominance ou la d enition de r` egles de priorit e, dautres enn tentent dannuler les conits qui apparaissent par larbitrage, la n egociation, lutilisation des relations de dominance ou par la destruction pure et simple des participants au conit. N eanmoins, bien que distingu ees ici, les situations de collaboration et celles de r esolution de conit sav` erent souvent tr` es li ees: sil se pose des probl` emes de survie, laugmentation des performances permettra g en eralement de mieux survivre dans un univers dicile3 . De m eme l evitement de conits permet soit de faire survivre les membres du groupe (par exemple en evitant des collisions ou des luttes), soit dam eliorer les performances par rapport ` a un syst` eme sans coordination. Par exemple, un ensemble de d em enageurs forme a priori un collectif en situation de collaboration, puisque lajout dun nouveau d em enageur am eliore g en eralement leurs performances. Sils sont tr` es nombreux, ils peuvent arriver ` a se g ener dans les escaliers et les passages etroits: ils se trouvent alors dans une situation de r esolution de conits et ils doivent coop erer pour r esoudre des conits dacc` es ` a
3 Dans certains cas, lam elioration des performances individuelles peut avoir un eet n egatif sur le groupe. Si, par exemple, des herbivores sont capables de mieux exploiter leur territoire, ils peuvent aboutir ` a l epuisement de leur ressource et entra ner leur perte.
78
lespace et faire en sorte que leurs performances globales ne soient pas trop aect ees par ces probl` emes. Cette d enition de la coop eration qui sappuie totalement sur le point de vue de lobservateur, permet de caract eriser de mani` ere objective ce quest une situation de coop eration en termes dam elioration de performances, sans faire intervenir de consid erations sur ce qui se passe dans lesprit (mind) des agents. La coop eration est alors ramen ee ` a des crit` eres simples et observables. De ce fait, si lon peut d enir la coop eration intentionnelle comme une situation de coop eration dans laquelle les agents ont lintention de coop erer, ce qui suppose bien evidemment quil sagisse dagents cognitifs et capables dintentions, on parlera de coop eration r eactive lorsque les agents ne sont pas dou es dintentions explicites, mais que leur comportement collectif r epond au moins ` a lun des deux crit` eres mentionn es ci-dessus. On peut donc parler de coop eration m eme si les agents nont aucune repr esentation du monde dans lequel ils evoluent et des autres agents et donc aucune conscience des cons equences de leurs actes, ni m eme bien souvent de la pr esence des autres agents. Par exemple, des termites construisent un nid en agissant simplement en r eaction aux di erents stimuli quils re coivent. Leur technique de construction repose simplement sur des ph enom` enes perceptifs: les ouvriers d eposent des boulettes de terre et dexcr ement pr ef erentiellement l` a o` u se trouvent dautres boulettes. De ce fait, ils d eveloppent des colonnes, puis en d eposant des boulettes plut ot du c ot e o` u se trouve lodeur dautres termites, ils en viennent ` a former des arches (Wilson 1971). Dans ce cas, ils vaquent ` a leurs occupations sans quil y ait dintention ` a coop erer et m eme sans quil y ait interaction directe entre les termites, la coop eration intervenant comme un eet secondaire des actions de la population des termites dans sa totalit e (on pourra se r ef erer ` a (Theraulaz 1991)pour un d eveloppement semblable dans le cadre de la construction de nids dabeilles). Il est possible de caract eriser trois familles dindices correspondant aux trois grandes fonctions de la coop eration que sont lam elioration de la survie, laccroissement de performances et la r esolution de conits.
2.4.3
Lam elioration de la survie
Les indices de survie re` etent la capacit e dun individu ou dun groupe ` a maintenir son unit e fonctionnelle alors quil est confront e` a des forces qui tendent ` a d etruire cette unit e. On peut distinguer deux types de survie: la survie de lindividu, cesta-dire la capacit ` e pour un agent ` a persister dans son etre et la survie collective qui correspond au maintien du groupe. Si la premi` ere est relativement facile ` a identier, la seconde appara t comme etant plus dicile ` a v erier et a ` d enir. Entend-on par survie du collectif la survie de lensemble de ses membres ou la survie de lorganisation issue du rassemblement, peut- etre temporaire, dun ensemble dagents? Dans le premier cas, la situation est simple car on peut se ramener a une analyse en termes de survies individuelles, alors que dans le second cas il ` sav` ere parfois dicile de savoir ` a quel moment lorganisation collective a disparu. N eanmoins, on peut souvent se donner des crit` eres arbitraires pour d ecr eter quune organisation collective a cess e dexister. On dira par exemple quune entreprise survit tant quelle na pas d epos e son bilan ou quun groupe de robots existe tant quil en
79
comporte au moins deux. Il est possible de d enir la capacit e individuelle de survie dun agent de deux mani` eres: soit en consid erant sa probabilit e de survie dans un environnement donn e, soit en analysant son bilan energ etique, cest-` a-dire le rapport qui existe entre la quantit e d energie quil absorbe et celle quil d epense par unit e de temps: lorsque ce rapport est sup erieur ` a 1, lindividu ou le groupe sont capables de survivre et m eme eventuellement dinvestir leur surplus d energie ` a des t aches suppl ementaires non rentables imm ediatement, mais qui permettront par la suite dam eliorer encore ce bilan energ etique. La premi` ere est plus adapt ee ` a lanalyse di erentielle des comportements chez des agents tr` es simples, alors que la seconde est plus g en erale mais aussi plus compliqu ee ` a manipuler puisquelle fait intervenir des facteurs economiques et suppose que lon soit capable destimer les quantit es energ etiques entrantes et sortantes. Nous allons maintenant montrer sur un exemple dagents chasseurs comment des m ecanismes simples de coop eration peuvent amener les agents ` a augmenter leur capacit e de survie. Supposons que des agents pr edateurs puissent survivre sils sont capables de trouver ` a chaque unit e de temps une proie. La probabilit e de trouver une proie est donn ee par Pind pour une esp` ece de pr edateur et pour un environnement donn e. Si les individus sont isol es, la probabilit e de survie est alors directement egale a la probabilit ` e de trouver une proie: ind = Pchasse En se regroupant, les pr edateurs augmentent leur probabilit e de survie si les proies quils ram` enent peuvent nourrir un plus grand nombre dagents que de chasseurs. Ainsi, la probabilit e de survie pour un agent sil y a regroupement est egale ` a regroup = Pchasse k/n c o` u k repr esente le nombre dagents quune proie peut nourrir, n est le nombre dagents que contient le groupe et c est le nombre de chasseurs. La survie par regroupement est donc am elior ee par rapport ` a la survie individuelle si regroup > ind , cest-` a-dire si k c > n, ou autrement dit, si la quantit e de nourriture est plus que susante pour le nombre dagents concern es. Le regroupement, en permettant le partage des proies, a donc am elior e la capacit e de survie des agents. Alors que tous les agents consomment, seuls les chasseurs sont des producteurs. Il est possible daccro tre les performances dun tel syst` eme en augmentant la productivit e des chasseurs, soit en attrapant des proies plus grosses, soit en am eliorant la probabilit e de trouver une proie par rapport ` a un agent isol e.
2.4.4
Laccroissement des performances
Les indices de performance traduisent la capacit e dun agent ou dun groupe dagents a accomplir des t ` aches d enies par des tiers. Lobservateur peut appartenir au groupe, par exemple etre lanalyste nancier dune entreprise, ou etre ext erieur au groupe, sil sagit du programmeur de ses robots. Les indices de performance sont
80
vari es, mais ils doivent traduire les caract eristiques intrins` eques dun collectif. Par exemple, pour un groupe de robots r ecup erateurs de minerai, on pourra donner comme indice de performance la quantit e de minerai retourn ee par unit e de temps ou bien le nombre dactions (mouvements) n ecessaire pour retourner une quantit e de minerai donn ee. Pour un syst` eme de coordination dactions permettant ` a des avions d eviter toute collision, on pourra donner comme indice la d eviation entre les trajectoires eectu ees et les trajectoires id eales issues des plans de vols (Zeghal et al. 1993). Enn, si cela est possible il sav` ere toujours int eressant de revenir ` a des consid erations energ etiques et dinterpr eter les indices de performance comme des indices de rendements energ etiques. Dans le cas de robots r ecup erateurs de minerai, le regroupement associ e ` a la communication peut am eliorer la productivit e de ces robots par rapport ` a un m eme ensemble de robots non coop erants. Pour ramener du minerai, les robots doivent dabord trouver des zones de minerai avant den rapporter des echantillons. Supposons que nous nayons initialement quun seul robot. Au d epart, il cherche les zones de minerai au hasard, puis sil en d etecte une il se dirige vers elle, remplit sa benne de minerai et retourne ` a la base. On peut am eliorer son ecacit e en augmentant le nombre dagents. Avec plusieurs robots non coop erants chaque robot ne fait quaugmenter lin eairement les performances du groupe: il ny a pas daugmentation de la productivit e. Si au contraire, d` es quun robot trouve du minerai, il en avertit les autres, soit en donnant directement la position, soit en laissant des marques sur le sol (cf. chap. 8), alors il est possible de mobiliser un plus grand nombre de robots ` a la t ache de transport de minerai et donc daugmenter la productivit e de chacun. Amplication qualitative et quantitative La coop eration consiste donc ` a amplier les capacit es des agents pris isol ement et ` a augmenter leurs performances. Cette augmentation peut etre quantitative comme nous venons de le voir, mais elle peut aussi etre qualitative, cest-` a-dire rendre possibles des actions impossibles ` a r ealiser par des agents isol es. Les collaborations permettant daugmenter qualitativement les performances des agents sont essentielles car sans elles laction nest tout simplement pas possible. Supposons par exemple que lon veuille r ealiser un magazine. Un agent qui ne sait qu ecrire des articles mais ne sait pas mettre en page ni imprimer ne pourra pas ` a lui seul obtenir le r esultat d esir e. Il lui faut laide dun maquettiste et dun imprimeur. Et cela est vrai aussi pour les agents informatiques: un logiciel qui sait calculer mais ne sait pas imprimer aura besoin des services dune imprimante et dun logiciel dimpression. Les performances qualitatives des agents sont donc fondamentales pour autoriser des performances qualitatives de groupe, mais il ne faut pas n egliger les performances quantitatives car elles permettent parfois des r esultats qualitatifs impossibles sans cette collaboration. Par exemple, si un robot transporteur veut porter un objet qui p` ese 100 kg et quil ne dispose que dune force lui permettant de porter 70 kg, il sera totalement incapable daccomplir son action: si lobjet est dun seul tenant,
81
il est impossible de nen porter que 70%! De ce fait, laide dautres robots, bien que napportant quune amplication initialement quantitative, rend possible une action et transforme cette aide quantitative en collaboration qualitative. On dit alors que lon a ` a faire ` a un eet de masse, li e ` a une quantit e critique dagents. Ces ph enom` enes sont dus ` a des caract eristiques non lin eaires de la collaboration par addition des capacit es des di erents agents. Cette notion est bien connue en chimie et en physique nucl eaire o` u certaines r eactions ne peuvent avoir lieu que si la concentration atteint un certain seuil. Inversement, il est possible dobtenir des avantages quantitatifs ` a partir damplication qualitative. Cest alors la pr esence dun agent suppl ementaire dou e de comp etences nouvelles, qui entra ne une am elioration des performances de lensemble de lorganisation. Par exemple, la pr esence dun agent de police ` a un carrefour permet g en eralement dam eliorer la uidit e du trac. Cest la comp etence de contr ole que poss` ede cet agent qui permet dassurer une augmentation des capacit es du syst` eme. De m eme, dans le cas de robots transporteurs de minerai, lintroduction dun robot capable de construire des routes permettra dam eliorer la vitesse de d eplacement des robots et ainsi daccro tre les performances du groupe. On dira quil sagit dun ph enom` ene de catalyse, par analogie avec les ph enom` enes chimiques o` u la seule pr esence de certains composants chimiques, les catalyseurs, permet dam eliorer les vitesses de r eaction, ces catalyseurs nintervenant pas directement dans les r eactions. En cons equence, on peut noter que les amplications, par le biais de la coop eration, peuvent etre quantitatives ou qualitatives et que les avantages obtenus peuvent etre eux aussi qualitatifs ou quantitatifs. On obtient alors le tableau 2.2 qui repr esente les quatre situations de collaboration possibles en fonction des param` etres damplication et davantages.
Avantages Amplification Qualitative Quantitative Collaboration qualitative Effet de masse Catalyse Collaboration quantitative Qualitatif Quantitatif
Table 2.2: Les quatre formes de collaboration en fonction de lamplication produite et des avantages obtenus
2.4.5
La r esolution de conit
Du fait de leur autonomie, cest-` a-dire de leur capacit e` a d eterminer leur propre comportement, les agents sont amen es ` a se trouver dans des situations o` u leurs int er ets peuvent etre contradictoires, ils sont alors en situation objective de conits. Ces situations proviennent essentiellement dun probl` eme dacc` es ` a des ressources limit ees: deux agents d esirent au m eme moment quelque chose qui ne peut etre partag e ou pour lequel toute r epartition diminue ce que lun des agents aurait pu obtenir si lautre navait pas et e pr esent. Par exemple, lorsque deux personnes d esirent faire
82
leurs photocopies sur la m eme machine au m eme moment, elles se trouvent en situation conictuelle. Il en est de m eme de v ehicules qui se croisent ` a un carrefour, davions qui risquent dentrer en collision, de personnes qui veulent acqu erir le m eme bien, de nations qui veulent occuper le m eme territoire, de professeurs qui veulent avoir le m eme cours au m eme moment dans la m eme salle de classe ou dentreprises qui cherchent ` a obtenir de plus grandes parts de march es. Dans tous ces cas, les ressources sont limit ees et il sera n ecessaire dutiliser des techniques de r esolution de conit pour g erer cette opposition. Les situations conictuelles sont ` a la fois leet et la cause dinteractions. Elles naissent dun manque de ressources et n ecessitent des interactions suppl ementaires pour sortir de ces conits, quil sagisse de techniques de n egociation, darbitrage ou dutilisation dun r` eglement, voire de recours ` a la comp etition et ` a la force. Bien quil existe des situations pures, qui sont uniquement conictuelles ou synergiques, la plupart des situations naturelles pr esentent ` a la fois des composantes conictuelles et synergiques. Par exemple, dans une niche ecologique, les individus de di erentes esp` eces coop` erent, puisque leur survie d epend des cycles de nutrition qui font intervenir les autres esp` eces de la niche, mais ils sont aussi adversaires puisquil y a comp etition entre les esp` eces voisines pour lacquisition des ressources de l ecosyst` eme. Dune mani` ere g en erale, les syst` emes complexes sont fond es sur une int egration des situations synergiques et conictuelles, les premi` eres assurant laugmentation des performances et les secondes permettant la s election des agents concern es. Les indices conictuels traduisent tr` es simplement le nombre dagents en situation de conit (on pourra compter le nombre eectif de collisions entre des avions dans un simulateur de pr ef erence sans ou avec coordination dactions) ou le nombre dindividus voulant acc eder ` a la m eme ressource au m eme instant (le nombre de processus en attente d etre ex ecut es sur un processeur par exemple).
2.5
Les m ethodes de coop eration
Comment coop erer? Si nous avons etudi e les conditions de la coop eration, nous navons encore rien dit des moyens que lon peut mettre en uvre pour coop erer. Ces moyens, que nous appellerons m ethodes de coop eration sont au nombre de six: le regroupement et la multiplication, la communication, la sp ecialisation, la collaboration par partage des t aches et des ressources, la coordination dactions, la r esolution de conit par arbitrage et n egociation.
2.5.1
Le regroupement et la multiplication
La premi` ere m ethode est evidemment la plus evidente et, pour cela, souvent oubli ee. Elle consiste tout simplement pour les agents ` a se rapprocher physiquement, cesta-dire ` ` a constituer soit un bloc plus ou moins homog` ene dans lespace, soit un r eseau de communication permettant ` a plusieurs agents de se comporter comme sils etaient physiquement les uns ` a c ot e des autres. Par exemple, le monde animal utilise
2.5. LES METHODES DE COOPERATION
83
le regroupement pour assurer un grand nombre de besoins et en particulier pour am eliorer la s ecurit e de chacun des membres en r ealisant une d efense de groupe (la masse est plus solide, plus dicile ` a attaquer), en b en eciant dune vigilance accrue (quelques-uns font la garde pendant que les autres peuvent vaquer sans risque a ` dautres occupations) et enn en augmentant la probabilit e que, si un pr edateur attaque, ce soit lun des autres membres du groupe qui disparaisse. Vivre en communaut e facilite aussi la prise de nourriture puisquil sut quun des membres trouve quelque chose dint eressant pour que tous les autres en protent. Par exemple, d` es quun go eland plonge et ram` ene du poisson (ou des d echets de nourriture abandonn es par un bateau) les autres go elands se regroupent aupr` es du premier et b en ecient des d ecouvertes du premier. La chance de trouver un compagnon sexuel pour la reproduction est elle aussi am elior ee. La vie en groupe facilite aussi lacquisition de comportements complexes en permettant aux petits de se confronter aux adultes et davoir un grand nombre de mod` eles de comportement a leur disposition quils peuvent alors imiter. ` Enn, les groupes simplient les probl` emes de navigation comme le montrent les formations doiseaux migrateurs, les bancs de poissons ou les troupeaux d el ephants. Leort de navigation est globalement diminu e si un seul (ou un petit nombre) dentre eux seulement d ecide de lendroit o` u aller, les autres suivant le mouvement. Finalement, on peut consid erer quun groupe agit comme un organisme distribu e. Il y a les sp ecialistes de lexploration de nourriture, ceux de la d efense ou de la chasse, ceux qui assurent la reproduction et ceux enn qui guident le groupe pour quil trouve des contr ees qui seront favorables au groupe. Tous les membres agissent a la fois pour leur bien et pour celui du groupe, car, en soccupant de la soci ` et e tout enti` ere, ils soccupent deux et de leur descendance. Dautre part, la multiplication, cest-` a-dire la simple augmentation quantitative des individus dans un syst` eme donn e pr esente des avantages consid erables, tant du point de vue de laugmentation des performances que de celui de sa abilit e. Par exemple, dans le cas des robots explorateurs, le fait de disposer dun grand nombre de robots nest pas neutre quant ` a la abilit e du syst` eme. Si la performance globale en cas dabsence de pannes est egale ` a la somme des performances individuelles, cesta-dire que laugmentation di ` erentielle de performances est nulle, il nen est plus de m eme si les agents peuvent avoir des pannes. Si lon ne dispose que dun seul agent, toute panne peut avoir des cons equences f acheuses car la t ache ne pourra pas etre eectu ee. Au contraire, si lon dispose de plusieurs agents, la redondance permettra daccro tre la abilit e du syst` eme (sans quil y ait n ecessairement augmentation de la productivit e individuelle).
2.5.2
La communication
Le syst` eme de communication qui lie un ensemble dagents agit comme une sorte de syst` eme nerveux qui met en contact des individus parfois s epar es. La communication en eet agrandit les capacit es perceptives des agents en leur permettant de b en ecier des informations et du savoir-faire des autres agents. Les communications sont indispensables ` a la coop eration et il est dicile de concevoir un syst` eme
84
dagents coop erants sil nexiste pas un syst` eme permettant aux agents d echanger des informations ou de v ehiculer des requ etes. Dans les syst` emes cognitifs, les communications seectuent par envois de messages, alors que dans les syst` emes r eactifs, elles r esultent de la diusion dun signal dans lenvironnement. La communication constitue lun des moyens fondamentaux pour assurer la r epartition des t aches et la coordination des actions. Ses di erents aspects seront etudi ees au chapitre 6.
2.5.3
La sp ecialisation
La sp ecialisation est le processus par lequel des agents deviennent de plus en plus adapt es ` a leurs t aches. Il est souvent dicile de faire des agents qui soient sp ecialis es dans toutes les t aches. La r ealisation performante dune t ache suppose souvent des caract eristiques structurelles et comportementales qui ne peuvent permettre deectuer dautres t aches avec ecacit e. Par exemple, un robot tr` es adapt e dans lexcavation et la recherche de minerai en profondeur, dont toute la structure est d edi ee au forage de trous, ne sera pas n ecessairement tr` es bien adapt e au transport de minerai ou ` a sa d etection, qui n ecessite des robots capables de passer nimporte o` u pour diminuer le temps de transport. La sp ecialisation nest pas n ecessairement le fruit dun choix a priori. Des agents initialement totipotents peuvent se sp ecialiser progressivement dans laccomplissement de leur t ache, ce qui revient ` a leur associer des r oles temporaires par une sorte dadaptation individuelle. Cette sp ecialisation peut etre b en eque ` a la collectivit e en augmentant la capacit e du groupe ` a r esoudre plus rapidement un probl` eme semblable. Par exemple, dans le probl` eme du tri collectif (Deneubourg et al. 1991) dans lequel des agents doivent placer en tas des objets bleus ou rouges ` a partir dune r epartition al eatoire, leur comportement consiste simplement ` a se d eplacer al eatoirement, et, sils rencontrent un tas dobjet, a le prendre et ` ` a le red eposer pr` es dun tas de m eme couleur. A. Drogoul a montr e que, si lon utilise des agents capables de renforcer leur tendance ` a soccuper pr ef erentiellement dune couleur, alors une soci et e sp ecialis ee est plus ecace quune soci et e dagents totipotents (Drogoul 1993), du fait de la diminution des errements al eatoires r esultant dune meilleure sensibilit e` a un type particulier dobjet.
2.5.4
La collaboration par partage de t aches et de ressources
La collaboration consiste ` a travailler ` a plusieurs sur un projet, une t ache commune. Nous appellerons collaboration lensemble des techniques permettant ` a des agents de (se) r epartir des t aches, des informations et des ressources de mani` ere ` a r ealiser une uvre commune. R esoudre un probl` eme de collaboration consiste donc ` a r epondre ` a la question qui fait quoi? par rapport ` a un travail donn e. Il existe de nombreuses mani` eres de r epartir des t aches et des moyens. Dans les syst` emes dagents cognitifs, lallocation des t aches passe par des m ecanismes dore et de demande. On distingue alors les m ecanismes de r epartition centralis ee, dans lesquels un agent coordinateur centralise les ores et les demandes et les r epartit ensuite au mieux, des approches distribu ees dans lesquelles tout agent peut etre ` a
2.5. LES METHODES DE COOPERATION
85
la fois orant ou demandeur, sans quil existe un organe centralisateur. Deux techniques alors sopposent: celles qui sappuient sur des r eseaux daccointances (Gasser et al. 1987), cest-` a-dire sur des repr esentations mutuelles des capacit es de chacun et celles qui reposent sur la notion de march e, par des techniques dappel dore dont la plus connue est le r eseau contractuel (contract net) (Davis et Smith 1983). On peut etre surpris de penser quil est aussi possible de parler dallocation de t aches dans le cas dagents r eactifs. En eet, on pourrait supposer que leurs capacit es limit ees ne leur permettraient pas de mettre en uvre des m ecanismes aussi complexes que les algorithmes que nous venons danalyser. Pourtant, il est possible de faire en sorte, dune part, que les t aches soient distribu ees aux agents et, dautre part, que les agents eux-m emes se sp ecialisent dans laccomplissement de telle ou telle t ache. Le chapitre 7 est enti` erement consacr e ` a la probl ematique de la collaboration et d eveloppe les di erentes techniques dallocation et de r epartition des t aches, des informations et des ressources tant dans les syst` emes multi-agents cognitifs que r eactifs.
2.5.5
La coordination dactions
G erer un ensemble dagents suppose lex ecution dun certain nombre de t aches suppl ementaires qui ne sont pas directement productives mais qui servent simplement ` a faire en sorte que les actions productives puissent saccomplir dans les meilleures conditions. Lorsquil sagit de syst` eme monolithique, ces t aches suppl ementaires font partie du syst` eme organisationnel, mais dans le cas dun syst` eme multi-agent, cest-` a-dire dun travail n ecessairement distribu e, on parle de t aches de coordination. Celles-ci sont indispensables d` es lors que lon se trouve en pr esence dun ensemble dagents autonomes qui poursuivent leurs propres buts, la r ealisation de t aches productives entra nant avec elles tout un cort` ege de t aches de coordination sans lesquelles les premi` eres ne peuvent etre accomplies. La phase de coordination dactions est directement impliqu ee dans la d enition de lordre des actions ` a eectuer. Le chapitre 8 est enti` erement consacr e` a la probl ematique de la coordination daction dans les syst` emes multi-agents cognitifs ou r eactifs.
2.5.6
La r esolution de conit par arbitrage et n egociation
Larbitrage et la n egociation sont deux des moyens utilis es par les syst` emes multiagents pour r esoudre les conits et emp echer que des d esaccords entre individus ne se transforment en luttes ouvertes et que le syst` eme dans son entier ne d egrade ses performances. Larbitrage conduit ` a la d enition de r` egles de comportement qui agissent comme des contraintes sur lensemble des agents, mais dont le r esultat global a pour eet de limiter les conits et de pr eserver ` a la fois les individus mais surtout les soci et es dagents. Dans les soci et es humaines, le comportement des individus est contraint par un ensemble de lois et r eglementations qui r egissent les activit es sociales et limitent
86
leur activit e pour (id ealement) le bien de tous. Il existe un organe darbitrage, la justice, dont la fonction est de faire respecter ces r` egles collectives et de veiller ` a leur application. Cet organe agit aussi pour d eterminer les responsabilit es dans les conits et d ecider des punitions que les personnes jug ees coupables doivent subir. Dans les syst` emes multi-agents, lensemble des r` egles sociales agit comme un ensemble de contraintes comportementales plus ou moins internalis ees par lagent. Evidemment, ces lois ne peuvent sappliquer qu` a des agents cognitifs de tr` es haut niveau, qui disposent dune sorte de libre arbitre et sont capables de peser le pour et le contre des cons equences de leurs actions. Lorsque des agents cognitifs entrent en conit dobjectif ou de ressource, on pr ef` ere souvent ne pas recourir ` a un arbitre, mais laisser plut ot les agents r esoudre eux-m emes le conit par la recherche dun accord bilat eral au cours dun processus de n egociation. Cette forme de r esolution de conit a et e particuli` erement etudi ee par l ecole am ericaine autour de V. Lesser (Conry et al. 1988), E. Durfee (Durfee et al. 1989) et K.Sycara (Sycara 1989). Malgr e lint er et evident de ce probl` eme, nous ne le d evelopperons pas dans cet ouvrage. Mais si dans les syst` emes multi-agents cognitifs, les techniques de n egociation sont ` a lhonneur, il nen est pas de m eme des syst` emes multi-agents r eactifs qui ne peuvent entrer dans des phases de r esolution de conit de ce type. Le comportement de lagent est c abl e, lui interdisant de sortir des limites qui lui ont et e assign ees par le concepteur et lemp echant ainsi denfreindre ces lois. Tout se passe alors comme si ces lois sociales avaient et e directement compil ees dans le comportement des agents, sous la forme de m ecanismes dinhibition ou d evitement (cf. chap. 3 et 8).
2.6
2.6.1
Organisations et coop eration

Le syst` eme des activit es de coop eration
Les fonctions et les m ethodes de coop eration sont bien entendu li ees entre elles. Certaines m ethodes favorisent plus certaines fonctions, dautres r esolvent des probl` emes interm ediaires tels que la r epartition des t aches ou la coordination des actions. Il est possible de donner une vision int egr ee de ces di erents el ements sous la forme dun diagramme syst emique repr esent e gure 2.3. Ce diagramme montre dune part leur interd ependance et, dautre part, comment les objectifs de survie, de performances, de abilit e et de r esolution de conit sont assur es par des m ethodes el ementaires qui elles-m emes entra nent des probl` emes qui ne peuvent etre assur es que par des corps de techniques plus elabor es. Laugmentation de la probabilit e de survie des agents passe en particulier par laugmentation des performances du groupe, ce qui requiert lapplication de m ethodes telles que le regroupement, laugmentation du nombre des agents et la di erenciation de leurs r oles. Mais en retour ces m ethodes posent dautres probl` emes tels que la r epartition des t aches et laugmentation du nombre des conits dus ` a des probl` emes dacc` es ` a des ressources et au manque de coordination. Les m ethodes dallocation de t aches, de communication, de coordination dactions et de r esolution de conits (arbitrage, n egociation, hi erarchisation)
2.6. ORGANISATIONS ET COOPERATION
87
Survie
Amlioration des performances et de la abilit
Regroupement et multiplication
Spcialisation
problmes d'accs et d'actions
Evitement et dimininution des conits
problmes de rpartition des tches
rsout
rsout
rsout
rsout
Techniques de coordination d'actions

sert
Arbitrage, ngociations, hirarchisation
Techniques d'allocation de tches
sert sert
Communications
Architecture interne des agents
favorise/ entraine
technique
problme
objectif
Figure 2.3: Le syst` eme des activit es de coop eration. Les organisations emergent des interactions provenant des techniques dallocation de t aches (collaboration), darbitrage, de n egociation et de coordination daction.
88
servent ` a r esoudre ces probl` emes et participent de ce fait ` a laugmentation des performances du groupe. Toutes ces techniques n ecessitent d etre structur ees au sein dorganisations qui d ecrivent la mani` ere dont les agents sont positionn es les uns par rapport aux autres et comment ils peuvent eectivement travailler ensemble. Ces organisations peuvent etre pr ed enies par le concepteur ou bien emerger des interactions entre agents, comme nous le verrons au chapitre 3. La coop eration n ecessite donc la mise en uvre de m ecanismes pour am eliorer les performances du groupe an daccro tre la survie de ses membres, mais elle n ecessite en contre partie des structures sociales qui pr esentent des cons equences ` a la fois positives et n egatives pour les agents. Enn, la r ealisation eective de ces m ethodes de coop eration supposent lexistence de m ecanismes de communication ainsi que la d enition des structures internes n ecessaires aux agents pour quils interagissent.
2.6.2
Avantages
La coop eration, en favorisant les performances collectives des agents, ore ainsi un certain nombre davantages qui sexpriment soit par des am eliorations individuelles, telles que laccroissement de productivit e ou laugmentation de la probabilit e de survie des individus, soit par des am eliorations collectives telles que laccomplissement de t aches impossibles autrement ` a r ealiser. Voil` a une liste non 4 exhaustive des avantages de la coop eration : 1. Accomplir des t aches impossibles ` a r ealiser seul. Il sagit dun avantage qualitatif essentiel comme nous lavons vu. Dans ce type de situation seule la collaboration permet daccomplir laction d esir ee. 2. Am eliorer la productivit e de chacun des agents. Cet avantage quantitatif permet dobtenir ce que lon appelle economie d echelle en gestion commerciale: la production augmente alors de mani` ere plus que lin eaire en fonction du nombre dagents ce qui entra ne un accroissement de la productivit e. Nous en avons vu un exemple avec l etude des robots r ecup erateurs de minerai. Il sagit dune caract eristique essentielle de la collaboration en favorisant l emergence de nouvelles structures gr ace aux economies r ealis ees par les di erents agents. 3. Augmenter le nombre de t aches r ealis ees dans un d elai imparti ou diminuer le temps de r ealisation dune t ache. La simple multiplication du nombre des agents permet daugmenter quantitativement le nombre de t aches r ealisables et de diminuer ainsi le temps dex ecution n ecessaire ` a laccomplissement dun ensemble de t aches donn ees. Mais la collaboration peut sav erer indispensable sil existe un temps limit e pour eectuer un certain quota de t aches. Par exemple, pour ex ecuter un contrat portant sur la fourniture dun produit au bout dun d elai pr ecis, il est parfois n ecessaire que plusieurs personnes collaborent ` a la r ealisation du produit simplement pour faire face ` a lex ecution du contrat.
4 Durfee, Corkill et Lesser (Durfee et al. 1989) proposent une classication semblable dans le cadre de la r esolution distribu ee de probl` emes, mais ils ne di erencient pas les avantages qualitatifs des b en eces quantitatifs.
2.6. ORGANISATIONS ET COOPERATION
89
Cette am elioration quantitative se transforme du fait du d elai associ e au contrat en un b en ece qualitatif, linobservation du contrat entra nant toute une s erie dinconv enients. 4. Am eliorer lutilisation des ressources. En g erant mieux lutilisation de certaines ressources par collaboration, il est possible de diminuer les co uts de fonctionnement en equilibrant les besoins, ce qui revient alors soit ` a augmenter la productivit e du syst` eme (avantage 2) soit ` a am eliorer les performances et rendre possible des actions (avantage 3). Par exemple, si un programme fonctionne sur un multiprocesseur, il peut etre int eressant pour les processeurs de collaborer pour que les agents puissent equilibrer leur charge de travail sur les di erentes machines par un m ecanisme dynamique de r egulation des charges (load balancing). Il existe bien evidemment un lien tr` es etroit entre les performances collectives et les capacit es de survie individuelles. Laction des agents contribue ` a la performance collective qui en retour assure une meilleure survie des individus. Cependant, le gain de cet avantage impose des contraintes aux individus en limitant leur marge de manuvre.
2.6.3
Contraintes sociales et emergences de structures
De nombreuses structures emergent des interactions. Nous avons vu que ces structures sont n ecessaires ` a la survie du groupe car elles amplient sa capacit e. Par exemple, la le des robots r ecup erateurs de minerai emerge simplement des interactions tendant ` a am eliorer les performances du groupe. Mais ce sont ces structures qui, par leet dune boucle de r etroaction sociale, d enissent des contraintes individuelles. En eet, les m ecanismes de coop eration, en am eliorant les performances du groupe et en augmentant les capacit es de survie des individus se traduisent par l etablissement dun certain nombre de normes et contraintes sociales tendant ` a limiter l eventail des comportements possibles dun individu et ` a lint egrer dans une organisation sociale de plus en plus rigide. Par exemple, lam elioration des performances par sp ecialisation des agents, comme dans le cas du syst` eme Manta (cf. chap. 7), entra ne un appauvrissement de leurs capacit es de totipotence et diminue ainsi leur marge de manuvre. Ils deviennent alors plus d ependants des autres et donc de moins en moins capables de survivre seuls. La sp ecialisation les cantonne dans un r ole dont ils peuvent de moins en moins se lib erer et dont ils deviennent de plus en plus d ependants. Les m ecanismes sociaux mis en place pour assurer la viabilit e du groupe restreignent encore les possibilit es individuelles des agents en contraignant leurs comportements et en les poussant ` a se socialiser encore plus, cest-` a-dire ` a devenir de plus en plus sp ecialis es et d ependants des autres. Il y a donc un eet de r etroaction positive entre laccroissement de performance, laugmentation de la survie individuelle et l etablissement de contraintes sociales tendant ` a limiter les possibilit es individuelles daction, comme nous lavons vu au chapitre pr ec edent.
90
Chapter 3 Organisations multi-agents

Les syst` emes multi-agents peuvent procurer ` a celui qui commence ` a les analyser une sensation de vertige. Les param` etres quil est possible de faire varier sont si nombreux que lon a limpression de se trouver devant une innit e de cas particuliers quil sera donc impossible danalyser exhaustivement. En eet, de simples variations dans les capacit es de repr esentation des agents, dans la mani` ere de coordonner leurs actions ou sur le fait, pour eux, de pouvoir sengager ou non ` a accomplir des t aches vont produire des syst` emes multi-agents tr` es divers et dont les propri et es g en erales sont bien diciles ` a cerner. Cependant, malgr e cette diversit e, il est possible de d egager des m ethodes danalyse visant ` a caract eriser lorganisation dun SMA et d etre ainsi ` a m eme dordonner ce qui a priori semble relever du chaos.
3.1
Quest-ce quune organisation?
Lorganisation est, avec linteraction, lun des concepts de base des syst` emes multiagents. Lorsquon parle dorganisation, on suppose quil existe un ensemble dentit es formant une certaine unit e et dont les di erents el ements sont subordonn es entre eux dans un ensemble solidaire et dans une activit e convergente. Lorganisation n ecessite donc un certain ordre entre les entit es eventuellement h et erog` enes, lequel concourt a la coh ` erence du tout. D enition: Une organisation peut etre d enie comme un agencement de relations entre composants ou individus qui produit une unit e, ou syst` eme, dot ee de qualit es inconnues au niveau des composants ou individus. Lorganisation lie de fa con interrelationnelle des el ements ou ev enements ou individus divers qui d` es lors deviennent les composants dun tout. Elle assure solidarit e et solidit e relative, donc assure au syst` eme une certaine possibilit e de dur ee en d epit de perturbations al eatoires (Morin, 1977). Dans un syst` eme multi-agent, il existe de nombreuses interrelations entre les agents, par le biais de d el egation de t aches, de transfert dinformations, dengagements, de synchronisations dactions, etc. Ces interrelations ne sont possibles qu` a lint erieur
92
CHAPTER 3. ORGANISATIONS MULTI-AGENTS
dune organisation, mais r eciproquement, les organisations exigent lexistence de ces interrelations. Les organisations constituent donc ` a la fois le support et la mani` ere dont se passent ces interrelations, cest-` a-dire la fa con dont sont r eparties les t aches, les informations, les ressources, et la coordination dactions. De plus, et cest ce qui rend ce terme si dicile ` a cerner, lorganisation d esigne ` a la fois le processus d elaboration dune structure et le r esultat m eme de ce processus. Cette dualit e du terme montre quil existe toujours un aspect dynamique dans lorganisation: il nexiste, ` a proprement parler, pas dorganisations statiques. Lorganisation est n ecessairement dynamique et toujours en r eorganisation de lensemble des entit es et des liens qui unissent ces entit es.
3.1.1
Structures organisationnelles et organisations concr` etes
Mais au travers de cette dynamique, il persiste quelque chose dinvariant, que lon appellera sa structure organisationnelle (ou simplement structure sil ny a pas dambigu t e). La structure organisationnelle est ce qui caract erise, sur un plan abstrait, une classe dorganisation. A linverse, lorganisation concr` ete (ou simplement organisation) est une instanciation (au sens des langages objets) possible dune structure organisationnelle, une r ealisation comprenant lensemble des entit es qui participent eectivement ` a lorganisation ainsi que lensemble des liens qui associent ces agents ` a un moment donn e1 . A toute organisation concr` ete, il est possible dassocier une structure organisationnelle, mais une m eme structure organisationnelle peut servir de base ` a la d enition dune multitude dorganisations concr` etes. En appliquant aux organisations la d enition de P. Delattre (Delattre 1968) pour les structures, on peut dire quune structure organisationnelle est d enie par la double donn ee: 1. dun ensemble de classes dagents caract eris ees par les r oles aect es aux agents, 2. de lensemble de relations abstraites existant entre ces r oles. Enn, on classera les structures organisationnelles en fonction de leur capacit e a sadapter et ` ` a evoluer en fonction des besoins. Pour obtenir une organisation concr` ete, il est n ecessaire dy ajouter lensemble des agents appartenant aux di erentes classes et de d ecrire les relations concr` etes qui existent entre les agents, cest-` a-dire dinstancier lorganisation abstraite. La gure 3.1 illustre cette di erence. La structure organisationnelle O est d ecrite par lensemble des r oles qui peuvent y etre tenus (A, B, C ) alors que les structures concr` etes comprennent un grand nombre dentit es concr` etes (A1 , A2 , B1 , ...), les Ai etant associ ees au r ole A. Les liens entre les entit es concr` etes (g1 , g2 , h1 , h2 , ...) correspondent aux liens abstraits qui existent entre les entit es abstraites (g, h, ...). Par exemple, le lien abstrait g qui lie lentit e abstraite A a B sexprime concr` ` etement dans lorganisation concr` ete O1 sous la forme de deux
1 Ces termes ne sont pas standardis es. Signalons en particulier que Maturana et Varela (Maturana et Varela 1987) appellent organisation ce qui est appel e ici structure organisationnelle et structure ce qui est intitul e organisation. P. Delattre propose une autre d enition en appelant structure relationnelle les structures organisationnelles et structure totale les organisations concr` etes.
3.1. QUEST-CE QUUNE ORGANISATION?
93
liens g1 et g2 qui relient respectivement A2 ` a B1 et A1 ` a B1 , alors que dans O2 des liens g1 et g2 semblables relient respectivement A1 ` a B1 et A1 ` a B2 .
u
Legend
Abstract entity Concrete entity
f C h B
v Organisational structures O
A g
A2 A 1 u1 g1
f1 B1 h1 h2
C1 v3
v1 v2
v4 C3
u1 A1
f1
C1
g2 O1
C2
v2 g1 B 1 h1 v1 g2 h2 C2 B2 O2
Concrete organisations
Figure 3.1: Organisations et structures organisationnelles
3.1.2
Les niveaux dorganisation
Lint er et de la notion dorganisation est de pouvoir int egrer ` a la fois la notion dagent et celle de syst` eme multi-agent. En eet, du point de vue du concepteur, un agent est non seulement un individu, mais aussi un assemblage de composants. De m eme, un syst` eme multi-agent peut etre consid er e` a la fois comme une composition dagents et comme une unit e, lorsquon etudie les interactions de ce syst` eme avec un autre dispositif technique. La notion de niveau dorganisation permet de comprendre lembo tement dun niveau dans un autre. De m eme quen biologie une cellule est consid er ee comme une organisation de macromol ecules et comme un etre individuel pour lorganisme multicellulaire dont elle fait partie, de m eme, on pourra consid erer quune organisation est une agr egation d el ements de niveau inf erieur, et un composant dorganisations de niveau sup erieur (g. 3.2). On appellera composant el ementaire (ou module) les unit es de niveau inf erieur consid er ees comme ind ecomposables (tout du moins par le biais de cette analyse) et syst` eme multi-agent g en eral le niveau sup erieur, cest-` a-dire une organisation ne faisant pas partie (dun certain point de vue) dune organisation de plus haut niveau. On distinguera enn les organisations (ou entit es) individuelles, qui sont consid er ees de lext erieur comme des etres individu es (cest-` a-dire comme des agents), et les organisations (ou entit es) collectives, qui sont compos ees dun ensemble d etres individu es, sans quelles soient n ecessairement individu ees elles aussi.
94

niveau n+2
niveau n+1
niveau n
Figure 3.2: Les agents de niveau n sont regroup es en organisations qui au niveau n + 1 peuvent etre consid er ees comme des entit es individuelles. Inversement, des entit es individuelles de niveau n + 1 peuvent etre vues comme des organisations de niveau n. Le processus peut se r ep eter sur un nombre quelconque de niveaux. La di erence entre entit es individuelles et collectives r eside avant tout dans lexistence de ce que les biologistes appellent une membrane: le fait quune entit e individuelle s epare son espace int erieur de lespace ext erieur de telle mani` ere que les interactions entre les composants internes et les entit es externes ne puissent seectuer que dans des limites tr` es pr ecises dict ees par des composants sp eciques charg es des entr ees-sorties. Au contraire, les entit es collectives ne font pas (ou peu) ce type de di erence et elle ne peuvent pas appara tre naturellement comme constituant un individu. Les agents sont donc avant tout des entit es individuelles alors que les syst` emes multi-agents sont essentiellement des entit es collectives. N eanmoins, un agent compos e lui-m eme dun ensemble dagents sera consid er e` a un certain niveau comme une organisation individuelle et, au niveau inf erieur, comme une organisation collective.
3.1.3
Comment etudier une organisation?
Devant lensemble des organisations possibles, la d emarche danalyse doit etre structur ee. Cest pourquoi nous distinguerons trois volets: 1. Lanalyse fonctionnelle, qui d ecrit les fonctions dune organisation multi-agent dans ses di erentes dimensions. 2. Lanalyse structurale, qui distingue les di erentes formes dorganisation possibles et identie quelques param` etres structuraux essentiels. 3. Les param` etres de concr etisation, qui traitent du passage dune structure organisationnelle ` a une organisation concr` ete et posent la dicile question de la r ealisation eective dune organisation multi-agent.
3.2. LANALYSE FONCTIONNELLE
95
3.2
Lanalyse fonctionnelle
Lanalyse fonctionnelle dune organisation conduit ` a lidentication des principales fonctions que les composants de cette organisation doivent remplir. Dans le cadre dune telle analyse, une organisation peut etre vue comme un syst` eme de r oles, chaque r ole etant d eni par lensemble des propri et es que les agents ayant ce r ole manifestent dans cette organisation. An daner cette analyse, nous verrons quil est possible de d evelopper ces fonctions dans plusieurs dimensions danalyse qui correspondent aux di erents points de vues par lesquels une organisation peut etre etudi ee.
3.2.1
Les fonctions dune organisation
Les r oles d ecrivent la position des agents au sein dune organisation ainsi que lensemble des activit es quil sont cens es exercer an que lorganisation puisse accomplir ses objectifs. Ils caract erisent ainsi les fonctions que les agents remplissent, ind ependamment de leur structure interne et des m ecanismes mis en uvre. Par exemple, un agent qui g` ere les demandes dex ecution et les r epartit aux agents comp etents aura un r ole de m ediateur, un agent qui d etermine les actions ` a entreprendre aura un r ole de planicateur, un agent qui choisit parmi un ensemble dactions possibles sera appel e d ecideur, un agent qui rend un service ` a un autre, consid er e comme un client, aura un r ole de fournisseur et un agent dont la fonction principale est ex ecutive sera un ex ecutant. Ces r oles sont d enis par lensemble des fonctions n ecessaires ` a une organisation pour quelle sadapte ` a ses nalit es (et en particulier aux objectifs et aux besoins de son concepteur) et ` a son environnement. Ces r oles ne sont pas n ecessairement xes, mais peuvent evoluer avec la dynamique de lorganisation. Par exemple, un ex ecutant, par suite dune evolution de lorganisation, peut se retrouver m ediateur, d ecideur ou client. De m eme, un fournisseur, pour un ensemble donn e dactivit es, peut etre consid er e comme un client pour dautres t aches. Chaque agent dispose donc dun ensemble de r oles qui caract erisent les di erents services abstraits quil peut remplir au sein dune organisation, ces r oles d eterminant des positions dans lensemble des relations abstraites qui peuvent sexprimer entre les agents. Les r oles sont regroup es en sous-syst` emes2 , cest-` a-dire en sous-organisations de lorganisation principale, caract eris es par leurs fonctions qui peuvent etre centralis ees ou au contraire distribu ees parmi les composants dune organisation. Voici les six fonctions principales dune organisation et quelques-uns des r oles associ es: 1. La fonction repr esentationnelle comprend lensemble des fonctions de mod elisation de lenvironnement et des autres organisations ainsi que la m emorisation des ev enements qui ont pu aecter lorganisation. Cette fonction est particuli` erement d evelopp ee dans les organisations individuelles cognitives (cesta-dire les agents cognitifs) qui disposent dune repr ` esentation interne de leur
2 Il faut prendre ici les termes syst` eme et sous-syst` eme dans lacception quils ont lorsquon parle de syst` eme circulatoire, respiratoire ou v eg etatif du corps humain.
96
CHAPTER 3. ORGANISATIONS MULTI-AGENTS environnement quil leur est possible de manipuler an de planier les actions quelles devront entreprendre. Dans une organisation collective, la fonction repr esentationnelle peut etre, comme pour les autres fonctions, distribu ee parmi tout un ensemble dagents. Dans les syst` emes dinformation des entreprises, par exemple, cette fonction est particuli` erement d evelopp ee, puisquelle correspond ` a la conservation et ` a larchivage de toutes les informations v ehicul ees dans lentreprise. Les syst` emes de gestion electronique de documents ne font quam eliorer cette fonction. Le r ole associ e ` a la fonction repr esentationnelle est celui darchiviste. 2. La fonction organisationnelle se rapporte ` a tout ce qui a trait ` a la gestion de lactivit e dune organisation et, en particulier, ` a la planication, lallocation et le suivi de t aches, la coordination des actions ainsi que la gestion des engagements. Cette fonction est evidemment essentielle et cest celle qui dans le domaine des syst` emes multi-agents a et e plus particuli` erement etudi ee. De nombreux r oles sont associ es ` a cette fonction, en particulier ceux de client, de fournisseur, de m ediateur, de planicateur et de coordinateur. Cette fonction, ainsi que les r oles associ es, sera plus particuli` erement trait ee dans le chapitre 7. 3. La fonction conative (du latin conari, se pr eparer ` a, entreprendre) se rapporte aux sources, aux limites et ` a la s election des activit es des organisations. Cette fonction se divise elle-m eme en trois sous-fonctions: celle des motivations ou fonction motivationnelle qui d ecrit comment les buts ou tendances sont form es, quil sagisse de demandes internes (besoins, d esirs, pulsions) ou externes (demandes des autres agents, pressions sociales); celle de l elaboration des contraintes qui d ecrit les normes et inhibitions qui viennent limiter l eventail des actions possibles de lorganisation et enn celle de la prise de d ecision gr ace ` a la fonction d ecisionnelle qui soccupe, en liaison avec le syst` eme organisationnel, de l evaluation et du choix des buts ` a satisfaire et des t aches ` a entreprendre. Chaque sous-fonction d enit un ensemble de r oles associ es, dont le plus connu est celui de d ecideur associ e` a la fonction d ecisionnelle. 4. La fonction interactionnelle sert ` a faire le lien entre une organisation et ce qui lentoure. Cest elle qui g` ere les activit es dinteractions avec son environnement ainsi que lensemble des communications avec les autres organisations. Elle assure ainsi toutes les fonctions dentr ee-sorties et dinterface. Elle se compose de deux sous-fonctions, la fonction perceptive, qui se charge de lacquisition dinformations provenant de lext erieur, et la fonction ex ecutrice qui soccupe de laccomplissement des actions choisies par le syst` eme conatif et mises en uvre par le syst` eme organisationnel. Les r oles associ es ` a cette fonction sont ceux dagents dinterface (observateur, ex ecutant et communicateur). 5. La fonction productive ou op eratoire concerne lensemble des activit es primitives qui doivent etre mises en uvre pour r esoudre un probl` eme ou effectuer un travail. Cette fonction d epend de lapplication: un SMA d edi e ` a
97
lanalyse linguistique, qui comprend des agents capables de faire de lanalyse lexicale, syntaxique, s emantique ou pragmatique, naura evidemment pas la m eme fonction productive quun ensemble de robots explorateurs, qui doivent explorer, forer et transporter des echantillons de minerai. Il ny a pas de r ole caract eristique associ e ` a cette fonction, du fait quelle d epend du domaine dapplication. 6. La fonction v eg etative ou (conservative) traite de la conservation de la structure et des agents, de lacquisition et de lentretien des ressources et des t aches employ ees pour maintenir et reproduire lorganisation. Par exemple, pour un animat (cf. chap. 5), manger, se soigner, se reproduire constituent les comportements de base g er es par le syst` eme v eg etatif. Pour une organisation collective, la fonction v eg etative traite ` a la fois des apports energ etiques et de l elimination des d echets, mais aussi de lint egration de nouveaux agents, par recrutement ou reproduction. Cette fonction, que les militaires appellent lintendance, soccupe aussi des r eparations qui doivent etre entreprises pour que la structure organisationnelle perdure. Evidemment, toutes ces fonctions sont li ees, comme le sont les syst` emes nerveux, circulatoire, reproducteur et digestif des etres vivants, et sont n ecessaires au bon fonctionnement dune organisation, m eme si certaines sont r eduites ` a leur plus simple expression, comme la fonction repr esentationnelle, qui sav` ere quasi inexistante pour les agents r eactifs, ou distribu ee dans un ensemble dagents, comme la fonction d ecisionnelle dans un syst` eme multi-agent r eactif. La gure 3.3 illustre les relations principales qui associent ces syst` emes entre eux. Prenons un exemple simple. SupVgtatif
Conatif
Reprs.
Product.
Organisationnel Perceptif
Excutif
Figure 3.3: Repr esentation sch ematique des di erentes fonctions dune organisation. Ce sch ema sapplique aussi bien ` a des agents qu` a des syst` emes multi-agents. posons que lon r ealise un robot, Clotaire, capable daller chercher des objets et de les ramener. Peut- etre est il capable de d etecter certains stimuli, de reconna tre des outils tels quune pince ou un marteau sils se trouvent devant lui, ou didentier la pi` ece dans laquelle il se trouve (` a partir, par exemple, dun codage infrarouge ou
98
dune cam era et dun syst` eme de reconnaissance de formes). Pour ce faire, il doit disposer dorganes de perception et de modules de reconnaissances des formes. A lautre bout de la cha ne, on trouve les primitives daction (aller tout droit, tourner a gauche, tourner ` ` a droite, prendre un objet, le d eposer, etc.) et les m ecanismes de r eception et denvois de messages. Tout ceci constitue sa fonction interactionnelle. Si son r ole, ` a lint erieur dune organisation de plus haut niveau, est de transporter des objets, sa fonction productive sera compos ee dun ensemble dop erations de transport telles que aller dans la pi` ece X , ou rapporter lobjet X qui se trouve dans la pi` ece P . Sa fonction organisationnelle sera charg ee de la planication des t aches. Cest elle qui assure le suivi des op erations et en r ef` ere au syst` eme conatif sil y a un probl` eme. Par exemple, si lon demande ` a Clotaire de ranger tous les outils, les composant charg es de la fonction organisationnelle planieront les actions ` a accomplir, en consid erant les op erations de transport de sa fonction productive comme des primitives. Il en viendra peut etre ainsi ` a d ecomposer cette t ache en un ensemble dactions plus el ementaires telles que: aller chercher la pince qui se trouve dans la remise et lapporter dans le hangar, puis aller chercher le marteau qui se trouve dans le hangar et lapporter dans latelier. Il faudra ensuite, dans le cadre de la fonction organisationnelle, quil assure le suivi des t aches, en v eriant quelles sont bien r ealis ees. La fonction repr esentationnelle g` ere ses repr esentations du monde, lesquelles sont directement utilis ees par les m ecanismes de planication. Par exemple, si Clotaire est eectivement un agent cognitif, sa fonction repr esentationnelle sera caract eris ee par lensemble des m ecanismes qui tentent de mettre en ad equation ses repr esentations et la structure de lenvironnement, en construisant une carte du lieu o` u il doit se d eplacer, en lui indiquant les passages ouverts ou ferm es, en m emorisant lemplacement des outils, etc. Cette fonction m emorise aussi les di erents savoirfaire de lagent, cette connaissance pouvant etre mise ` a prot lors de l elaboration des plans. En eet, alors que la fonction productive est concern ee par lex ecution des plans compil es, la fonction repr esentationnelle poss` ede une description symbolique de ces op erations an que les composants li es ` a la fonction organisationnelle puissent planier les nouvelles op erations. Enn, la fonction conative est responsable de l evaluation des situations et des prises de d ecisions. Par exemple, il nest pas s ur que Clotaire accepte de ranger tous les outils sil se trouve d ej` a en train daccomplir dautres t aches quil juge plus importantes. En particulier, si son niveau d energie tombe ` a un trop bas niveau, comme le lui indique les organes de son syst` eme v eg etatif, il laissera tomber les t aches en cours pour tenter de r ecup erer un niveau d energie correct avant de poursuivre son activit e productrice. Cet exemple nest pas propre ` a un seul agent. Supposons quune equipe dagents soit charg ee de transporter des objets, les di erentes fonctions seront r eparties parmi les agents. Certains seront plus charg es du transport eectif des objets et constitueront ainsi la fonction productive de cette equipe. La fonction organisationnelle sera r ealis ee par lensemble des agents charg es de la planication des actions, du suivi de leur accomplissement, de la coordination des actions de transports et, dune
99
mani` ere g en erale, de ladministration de l equipe. La fonction repr esentationnelle pourra etre totalement distribu ee parmi les agents de transport ou bien, au contraire, centralis ee dans quelques agents qui tiendront ` a jour une carte des lieux avec la position des objets et des agents. Les agents charg es de la fonction interactionnelle se consacreront aux communications (liaison radio, gestion des t el ecommunications, etc.) avec les autres equipes et avec la base. Enn, les agents sp ecialis es dans la fonction conative d etermineront les priorit es dans les objectifs et d ecideront des t aches g en erales ` a accomplir.
3.2.2
Les dimensions danalyse
L etude des fonction pr ec edentes, et donc des r oles des agents, peut se d ecliner selon plusieurs dimensions: 1. La dimension physique () traite de limpl ementation, de larchitecture de lorganisation et de ses ressources personnelles. Cette dimension r epond ` a la question: Comment ceci est-il r ealis e explicitement ` a lint erieur de lorganisation? Sil nest pas indispensable de r epondre ` a cette question lorsquon ne sint eresse qu` a lanalyse comportementale dune organisation, un concepteur de SMA ne peut faire limpasse sur cette question, car lexistence dune repr esentation op eratoire directement ex ecutable est ` a la base de linformatique et dune mani` ere g en erale des sciences synth etiques visant ` a la constructions dartefacts. 2. La dimension sociale ( ) concerne la place, et donc le r ole, dune organisation dans une organisation de plus haut niveau. Cette dimension soccupe aussi de laspect social des activit es dune organisation, cest-` a-dire de ses capacit es a r ` epondre ` a des besoins ou fonctions g en erales n ecessaires au bon fonctionnement de lorganisation de plus haut niveau dans laquelle elle se trouve. 3. La dimension relationnelle () soccupe des interactions, des echanges quune organisation peut avoir avec dautres organisations de m eme niveau, de ses communications et de leur coordination. Cette dimension r epond ` a la question: Avec qui, pourquoi et de quelle mani` ere une organisation interagit-elle avec dautres organisations?. Cest ` a ce niveau que sont d enis les protocoles dinteraction, cest-` a-dire les encha nements de comportements mutuels que des organisations produisent lors de leur echanges. 4. La dimension environnementale () est li ee aux capacit es dune organisation a agir, percevoir et raisonner sur le monde environnant. Cest ` ` a ce niveau que sont d enies ses capacit es dinteractions avec le monde, ses comp etences proprement instrumentales. Cette dimension r epond donc ` a la question: Quelles sont les possibilit es daction dune organisation, quelles sont ses expertises techniques et de quelle mani` ere est-elle capable dagir sur le monde? 5. La dimension personnelle ou dimension du self ( ) repr esente tout ce qui a trait ` a lorganisation en tant que telle et en particulier ` a ses aspects m eta:
100
CHAPTER 3. ORGANISATIONS MULTI-AGENTS la repr esentation de soi, lacquisition des connaissances, la pr eservation de sa structure et lactivit e proprement autopo etique dune organisation.
La gure 3.4 illustre ces dimensions selon deux axes. Les dimensions relationnelles et environnementales se situent sur un m eme plan horizontal car les relations quun agent entretient avec les autres agents ou avec lenvironnement sont eectu ees au m eme niveau que lagent lui-m eme. Laxe vertical correspond aux dimensions sociales et physiques. Ces deux dimensions sont ` a la fois oppos ees et compl ementaires si lon consid` ere un agent comme une organisation de niveau sup erieur par rapport ` a ses composants, consid er es comme des agents de niveau inf erieur.
Social
Relationnel
Self
Environnemental
Physique
Figure 3.4: Une organisation peut etre analys ee selon cinq dimensions: sociale, relationnelle, physique, environnementale et personnelle (self). Dans ce cas, la dimension sociale des agents composant recouvre la dimension physique de lagent soci et e, comme le montre la gure 3.5. En eet, la fonction sociale quun agent composant assure au sein dun agent soci et e est un point de vue compl ementaire ` a celui de la dimension physique de lagent soci et e, qui voit ses composants comme des organes lui permettant dassurer son comportement et dassurer sa viabilit e. Enn, la dimension personnelle est au centre de ces oppositions, le lieu r eexif ` a partir duquel lagent peut se construire en tant que sujet agissant au milieu dautres agents.
3.2.3
Analyse dimensionnelle dune organisation
Lanalyse fonctionnelle dune organisation le long des dimensions que nous venons de mentionner permet de constituer des grilles danalyses pour donner un aper cu assez pr ecis de la nature dune organisation. Il est en eet possible de projeter les six fonctions dune organisation sur ces cinq dimensions. Fonction repr esentationnelle La dimension repr esentationnelle/physique repr esente tout ce qui se rapporte a la mani` ` ere dont les connaissances sont repr esent ees ainsi qu` a larchitecture inf erentielle utilis ee. Il repr esente la mani` ere dont sont impl ement es les m ecanismes de raisonnement (moteurs dinf erences, tableaux noirs avec d eclenchement
Socit
101
Self
niveau n+1
Composants

Self
Self
niveau n
Figure 3.5: La dimension sociale du niveau n est directement li ee ` a la dimension physique du niveau n + 1. Les agents de niveau n sont les composants des agents du niveau n + 1 et, inversement, les agents de niveau n + 1 constituent la soci et e dans laquelle les agents de niveau n evoluent. sur ev enements, programmes en Lisp ou en C++, etc.). La dimension physique correspond ` a ce que Newell appelle le niveau du symbole (symbol level) par opposition au niveau conceptuel (knowledge level) (Newell 1982) et agit donc comme une dimension dimpl ementation sur laquelle se projette les autres dimensions. La dimension repr esentationnelle/sociale concerne les repr esentations quune organisation, et notamment un agent cognitif, se fait de la soci et e dans laquelle elle se trouve, cest-` a-dire les mod` eles lui permettant de comprendre les buts collectifs, les aspirations et les normes sociales qui la contraignent. Peu de syst` emes multi-agents impl ementent cette dimension. La dimension repr esentationnelle/relationnelle a trait aux repr esentations des autres organisations. Lorsque lorganisation est un agent, on parle alors de repr esentations des accointances, cest-` a-dire des repr esentations des agents quun agent conna t et avec lesquels il peut communiquer directement. Cette dimension a particuli` erement et e trait ee en IAD depuis les travaux de L. Gasser sur Mace (Gasser et al. 1987). La repr esentation des objets du monde environnant et des lois de lunivers ambiant seectue dans la dimension repr esentationnelle/environnementale. Lorsque lorganisation est un agent, cette dimension peut faire d efaut si lagent est un agent logiciel ou au contraire un agent purement r eactif. Si lorganisation est un syst` eme multi-agent, la dimension environnementale correspond
102
CHAPTER 3. ORGANISATIONS MULTI-AGENTS ` lensemble des interactions que le syst` a eme entretient avec ce qui nest pas le syst` eme, par le biais de capteurs ou dagents dinterfaces.
La dimension repr esentationnelle/personnelle porte sur les repr esentations de soi, cest-` a-dire sur les croyances quun agent d etient sur ses propres capacit es, sur son savoir-faire, sur ses plans et ses buts, etc. A ce niveau tout ce qui est normalement inconscient pour une organisation devient explicite, ce qui signie quil lui est ensuite possible de raisonner dessus. Fonction organisationnelle La dimension organisationnelle/physique d ecrit larchitecture et limpl ementation du m ecanisme de contr ole, de planication et de gestion des activit es de lorganisation. La dimension organisationnelle/sociale porte sur la planication des t aches sociales, cest-` a-dire sur la d enition des r oles permettant ` a une organisation de niveau inf erieur daccomplir des t aches utiles pour lorganisation de niveau sup erieur. La dimension organisationnelle/relationnelle est tr` es etudi ee en IAD car il sagit de la planication des interactions et de la coordination des actions et des communications. Une grande partie des travaux portant sur la coop eration et la coordination daction sont situ es sur cette dimension. En particulier, les protocoles dappel dore et de coordination dactions font partie de cette dimension. La dimension organisationnelle/environnementale traite de la planication et du contr ole de lex ecution des actions dans lenvironnement, ind ependamment des probl` emes dinteraction avec les autres agents. Comment disposer des caisses en piles? Comment aller dun lieu ` a un autre? sont des questions qui demandent des r eponses qui doivent etre elabor ees le long de cette dimension. La dimension organisationnelle/personnelle correspond aux probl` emes de m etaorganisation, cest-` a-dire au contr ole et ` a la gestion des t aches internes. Pour un agent, cette dimension recouvre ce que lon traite sous le terme de contr ole de niveau m eta (Pitrat 1990; Maes et Nardi 1988; Ferber 1989). Fonction conative La dimension conative/physique de la fonction conative correspond ` a limpl ementation de la production et de la gestion des pulsions, des contraintes et des tendances ou buts. La dimension conative/sociale correspond aux buts collectifs et aux contraintes sociales quune organisation de niveau sup erieur se donne et quelle retransmet ensuite ` a ses membres. Par exemple, marquer des buts pour une equipe de football est un objectif collectif: chaque joueur va tenter de faire en sorte que
103
le groupe marque des points m eme sil ne cherche pas ` a mettre lui-m eme le ballon dans les buts. Mais par ses actions, qui sinscrivent dans une d emarche collective, il va permettre ` a dautres de marquer et ainsi daccomplir les buts collectifs du groupe. Il en va de m eme des normes qui sont g en eralement etablies sur la base dune d ecision collective. Les lois, par exemple, sappliquent a tous et contraignent ainsi les actions possibles de chacun. Ces contraintes, ` qui sont un eet secondaire des interactions entre agents, agissent comme un amplicateur social tendant ` a sp ecialiser le r ole que les agents d etiennent dans une organisation sociale (cf. chap. 7). La dimension conative/relationnelle porte sur les demandes et contraintes des autres organisations qui entra nent la production dobjectifs personnels. Les demandes sont g en eralement des requ etes pour que lorganisation receveuse accomplisse des actions ou fournisse des informations ` a lorganisation demandeuse. Lorsque les organisations sont des agents, ce type de comportement est d ecrit par des m ecanismes de communication et en particulier par la th eorie des actes de langages (cf. chap. 6) lorsquil sagit dagents cognitifs. Cest le long de la dimension conative/environnementale que sont d enies les sources de d esirs et de r epulsions quune organisation rencontre dans le monde environnant. Ceci est plus particuli` erement clair pour les animats. Pour un pr edateur, la proie est une source de d esir, pour un robot explorateur, cest le minerai. Il est possible aussi dinduire des d esirs indirects. Pour un robot nettoyeur par exemple, on pourra faire en sorte que les d echets soient des sources de d esir an quils motivent son action de nettoyage. A linverse, certains objets ou agents peuvent etre des sources de r epulsion. La proie fuit le pr edateur, un avion fuit lautre appareil avec lequel il risque dentrer en collision. Cela signie que les objectifs (tant positifs que n egatifs) peuvent se trouver dans lenvironnement en liaison avec les besoins et buts internes de la dimension suivante. Cest au travers de la dimension conative/personnelle que sont elabor ees les motivations qui viennent des besoins internes de lorganisation ` a partir g en eralement des informations provenant de son syst` eme v eg etatif: n ecessit e de trouver des ressources energ etiques, besoin de protection et de reproduction notamment. Fonction interactionnelle La dimension interactionnelle/physique d ecrit limpl ementation des syst` emes dentr ees/sorties compos es de m ecanismes de communications, de perceptions et daction. Lorsque lorganisation est un agent, cest ` a ce niveau que sont d ecrits ses capteurs et ses actionneurs. Cest ici aussi que sont trait es les probl` emes de bande passante dans les communications et dune mani` ere g en erale tout ce qui concerne les couches inf erieures des t el ecommunications. Ceci ne fait pas partie du domaine de la k en etique, mais renvoie aux recherches men ees en robotique et dans les r eseaux de t el ecommunications.
104
La dimension interactionnelle/sociale porte sur les primitives dinteraction entre lindividu et lorganisation ` a laquelle il appartient. Cette dimension, qui nest g en eralement pas impl ement ee dans les SMA, comprend les m ecanismes d election, de saisines de tribunaux, etc. et dune mani` ere g en erale tous les protocoles qui, dans les soci et es d emocratiques, assurent aux individus une certaine capacit e daction sur la soci et e prise comme un tout. La dimension interactionnelle/relationnelle porte sur la d enition des primitives de communication, cest-` a-dire sur la description des types de messages envoy es et accept es par les agents. La dimension interactionnelle/environnementale d ecrit lensemble des primitives de perception et daction disponible pour un agent. Cest par ce sous-syst` eme que seectue (sur le plan conceptuel et logique, les probl` emes mat eriels etant g er es par la dimension physique) lanalyse et le ltrage des perceptions, ainsi que la d enition de ses possibilit es dactions. La dimension interactionnelle/personnelle est en g en eral inexistante dans les SMA actuels. Elle correspondrait ` a la possibilit e (pour linstant humaine) de se parler ` a soi-m eme et dagir sur son propre corps par lext erieur. On peut aussi penser ` a un robot qui serait capable dagir sur lui-m eme pour se r eparer ou modier certaines de ses fonctionnalit es. Fonction productive (op eratoire) La fonction productive d ecrit lensemble des t aches quune organisation sait accomplir, cest-` a-dire ` a la fois lensemble du savoir-faire quelle peut appliquer dans le monde et lensemble des objets quelle peut produire. La fonction productive repr esente la raison d etre dune organisation, cest-` a-dire sa fonction par rapport au projet qui a amen e sa r ealisation, ou son r ole par rapport ` a lorganisation de niveau sup erieur. Cest le long de cette dimension quest particuli` erement nette larticulation entre les di erents niveaux dorganisation. Une fonction consid er ee comme productive pour une organisation de niveau n sert souvent ` a la d enition dune fonction dune autre nature au niveau n + 1. Par exemple, si lon peut consid erer que la fonction de production dun groupe dagents chasseurs est de ramener de la nourriture, cette fonction peut etre d ecrite au niveau de la soci et e` a laquelle ces agents appartiennent comme une fonction v eg etative. De m eme, des agents sp ecialis es en planication daction pour le compte dautrui sont d ecrits comme ayant une fonction productive de planication, alors quau niveau de la soci et e, cette fonction est consid er ee comme organisationnelle. De ce fait, les fonctions productives de niveau n deviennent g en eralement des r oles non productifs au niveau n. Seules certaines activit es sont consid er ees comme productives sur plusieurs niveaux. Par exemple, un robot r ecup erateur de minerai sur une base lunaire ou martienne poss` ede la fonction productrice de r ecup eration de minerai qui devient, au niveau n + 1, un el ement de la fonction productive fondamentale de la soci et e de robots qui consiste justement ` a
105
extraire et ` a produire du minerai. N eanmoins, il existe toujours un niveau o` u ces fonctions deviennent partie int egrante dune organisation de niveau n + 1 et perdent leur caract` ere producteur. Par exemple, si lon se situe au niveau de lensemble des etres humains dans son ensemble, la r ecup eration de minerai peut etre int egr ee ` a des fonctions v eg etatives de tr` es haut niveau (production et consommation de biens permettant ` a une soci et e de mieux survivre). La dimension productive/physique d ecrit limpl ementation des t aches productives, le m ecanisme permettant leur activation et leur r egulation si n ecessaire. Lorsque ces t aches produisent des objets physiques, cette dimension ne fait pas partie du domaine de la k en etique. La dimension productive/sociale d ecrit lensemble des t aches eectu ees pour le compte dune organisation de niveau sup erieur, telles que les t aches de direction, de gestion et dadministration dune organisation. La dimension productive/relationnelle porte sur la d enition des t aches relationnelles, qui assurent la coop eration et la coordination dactions entre organisations de m eme niveau. Attention, le long de la dimension relationnelle, il faut bien distinguer la fonction relationnelle/organisationnelle de la fonction relationnelle/productive. La premi` ere porte sur la mani` ere dont les composants dune organisation sont li es et donc sur les communications internes ` a une organisation. La seconde porte sur lensemble des fonctionnalit es suppl ementaires attribu ees ` a un composant pour que lorganisation puisse communiquer avec dautres organisations de m eme niveau. Par exemple, dans larm ee, un radio ou sp ecialiste en communication soccupe du traitement des messages sur un plan qui nest pas accessible aux autres (usage dun mat eriel sp ecialis e, communications cod ees ind echirables pour qui ne conna t pas le code) et il se charge de recevoir et transmettre, de coder et d ecoder les messages qui sont echang es avec dautres groupes. La dimension productive/environnementale concerne lensemble des t aches permettant ` a une organisation d etre experte dans des activit es qui touchent a ` son environnement, quil sagisse de t aches de diagnostic, de conception ou de contr ole. Les agents sp ecialistes dun syst` eme multi-experts sont essentiellement caract eris es par des t aches productives qui se d eploient le long de cette dimension. La dimension productive/personnelle concerne les t aches dauto-modication dun agent et notamment celles qui permettent lacquisition personnelle de nouvelles expertises ou de nouvelles capacit es. Fonction v eg etative (conservative) La fonction v eg etative traite de lensemble des moyens dont dispose une organisation pour maintenir sa structure organisationnelle, cest-` a-dire pour survivre, en se conservant et en d eveloppant ses ressources, en maintenant sa structure et en se
106
reproduisant. Dune certaine mani` ere, les t aches peuvent toujours etre ramen ees ` a la fonction v eg etative en dernier ressort, puisque les objectifs dune organisation participent ` a sa conservation et ` a sa reproduction3 . Certaines sont cependant plus directement impliqu ees dans la conservation, la reproduction et lentretien dune organisation que dautres. La dimension v eg etative/physique d ecrit limpl ementation du syst` eme de conservation et des t aches assurant la conservation individuelle et collective. La dimension v eg etative/sociale d ecrit lensemble des t aches permettant la conservation de lorganisation de niveau sup erieur et la reproduction des organisations de m eme niveau (procr eation, education, etc.). La dimension v eg etative/relationnelle concerne la conservation et lam elioration des liens existant entre plusieurs organisations de m eme niveau. Lorsque ces organisations sont des agents, cest sur cette dimension que seectue lentretien du r eseau daccointances ou la v erication des communications et des protocoles de coop eration. La dimension v eg etative/environnementale d etaille les t aches portant sur la conservation des ressources environnementales et, en particulier, si cela est n ecessaire, sur la d efense du territoire par rapport aux autres organisations de m eme niveau consid er ees comme des intruses. La dimension v eg etative/personnelle pour une organisation implique la conservation de soi, la recherche de nourriture, la r eparation et lauto-entretien. Le tableau 3.1 r esume ces rapports entre syst` emes et dimensions.
3.2.4
Grille danalyse fonctionnelle des organisations
Chaque organisation multi-agent ne dispose pas de toutes les fonctions, ni ne d eveloppe ses fonctions dans toutes les directions. Par exemple, les organisations r eactives nont pas (ou peu) de fonction repr esentationnelle. De m eme les organisations purement communicantes (qui nabordent pas le probl` eme de linteraction avec un environnement) ne sont pratiquement pas d evelopp ees dans leur dimension environnementale. Enn, la plupart des syst` emes multi-agents actuels, dont les capacit es de socialisation sont en g en eral encore tr` es peu d evelopp ees, nassurent
On pourrait dire que les objectifs du concepteur dun syst` eme multi-agent ne peuvent pas se ramener ` a un probl` eme de conservation et de reproduction et quil sagit dobjectifs suppl ementaires irr eductibles ` a la fonction v eg etative. Je pense au contraire que tout lart du concepteur dun syst` eme multi-agent est de faire en sorte que les objectifs fonctionnels (et donc productifs) dune organisation soient obtenus par un eet de bord de m ecanismes de recherche de satisfaction li es ` a chaque agent, chacun agissant comme si sa survie (ou comme si la survie de lorganisation dont il est membre) en d ependait. Cela entra ne alors une int egration des objectifs externes du concepteur dans la fonction v eg etative de lorganisation. Il faut toutefois remarquer que cette conception est surtout issue de l ecole r eactive (Steels 1994; McFarland 1994) mais que l ecole cognitive ne retient pas sp ecialement cette approche.
3
physique ( ! ) reprsentation des rles et repr. des autres, (buts, des fonctions, croyances, comptences) reprsentation du groupe et de la socit planification des actions sociales, rpartition des tches et des rles entre agents. demandes des autres, demandes de soi vers les autres. engagements envers les autres description des mcanismes de communication entre agents. Dfinition des performatifs. tches relationnelles, de coordination, et de ngociation, pour le compte d'autres agents conservation des relations, entretien du rseau d'accointances sources de plaisir et de rpulsions. contrle communications, planif des interactions, coordination des actions et allocations des tches planification des actions dans l'env., organisation des tches d'expertises. mta-planification, contrle des planifications reprsentation du monde, auto-reprsentation reprsentation des lois de de soi et de ses l'univers capacits.
social ( " )
relationnel ( # )
environnemental ( $ ) self ( % )
reprsentationnel structure de reprsentation, modles de reprsentation et d'infrence
organisationnel
contrle des tches, type de planificateurs
conatif
nature et implmentation demandes de la socit, des objectifs, des buts collectifs et pulsions et des contraintes sociales contraintes description des interactions entre l'agent et la socit,
pulsions internes, dsirs, contraintes internes autocommunication, auto-actions
interactionnel
implm. des primitives de communications, des capteurs et des actionneurs. tches de gestion et d'administration d'une organisation
description des mcanismes de perception et d'action
Table 3.1: Fonctions et dimensions dune organisation

tches expertes portant sur l'analyse et conception conservation des ressources, dfense et entretien du territoire. conservation de soi (nourriture), rparation et entretien.
productif
architecture des tches, rgulation des actions.
auto-modifications, apprentissage.
conservatif/
reproducteur
Implmentation du conservation de la systme de conservation, socit, reproduction de ressources individuelles, l'espce mmoire, CPU
107
108
pratiquement aucune dimension sociale. De ce fait le tableau 3.1 peut etre compris comme une v eritable grille de lecture permettant de situer les organisations les unes par rapport aux autres, en indiquant les fonctions, et donc les r oles, eectivement d evelopp ees le long de ces cinq dimensions. Pour ce faire, on indique dans chaque case du tableau si la fonction correspondante est impl ement ee explicitement dans la dimension associ ee. Par exemple, le tableau 3.2 pr esente la grille danalyse dune organisation r eactive typique dont les dimensions sociales et relationnelles nexistent pas, tout se situant le long des dimensions environnementale et physique.
Phys. Social Reprsentationnel Organisationnel Conatif Interactionnel Productif Conservatif Prsence systmatique: Relat. Absence: Env. Pers.
optionnelle:
Table 3.2: La grille danalyse des fonctionnalit es dune organisation r eactive typique Cela signie que cette organisation ne poss` ede aucune repr esentation de ce qui lentoure et quelle nest mue que par la perception d el ements dans lenvironnement qui lui servent de stimuli pour d eclencher ses actions, quelle ne communique pas directement ` a laide de messages avec dautres organisations, mais indirectement par le biais dobjets situ es dans lenvironnement (gradients dodeurs, par exemple), quelle ne planie aucune t aches mais simplement g` ere les actions environnementales et que ses capacit es productives sexpriment uniquement dans lenvironnement. La croix de la case conatif/personnelle indique seulement que certaines de ces organisations peuvent etre motiv ees par des stimulations internes (besoins el ementaires) mais que toutes ne disposent pas de cette capacit e. A la lecture de ce tableau, on constate tout de suite que, hormis la colonne de la dimension physique qui doit n ecessairement etre remplie sil existe au moins un point sur la ligne correspondante, seule la colonne de la dimension environnementale est remplie. Cela signie que ce type dorganisation est tout entier tourn e vers lenvironnement et que tous ses comportements sont relatifs ` a des actions et ` a des perceptions dans le monde. Le tableau 3.3 pr esente au contraire la grille danalyse dune organisation purement communicante (par exemple un agent cognitif purement communicant) qui na aucun m ecanisme daction ni de perception avec lext erieur. Ici la colonne environnementale est presque vide, puisquil ny a pas de contact avec lenvironnement. En revanche, si cette organisation dispose dune repr esentation delle-m eme et des autres, son syst` eme repr esentationnel sera plus d evelopp e que dans le cas dorganisations r eactives. Son syst` eme conatif est enti` erement tourn e

Phys. Social Reprsentationnel Organisationnel Conatif Interactionnel Productif Conservatif Prsence systmatique: optionnelle: Relat. Env. Absence: Pers.
109
Table 3.3: Grille danalyse dune organisation purement communicante typique vers le relationnel, ce qui signie que ses objectifs sont le fruit de demandes provenant dautres agents (et eventuellement de lorganisation de niveau sup erieur), et non de besoins internes et encore moins de signaux environnementaux. Le syst` eme productif d epend evidemment de la nature de la sp ecialit e de lagent. Sil sagit dun agent dobservation ou dex ecution, les t aches productives seront d enies dans la dimension environnementale. En revanche, sil sagit dun agent m ediateur ou coordinateur, le syst` eme productif peut etre d evelopp e le long des dimensions sociales et/ou relationnelles. Enn, la plupart de ces organisations ne comportent (pour linstant) aucune t ache de conservation, de maintenance ou de reproduction. On a plac e une croix dans les cases organisationnel/personnelle et conatif/personnelle pour indiquer quil est courant pour une organisation cognitive de disposer de fonctionnalit es lui permettant de r eorganiser explicitement les t aches ` a accomplir et de prendre en compte un ensemble de conditions d ependant des demandes provenant de lext erieur et des engagements d ej` a formul es.
Phys. Social Reprsentationnel Organisationnel Conatif Interactionnel Productif Conservatif Prsence systmatique: Absence: Relat. Env. Pers.
Table 3.4: La grille dun agent semblable ` a un animal social Le tableau 3.4 donne la grille danalyse dun agent ayant des caract eristiques semblables ` a celles dun (v eritable) animal social. Il ne poss` ede quune capacit e de repr esentation minimale de lenvironnement et bien quil poss` ede des m ecanismes de communication directe, ceux-ci sav` erent peu d evelopp es. Son comportement est
110
enti` erement d etermin e par des stimuli environnementaux, des pulsions internes et quelques demandes directes. Il est capable de se reproduire et davoir un comportement lamenant ` a chercher la conservation de son identit e et celle du groupe auquel il appartient. Evidemment il ne produit pas directement quelque chose (bien que sa biomasse puisse servir ` a ses pr edateurs et ` a ses parasites). Le tableau 3.5 repr esente la grille danalyse dune organisation etonnante parce que compl` ete. Elle poss` ede toutes les qualit es et son syst` eme productif polyvalent peut se sp ecialiser en fonction des demandes. Elle ore le meilleur syst` eme repr esentationnel que lon connaisse et elle est capable dapprendre et de planier ses actions. Cette organisation, qui se pr esente comme parfaite du point de vue de nos crit` eres, repr esente un etre humain ou une soci et e humaine...
Phys. Social Reprsentationnel Organisationnel Conatif Interactionnel Productif Conservatif Prsence systmatique: optionnelle: Relat. Env. Pers.
Table 3.5: La grille danalyse dune organisation humaine
3.3
Lanalyse structurale
Une organisation multi-agent appara t comme un syst` eme dune grande complexit e. Lanalyse structurale tente de donner un ordre ` a lensemble des interactions possibles entre agents en d egageant les relations abstraites qui les relient, et la mani` ere dont elles evoluent au cours du temps. Mais avant dentrer dans le d etail dans cette analyse, il est n ecessaire de bien comprendre les di erentes mani` eres daborder la conception dune organisation multi-agent.
3.3.1
Agents et t aches
La d ecomposition dun probl` emes en termes multi-agents, aborde la dicile mais essentielle question de savoir ce que repr esente v eritablement un agent en relation avec le probl` eme ` a r esoudre. Il sagit plus exactement de d enir le rapport entre la fonction productive individuelle de lagent et la fonction productive de lorganisation a laquelle il appartient. En eet, la d ` enition dune organisation multi-agent doit r epondre aux questions suivantes:
3.3. LANALYSE STRUCTURALE
111
1. Que doit-on consid erer comme un agent pour le domaine consid er e? Il sagit didentier ce quest un agent pour un probl` eme donn e, lanalyse seectuant a ` partir dune approche fonctionnelle (centr ee sur la fonction) ou objet (centr ee sur lindividu et le produit). 2. Quelle est la relation entre les agents et les t aches? Quelles sont les t aches ` a accomplir, comment les r epartir entre les agents et quelle est la redondance des agents par rapport aux t aches? Un agent se caract erise bien evidemment par son architecture et son comportement. Mais pour le concepteur dun syst` eme multi-agent, lagent est surtout caract eris e par ce quil peut faire, cest-` a-dire par sa fonction productive, et donc par son apport dans une organisation multi-agent. Il sagit alors didentier ce que lon doit consid erer comme un agent par rapport ` a un probl` eme consid er e, ` a partir dun point de vue ` a la fois conceptuel et m ethodologique qui ordonne toutes les questions futures. Ce probl` eme est ` a rapprocher de la phase danalyse que lon rencontre dans les m ethodes de g enie logiciel et, en particulier, dans les m ethodes objets o` u lon doit r eier les entit es que lon repr esentera dans le syst` eme informatique sous la forme dobjets (Ferber 1990). Approche objet ou fonctionnelle Dans le cadre du d eveloppement de programmes informatiques, on distingue les m ethodes de conception fonctionnelle, dans lesquelles lunit e de d ecomposition est la fonction caract eris ee par ses entr ees-sorties et sa fonction de transfert, et les m ethodes de conception objet qui mettent laccent sur lentit e dont on parle, sur les liens quelle entretient avec les autres entit es et sur les op erations dont elle est capable. Il semble naturel de concevoir les syst` emes multi-agents comme une extension naturelle de la conception par objets. Certains chercheurs consid` erent en eet que lagent est un objet dou e dautonomie capable de raisonner sur son environnement et de choisir entre plusieurs alternatives. Mais, de nombreux syst` emes qui se r eclament de lapproche multi-agent tendent n eanmoins ` a associer ` a chaque agent un r ole pr ecis caract eris e par sa fonction dans lorganisation globale. Cela signie quil nexiste pas une seule et unique mani` ere de consid erer ce quun agent repr esente. On peut aborder lidentication des agents suivant plusieurs approches, chacune conduisant ` a la r ealisation de syst` emes multi-agents di erents. En particulier, les travaux de Lesser et Durfee (Durfee et al. 1989) et ceux de Steeb et Camarata (Steeb et al. 1988), ont montr e quil etait possible danalyser un m eme probl` eme selon plusieurs angles di erents, en privil egiant certaines caract eristiques du probl` eme par rapport ` a dautres. Lexemple du syst` eme de contr ole a erien, trait e initialement par Steeb et Camarata, illustre cette diversit e dapproche (g. 3.6). Quels doivent etre les agents responsables de l evitement et du contr ole des di erentes op erations? Les avions, les secteurs despace ou les di erentes phases de pilotages telles que le d ecollage, latterrissage ou le suivi de plan de vol?
112

Avions
Secteurs
Figure 3.6: Dans un syst` eme de contr ole a erien, on peut consid erer comme agents les avions, les secteurs ou les phases de vols, selon que lon privil egie une approche objet, spatiale ou fonctionnelle. Dans le premier cas, on dira que lapproche est centr ee sur lobjet: cest lavion qui est responsable de ses propres mouvements et qui d ecide des actions quil doit entreprendre ` a partir dune interaction avec les autres appareils. Chaque avion dispose alors de toutes les fonctionnalit es n ecessaires ` a son activit e et, en particulier, des comp etences pour g erer les diverses phases de pilotage. Dans le second, lapproche est centr ee sur lespace. Chaque partie de lespace est une portion denvironnement qui contr ole les mouvements de tous les objets qui se trouvent dans son secteur, les avions n etant alors que des objets passifs qui ne font quob eir aux ordres de la tour de contr ole. Les op erations de gestion des di erentes phases de pilotage ne sont plus associ ees aux avions, mais aux agents repr esentant les di erentes portions despace. Enn la troisi` eme cat egorie est caract eristique dune approche fonctionnelle: les phases de pilotage repr esentent les experts qui g` erent de mani` ere centralis ee les mouvements de tous les avions. D` es quun avion se trouve dans une phase sp ecique (suivi de plan de vol, attente, atterrissage, roulage, proc edures durgence...) il est pris en charge par un sp ecialiste de la question. Seule la premi` ere et la troisi` eme cat egorie peuvent etre appliqu ees dans presque tous les cas de gure, alors que la seconde repr esente des parcelles denvironnement comme un agent. Bien que cela soit possible pour les agents situ es4 , nous ne la traiterons pas dans ce chapitre, car elle est de fait assez peu employ ee. Souvent, les approches fonctionnelles et objets sont antinomiques lune de lautre. Prenons un autre exemple caract eristique des syst` emes multi-agents, tels que celui du diagnostic de d efaillance dans un r eseau de distribution. Faut-il consid erer les composants de ce r eseau, cest-` a-dire les nuds de distribution ou de transformation, comme des agents (approche objet), ou au contraire pr ef erer une approche fonctionnelle qui
4
Cette approche sera reprise lors de la mod elisation des environnements, au chapitre 4.
113
consid erera que les agents sont des sp ecialistes en diagnostic, chacun utilisant une m ethode particuli` ere pour r esoudre le probl` eme dans sa globalit e (mod` ele structurofonctionnel, mod` ele de d efaillance (Amdec), analyse par cas (case base reasoning), etc.)? La gure 3.7 illustre ces deux possibilit es.
Case based models
Diagnosis methods Diagnosis methods
Failure based models
Diagnosis methods
Sructure based model
Diagnosis methods
Diagnosis methods
(a)
(b)
Figure 3.7: Repr esentation sch ematique dorganisations fond ees sur lapproche objet (A) ou fonctionnelle (B), appliqu ees au diagnostic de r eseau
Lapproche fonctionnelle est souvent consid er ee comme plus simple lorsque les agents ne sont pas physiquement situ es. Les agents repr esentent alors des sp ecialistes caract eris es par leur fonction et leur r ole dans lorganisation g en erale. Cette d ecomposition sapparente aux m ethodes danalyse fonctionnelle de linformatique traditionnelle et ` a lanalyse syst emique classique qui identie les di erentes activit es et fonctions des syst` emes et non pas les entit es sur lesquelles sappliquent ces fonctions. En revanche, lapproche objet dans le cadre des syst` emes multi-agents se situe dans le prolongement des analyses et conceptions objets caract eristiques de la tendance actuelle du g enie logiciel. Les perspectives objet et fonctionnelle peuvent n eanmoins etre combin ees ensemble, en consid erant que lapproche fonctionnelle d enit une sous-division de lapproche objet. Par exemple, on pourra suivre une analyse objet, dans laquelle la premi` ere d ecomposition consiste ` a prendre les avions comme agents, et entreprendre ensuite une d ecomposition fonctionnelle de chaque agent-avion en consid erant le syst` eme de contr ole de chaque appareil comme un syst` eme multi-agent et ainsi analyser chacun des organes de contr ole de lavion comme un agent ` a part enti` ere. Ceci r esulte simplement de lembo tement des niveaux dorganisation, comme nous lavons vu plus haut, et du fait quun niveau analys e de mani` ere objet peut etre lui-m eme d ecompos e en entit es de niveau inf erieur qui sont alors identi ees comme des fonctions.
114
La perspective envisag ee pour concevoir un syst` eme multi-agent, nest cependant pas neutre. Ce choix engage lensemble de la r ealisation du syst` eme. Les approches centr ees sur les objets sont g en eralement plus radicales en ce sens quelles supposent une parfaite autonomie des agents impliqu es. Elles reposent presque enti` erement sur la d enition des mod` eles dinteraction et sur leurs capacit es ` a pouvoir r esoudre le probl` eme ` a partir dune d emarche totalement distribu ee. En revanche, les mod` eles fonctionnels sav` erent plus classiques car ils ne remettent g en eralement pas en cause les m ethodes danalyse des comp etences. D ecomposition verticale et horizontale Une d emarche fonctionnelle peut sexprimer de deux mani` eres di erentes, selon que lon privil egie une conception horizontale ou verticale des fonctions. Une division fonctionnelle verticale associe ` a chaque fonction une activit e complexe centr ee sur une application particuli` ere. Dans lexemple du trac a erien, cela revient ` a lier, comme nous lavons fait plus haut, une fonction ` a une phase du plan de vol. Au contraire, une d ecomposition horizontale met laccent sur ce qui est partag e par les fonctions verticales. Cest cette d emarche que nous avons choisi lors de notre analyse fonctionnelle. Les six fonctions (repr esentationnelle, conative, relationnelle, organisationnelle, interactionnelle et v eg etative) ont et e d ecoup ees horizontalement et caract erisent donc les fonctions horizontales dune organisation articielle. Cette dualit e horizontale/verticale a et e tout particuli` erement etudi ee dans le cadre de la structuration des agents (Fodor 1983). Par exemple, pour un robot mobile et manipulateur, une d ecomposition verticale reviendra ` a associer une fonction pour chacune de ses actions. Il y aura par exemple la fonction de recherche et de transport dobjet, la fonction de placement dun objet sur un autre objet, la fonction de forage, la fonction d evitement dobstacle, etc. Au contraire, dans le cadre dune approche horizontale on mettra en evidence la fonction de m emorisation et dinf erence, celle de perception, celle de coordination des actions concr` etes, etc., sans que ces fonctions soient d enies pour des t aches pr ecises. Il est evidemment bien rare de voir un syst` eme articiel totalement organis e selon un seul de ces deux axes: les d ecompositions hybrides sont plus courantes que les architectures purement verticales ou horizontales. Par exemple, il est possible de concevoir un syst` eme d ecompos e en premier lieu de mani` ere horizontale en distinguant les activit es p eriph eriques (interpr etation et production de messages, perception, m ecanismes moteurs), des activit es cognitives expertes (interpr etation de situations, savoir-faire), des m ecanismes intentionnels et de contr ole. Dans un second temps on red ecompose verticalement chacun de ces modules en distinguant les di erentes formes de perception et de motricit e ou les di erentes expertises (expertises pour se mouvoir dans un univers, pour analyser des sc` enes visuelles, pour eectuer des t aches sp eciques) du domaine de comp etence. N eanmoins, les d ecompositions verticales sont plus li ees ` a la r esolution dun probl` eme particulier, alors que les d ecompositions horizontales sont plus g en eriques dans leur approche. Cest pourquoi, les agents r eactifs ou ceux qui sont con cus avec des techniques informatiques traditionnelles sont plus souvent d ecompos es de
115
mani` ere verticale, alors que les agents plus IA ont plut ot tendance ` a etre elabor es de mani` ere horizontale.
3.3.2
Relations abstraites
Les relations organisationnelles d ecrivent au niveau abstrait les formes dinterrelations qui peuvent avoir lieu entre les classes fonctionnelles dagents, cest-` adire entre les r oles. On distingue deux types de relations organisationnelles: les relations statiques, qui forment le squelette dune organisation, caract erisent la structure organisationnelle pr eexistante ` a tout fonctionnement et sont d enies en dehors de toute ex ecution, et les relations dynamiques, qui constituent la chair des organisations et d ecrivent les relations qui sont modi ees lors des interactions. Le tableau 3.6 d ecrit les principales relations que lon rencontre dans les organisations multi-agents.
Relations Accointance Communicationnelle Subordination Oprative Informationnelle Conflictuelle Comptitive Statique matre/esclave dpendance entre tches dpendance entre savoirs Dynamique demande de service engagement de faire engagement de validit
Table 3.6: Ensemble des relations organisationnelles. Un tiret indique quil ny a pas de nom particulier pour distinguer les formes statiques ou dynamiques dune relation.
On peut distinguer sept types principaux de relations: 1. Une relation daccointance entre deux agents A et B indique que A conna t B , quil en a une repr esentation et quil peut adresser ses communications directement ` a cet agent. Il sagit de la relation minimale entre deux agents cognitifs. Elle sert g en eralement de support ` a toutes les autres relations (g. 3.8.a). 2. Lexistence dune relation communicationnelle, ou plus exactement dun canal de communication, entre deux agents A et B indique que A peut envoyer des messages ` a B . Les relations daccointances sont les supports privil egi es de canaux de communication (g. 3.8.b.). 3. Les relations de subordination d ecrivent un transfert dex ecution entre un agent demandeur A et un agent ex ecutant B . Lorsque cette relation est statique, cela
116
CHAPTER 3. ORGANISATIONS MULTI-AGENTS signie que B ne peut pas refuser la demande de A et donc que A et B sont dans une relation ma tre/esclave (g. 3.8.d). Lorsquelle est dynamique, cela indique que A ne fait que demander des services ` a B et que B peut refuser les services de A (g. 3.8.e).
4. Les relations op eratives repr esentent des d ependances li ees aux t aches. Un agent A qui doit accomplir une t ache Tx peut avoir besoin, pour quelle soit r ealis ee, des r esultats dune t ache Ty dun agent B . On dira dans ce cas, que A d epend de B pour ses actions. La forme dynamique de ces relations recouvrent alors ce que lon appelle les d ependances dengagements. Un agent, en sengageant ` a accomplir quelque chose, permet ` a dautres agents de tabler sur cette r ealisation et donc de planier leurs propres actions, tout en d ependant de laccomplissement de cet engagement (g. 3.8.f). 5. Les relations informationnelles portent sur les d ependances de validit e entre les di erents savoirs dun agent. Lorsque le savoir dun agent A d epend de celui de B , cela signie que A na pas exp eriment e par lui-m eme, mais quil sen remet ` a B en ce qui concerne certaines croyances. On traitera au chapitre 5 de ces d ependances. 6. Les relations conictuelles indiquent que plusieurs agents sont en conit pour acc eder ` a certaines ressources. Lexistence de telles relations indique quil est n ecessaire de coordonner les acc` es aux ressources, eventuellement ` a partir dune n egociation entre agents. 7. Les relations comp etitives correspondent ` a une situation de comp etition entre agents et signalent que leurs buts sont incompatibles.
3.3.3
Les modes de couplage
Si les organisations peuvent etre caract eris ees par la qualit e des liens qui unissent les agents, elles sont aussi d ecrites par leurs capacit es ` a se modier dans le temps et ` a sadapter ` a l evolution des besoins, que ces besoins proviennent de sources endog` enes (modication du nombre dagents, modication des r oles des agents) ou exog` enes (modication des caract eristiques environnementales). Pour sadapter, les organisations doivent pouvoir se modier. Il est possible de caract eriser trois formes dorganisations en fonction du couplage des composants. 1. Dans une organisation ` a couplages xes, chaque composant poss` ede un (ou eventuellement plusieurs) r ole dont il ne bouge plus. Les relations entre agents sont elles aussi g ees, les r eorganisations etant impossibles tant au niveau abstrait de la structure organisationnelle quau niveau de lorganisation concr` ete. Ces organisations, qui ne peuvent que tr` es dicilement sadapter a ` leur environnement, sont plus caract eristiques du g enie logiciel classique que de lapproche k en etique. Nous ne les utiliserons que pour d ecrire le fonctionnement dagents cest-` a-dire comme des mod` eles darchitecture dagents (cf. section 3.6) mais non comme des mod` eles de syst` emes multi-agents.

(a)
Y
117
Je sais faire T, je ne peux pas refuser (d)
Jimpose Y de faire T
Je connais Y
Relation daccointance X Y (b) Je peux transmettre des informations Y X
Relation de subordination statique
Y (e)
Je demande Y de faire T
Je sais faire T, mais je peux refuser
?
Relation de communication X Y (c) Je sais faire T1 Je sais faire T2 et T2 a besoin de T1 Y ma promis de faire T Jai promis X de faire T X Relation de subordination dynamique Y (f)
Relation de dpendance excutive
Relation de dpendance dengagement
Figure 3.8: Visualisation ic onique des principales relations entre agents (les relations informationnelles, conictuelles et comp etitives ne sont pas repr esent ees). 2. Les couplages variables correspondent ` a des structure organisationnelles xes dont les concr etisations sont variables. Les relations entre agents peuvent evoluer mais dans le cadre de m ecanismes bien pr ecis es. Ce type de couplage est tr` es employ e dans les syst` emes multi-agents. Nous en verrons des exemples constamment. 3. Les couplages evolutifs caract erisent des structures organisationnelles variables, lorganisation concr` ete pouvant etre ou non variable. Les relations abstraites entre agents peuvent alors evoluer en fonction des performances de lorganisation.
3.3.4
Structures de subordination et prises de d ecision
Les relations de subordinations caract erisent la structure de contr ole, cest-` a-dire la mani` ere dont les agents peuvent faire eectuer certaines t aches ` a dautres agents. Certaines structures sav` erent particuli` erement classiques. Nous distinguerons essentiellement entre les structures hi erarchiques, qui supposent que les relations de subordination forment une arborescence, et les structures egalitaires, dans lesquelles un agent peut demander ` a nimporte quel autre agent daccomplir une t ache, ce dernier pouvant eventuellement refuser. Associ ees ` a un couplage xe, les organisations hi erarchis ees caract erisent des
118
syst` emes tr` es centralis es, tr` es militaires pourrait-on dire, dans lesquels un chef commande ` a un sous-chef, qui commande ` a un sous-sous-chef et ainsi de suite. On retrouve cette organisation dans la majorit e des programmes informatiques, la relation de subordination sexprimant alors comme un appel ` a un sous-programme. Au contraire, avec un couplage variable, cette structure de subordination fait g en eralement intervenir une comp etition entre les composants de bas niveau, les composants de haut niveau se chargeant darbitrer cette comp etition et de s electionner les vainqueurs. On parle alors parfois de structures comp etitives pour d ecrire les organisations ` a structure hi erarchique et ` a couplage variable. Les structures egalitaires sont plus caract eristiques des organisations dans lesquelles tous les agents interviennent uniform ement dans la d ecision nale. Lorsque le couplage est xe, les composants agissent de mani` ere distribu ee dans la prise de d ecision. On retrouve ce type dorganisation dans des architectures de type connexioniste (cf. section 3.6). Avec un couplage variable, cette structure engendre des organisations fond ees sur le mod` ele des march es economiques, o` u ceux qui font des demandes et ceux qui font des propositions sarrangent nalement pour y trouver leur compte.
3.3.5
Types de constitution des structures organisationnelles
Les structures organisationnelles peuvent etre constitu ees de deux mani` eres: a. Elles peuvent etre d enies a priori par le concepteur et lon parle alors dorganisations pr ed enies, ce qui signie que les relations abstraites, quelles soient statiques ou dynamiques sont d etermin ees ` a lavance. Dans le cas dorganisations evolutives, cest lensemble des relations abstraites possibles et lensemble des transformations qui sont connues ` a lavance. On pourra se r ef erer ` a (Le Strugeon 1995) pour une premi` ere analyse des organisations evolutives pr ed enies. b. Elles peuvent aussi etre d enies a posteriori et lon parle alors dorganisations emergentes. Celles-ci, qui ne comprennent le plus souvent que des agents r eactifs, sont caract eris ees par labsence de structure organisationnelle pr ed enie, celle-ci r esultant totalement des interactions entre agents. Dans ce cas, les positions et les relations ne sont pas d etermin ees ` a lavance mais apparaissent comme le produit des comportements de chacun des agents. Plus exactement, la r epartition des fonctions et des t aches suit un processus dautoorganisation qui permet ` a une organisation d evoluer et de sadapter facilement aux modications de lenvironnement et aux besoins dun groupe dagents. Bien quil existe aussi une certaine forme d emergence dans les organisations pr ed enies variables ou evolutives, cette emergence est toujours contr ol ee par des sch emas de communication bien etablis et les organisations qui en r esultent sont toujours d ecrites par des structures organisationnelles tr` es pr ecises, ce qui nest pas le cas des organisations emergentes.
` 3.4. LES PARAMETRES DE CONCRETISATION
119
3.4
Les param` etres de concr etisation
La question qui se pose ` a un concepteur de syst` eme multi-agent est la suivante: sachant la t ache g en erale ` a r esoudre, comment r epartir lensemble des comp etences aux di erents agents de telle fa con que le travail soit eectivement accompli? Pr ef` eret-on des agents tr` es sp ecialis es qui ne poss` edent quune comp etence, ou bien favoriset-on des approches avec des agents totipotents dans lesquelles chaque agent poss` ede toutes les comp etences voulues, seul le nombre faisant la di erence? Si pour concevoir une voiture de course, on fait appel ` a des sp ecialistes disposant de comp etences di erentes (sp ecialistes des moteurs, des ch assis, des pneumatiques, etc.), chacun apportant des comp etences propres qui lemp echent de remplacer un autre sp ecialiste dans son travail, on peut au contraire imaginer des agents peu sp ecialis es pour transporter des objets de di erentes formes. Chaque agent peut alors prendre la place dun autre agent si celui-ci fait d efaut, ce qui augmente la abilit e du syst` eme en cas de panne. An de mieux expliquer ce que nous entendons par sp ecialisation et redondance, il est n ecessaire de pr eciser quelques points. An de simplier la pr esentation, on supposera que chaque t ache el ementaire peut etre enti` erement eectu ee par un agent seul et quil ny a donc pas daugmentation qualitative ` a faire travailler plusieurs agents entre eux. Par exemple, le nettoyage dune surface peut etre r ealis ee par un seul agent, le fait de faire intervenir un groupe dagents ne pr esentant quune am elioration quantitative. On eliminera donc de cette discussion toutes les t aches el ementaires qui r eclament explicitement plusieurs agents travaillant ensemble pour etre accomplies5 . Dans ce cas, si lon appelle Ca lensemble des comp etences dont dispose un agent P a, C lensemble des comp etences n ecessaires ` a la r ealisation dun travail P et CA lunion des comp etences dun ensemble dagents A, alors on peut dire que le travail P peut etre accompli si C P CA , cest-` a-dire si toutes les comp etences n ecessaires ` a laccomplissement dun travail sont au moins pr esente dans lensemble A. On dira quun agent a est totipotent sil dispose de toutes les comp etences P n ecessaires pour eectuer ce travail par lui-m eme, cest-` a-dire si C Ca . On P notera par Ca lensemble des comp etences utiles ` a un agent a pour eectuer un P travail P : Ca = Ca CP . A partir de ces d enitions, il est possible de caract eriser la mani` ere dont un travail est r eparti dans un syst` eme multi-agent par deux param` etres: le degr e de sp ecialisation et celui de redondance.
P 1. Le degr e de sp ecialisation (Ha ) dun agent a pour un probl` eme P indique le taux de comp etence quun agent poss` ede par rapport au nombre de comp etences n ecessaires pour r esoudre un probl` eme. On le d enit ainsi: p Ha
5
P card(C P ) card(Ca ) = P card(C ) 1
Cette limitation nest pas trop p enalisante. Si une t ache sav` ere trop complexe pour un seul agent, on la d ecomposera en el ements plus simples de mani` ere ` a se retrouver dans le cas favorable. Si des actions n ecessitent absolument lintervention simultan ee de deux agents, alors on consid erera quil sagit dun probl` eme de coordination daction et nous le traiterons au chapitre 8.
120

p Si Ha = 0, lagent est donc totipotent pour le probl` eme P puisquil poss` ede toutes les comp etences requises. Inversement, lorsquil ne poss` ede quune seule comp etence, le taux est egal ` a 1, et plus ce taux est proche de 1, plus lagent est sp ecialis e et plus sa contribution ` a lensemble du probl` eme sera faible. On peut g en eraliser ce degr e de sp ecialisation ` a un syst` eme multi-agent en consid erant que le degr e de sp ecialisation g en eral est egal ` a la moyenne des sp ecialisations de chacun des agents: 1 HP Hp = card(A) a A a
2. Le degr e de redondance caract erise le nombre dagents poss edant les m emes comp etences. Si lon appelle Pc le nombre dagents disposant de la comp etence c (Pc = Card({a | c Ca })), alors le degr e de redondance pour une comp etence peut lui aussi etre compris entre 0 et 1 en utilisant la formule: Rc = Pc 1 card(C ) 1
Si Rc vaut 0 cela signie quil nexiste quun seul agent capable deectuer une t ache r eclamant une comp etence c. Le degr e de redondance vaut 1 lorsque tous les agents poss` edent cette comp etence, la redondance etant maximale. On peut ensuite calculer le degr e de redondance moyen de la mani` ere suivante: R= 1 Rc card(C ) c C
Par exemple, dans le cas dun syst` eme fond e sur la coop eration entre sp ecialistes, les agents ne peuvent se remplacer, la sp ecialisation est elev ee (proche de 1) et la redondance faible ( egale ` a z ero sil nexiste quun seul agent par sp ecialit e). Au contraire, des agents plus polyvalents verront leur sp ecialisation baisser et leur redondance s elever. On peut r esumer les di erents types dorganisation des comp etences par le diagramme de la gure 3.9. Il existe quatre types extr emes dorganisation des
R Agents redondants Axe de redondance Pas de redondance 0 H 1
0 Axe de spcialisation 1 Agents totipotents Agents hyperspcialiss
Figure 3.9: Les di erents types dorganisation des comp etences comp etences en fonction des degr es de sp ecialisation et de redondance.
` 3.4. LES PARAMETRES DE CONCRETISATION
121
a. Organisation hypersp ecialis ee non redondante. Sp ecialisation 1, redondance 0: un agent ne sait faire quune t ache et chaque t ache nest eectu ee que par un seul agent. Ce type dorganisation est caract eristique des approches purement fonctionnelles dans lesquelles chaque fonction est repr esent ee sous la forme dun agent. b. Organisation sp ecialis ee redondante. Sp ecialisation 1, redondance 1: chaque agent ne sait faire quune t ache et chaque t ache est eectu ee par tous les agents. Il sagit dun cas limite dans lequel tous les agents ont exactement une seule et unique comp etence. On utilise parfois ce type dorganisation localement pour augmenter la abilit e dun syst` eme (par exemple, un syst` eme de calcul comprenant plusieurs processeurs en parall` ele qui calculent la m eme fonction et votent pour d ecider du meilleur r esultat est fond e sur ce type dorganisation). c. Organisation g en eraliste redondante. Sp ecialisation 0, redondance 1: un agent sait faire plusieurs t aches et chaque t ache est eectu ee par un grand nombre dagents. Lorsque la redondance est egale au nombre de t aches, alors tous les agents sont totipotents. Le probl` eme r eside alors dans la r epartition des t aches au sein dagents pouvant a priori tout faire. Nous en verrons un exemple dans le cas de r epartition r eactive avec le syst` eme Manta (cf. chap. 7). d. Organisation g en eraliste non redondante. Sp ecialisation 0, redondance 0: un agent sait faire toutes les t aches, mais chaque t ache nest eectu ee que par un seul agent. Cest aussi un cas limite o` u le syst` eme multi-agent se r esume ` a un seul et unique agent capable de tout faire par lui-m eme. Le cas g en eral se situe vers le milieu de la gure, cest-` a-dire pour une sp ecialisation et redondance quelconque: les agents savent accomplir plusieurs t aches, mais pas toutes, et chaque t ache peut etre r ealis ee par plusieurs agents. Le probl` eme du concepteur et de lorganisateur dun syst` eme multi-agent est de parvenir ` a une organisation performante et qui soit capable de faire montre dadaptabilit e lorsque les conditions environnementales viennent ` a etre modi ees. Pour laider dans cette t ache, on peut d enir des param` etres quantitatifs qui prennent en compte les qualit es de la solution obtenue ou lecacit e du syst` eme. Dans lexemple des robots explorateurs on peut vouloir conna tre le temps mis par un groupe dagents pour r ecup erer une certaine quantit e de minerai; dans celui de l evitement de collision entre avions, on pr ef erera conna tre le nombre de conits (le nombre de fois o` u des avions se croisent ` a une distance inf erieure ` a une valeur limite) ou la d eviation par rapport aux trajectoires nominales etablies par leur plan de vol. On peut ainsi etablir une fonction de performance ` a partir de nombreux param` etres tels que le nombre ou la densit e des agents, la bande passante et les temps de communication, les caract eristiques individuelles, etc. Si lon se restreint aux deux seuls param` etres R et H, cest-` a-dire ` a la redondance et ` a la sp ecialisation des agents, on peut d enir une fonction de performance organisationnelle que lon notera s (R, H ) qui indique la performance du syst` eme S en fonction seulement des param` etres R et H . Le probl` eme du concepteur consiste donc ` a d eterminer une organisation
122
permettant doptimiser la valeur de cette fonction de performance, comme le mon(R,H) tre la gure 3.10. Si le syst` eme peut evoluer, par modication de la comp etence Redondance (R) des agents, alors 1 il lui est possible de se d eplacer dans lespace R H par ses propres moyens et donc de trouver une meilleure valeur de cette fonction de performance. Par exemple, le passage dun ensemble dagents totipotents ` a une plus <Redondance,Spcialisation> grande sp ecialisation permet g en eralement dam e liorer la performance du syst` eme <Redondance, Spcialisation> 0 en lui evitant des t aches coordinatrices inutiles. Inversement, laugmentation de la Spcialisation (H) 0 1 totipotence am eliore ladaptabilit e du syst` eme. Enn, la redondance augmente les performances qualitatives du syst` eme, mais egalement les besoins en coordination.
(R,H) Redondance (R) 1
<Redondance,Spcialisation> 0 0 Spcialisation (H) 1
Figure 3.10: Le probl` eme du concepteur dun syst` eme multi-agent consiste ` a optimiser la valeur de la fonction de performance organisationnelle en fonction de la redondance et du degr e de sp ecialisation des agents.
3.5
Analyse dune organisation concr` ete
Comment, ` a partir de cet ensemble de param` etres, est-il possible de d enir une organisation concr` ete? Il sut pour cela dassocier aux caract eristiques issues des analyses fonctionnelle et structurale, les facteurs de sp ecialisation et de redondance correspondant ` a linstanciation dune structure organisationnelle. Ainsi, une organisation peut etre d ecrite par la donn ee de: 1. Lapproche choisie (objet, fonctionnelle verticale, fonctionnelle horizontale) et la fonction productive de lorganisation, cest-` a-dire lensemble des moyens techniques, des op erations, des plans, des savoirs et des savoir-faire qui doivent etre mis en uvre pour satisfaire lobjectif global du syst` eme et la raison d etre du syst` eme. Cette fonction est li ee au contexte de lorganisation, cest-` a-dire a lensemble des contraintes et des conditions caract ` erisant la mani` ere dont le syst` eme multi-agent devra op erer. 2. La grille danalyse de lorganisation qui d ecrit la mani` ere dont les six fonctions essentielles sont projet ees le long des cinq dimensions danalyse. 3. Lensemble des r oles associ es aux fonctions ainsi que les relations abstraites qui relient ces di erents r oles.
` 3.5. ANALYSE DUNE ORGANISATION CONCRETE
123
4. La mani` ere dont les relations de subordination structurent le rapport dautorit e entre les agents. 5. La valeur des param` etres structuraux que sont le couplage et la constitution. 6. La valeur des param` etres de concr etisation, cest-` a-dire la sp ecialisation et la redondance. La gure 3.11 r esume lensemble de ces caract eristiques.
Fonctions Analyse fonctionnelle Dimensions danalyse
Physique, sociale, relationnelle, environnementale, personnelle Reprsentationnelle, organisationnelle, conative, interactionnelle, productive, conservative
Relations abstraites Organisation Analyse structurelle Structure de subordination
Daccointances, communicationnelle, de subordination, oprative, informationnelle, conflictuelle, comptitive
Hirarchique, galitaire
Couplage
Fixe, variable, volutif
Constitution
Prdfinie, mergente
Spcialisation Paramtres de concrtisation
Hyperspcialise, gnraliste Redondant, non-redondant
Redondance
Figure 3.11: Les di erents el ements fonctionnels, structuraux et de concr etisation dune organisation articielle
3.5.1
Lexemple des robots explorateurs
Pour montrer comment ces di erentes caract eristiques peuvent etre expliqu ees dans un exemple, nous reprendrons celui des robots explorateurs (cf. chap. 1). Il ne sagira pas de traiter int egralement ce probl` eme puisque lensemble des organisations possibles, m eme pour un exemple aussi simple, est d ej` a consid erable. En revanche, nous verrons un ensemble de structures caract eristiques an de comprendre comment les di erents param` etres que nous avons examin es peuvent se combiner entre eux.
124
Fonction productive et contexte La premi` ere question consiste ` a savoir ce que doit faire le syst` eme: Quel est son objectif g en eral et quelles sont ses conditions de fonctionnement? On suppose quun ensemble de robots doit explorer la plan` ete Mars pour r ecup erer du minerai. Pour cela, les robots doivent trouver un lieu o` u se trouve du minerai, forer pour ramener le minerai ` a la surface et transporter le minerai jusqu` a la base. On suppose que chacune de ces t aches peut etre accomplie ind ependamment les unes des autres et quelle ne n ecessite quun seul robot pour etre accomplie. La fonction productive Pexplo de lorganisation se ram` ene donc aux trois t aches: Pexplo = {trouver-minerai, forer, transporter-minerai} Lapproche choisie est fonctionnelle verticale: chaque robot dispose dun certain nombre de comp etences lui permettant daccomplir au moins lune des trois t aches. On suppose que le syst` eme doit travailler de mani` ere autonome, quil nexiste aucune carte de Mars et quon ne sait initialement pas o` u se trouvent les zones int eressantes de minerai. De plus, on suppose que des robots peuvent devenir inop erants pour des raisons diverses ( ecrasement par une m et eorite, chute dans une crevasse, panne diverse, etc.). Analyse fonctionnelle D` es lanalyse fonctionnelle, il faut exprimer ses options et choisir entre agents cognitifs et r eactifs. Ce sont les fonctions repr esentationnelle et communicationnelle qui font la di erence ici. Des agents cognitifs tenteront de construire une carte pr ecise du terrain et de se positionner par rapport ` a cette carte. Par exemple, un agent cognitif ayant d etect e du minerai indiquera la position de lendroit o` u il a trouv e du minerai aux autres sous la forme de coordonn ees cart esiennes ou polaires. En revanche, un agent r eactif se contentera denvoyer un signal dont lintensit e varie de mani` ere inverse ` a la distance, an de guider les agents dans sa direction. Autre int er et de lanalyse fonctionnelle: d eterminer les contraintes impos ees ` a la fonction v eg etative. Dans quelle mesure les agents sont-ils autonomes sur le plan energ etique et quels sont les moyens mis ` a leur disposition pour eventuellement se recharger. Faut-il pr evoir des agents ravitailleurs et donc ajouter de nouvelles t aches? Nous ne le supposerons pas dans notre analyse structurale, mais cest un point quil faudrait r esoudre dans un cas r eel. Analyse structurale Cest lors de lanalyse structurale que lon choisit la forme dorganisation d esir ee. An de montrer quelques-unes des variantes possibles, nous traiterons les structures organisationnelles suivantes: Organisations par equipe xe (structure xe-hi erarchique-pr ed enie). Organisations ` a structure variable- egalitaire- emergente.
` 3.5. ANALYSE DUNE ORGANISATION CONCRETE Organisations par appel dore (structure variable- egalitaire-pr ed enie). Organisations ` a structure evolutive.
125
3.5.2
Organisations ` a structure xe-hi erarchique-pr ed enie
Dans ce type dorganisation, que lon appelle aussi organisation par equipes xes, les r oles ainsi que les relations peuvent etre d enis de mani` ere statique, ` a lavance. La gure 3.12 montre une organisation possible comprenant deux equipes ind ependantes dont lorganisation est xe et chaque agent sp ecialis e. Chaque fonction productive est r ealis ee par un agent, mais plusieurs agents peuvent eectuer la m eme fonction. Chaque robot d etecteur est associ e ` a un ensemble bien d eni de foreurs, chaque foreur est associ e ` a un ensemble de transporteurs. Les d etecteurs commandent les foreurs et les foreurs commandent les transporteurs. Les foreurs d ependent des d etecteurs, puisque laction de forage ne peut se faire que si lon a d etect e du minerai et, de m eme, les transporteurs d ependent des foreurs. La structure de subordination est hi erarchique, les d etecteurs se situant au niveau sup erieur et les transporteur au niveau inf erieur. Les communications vont et viennent le long de cette hi erarchie d enie par les relations daccointance, mais les relations de subordination suivent toutes le m eme trajet. Les d etecteurs disent au foreurs ce quils doivent faire et les foreurs donnent des ordres aux transporteurs. Il ny a donc n ecessairement quun seul d etecteur par equipe et les transporteurs sont associ es une bonne fois pour toutes ` a un foreur.
Transporteur 1
Dtecteur 1
Foreur 1 Transporteur 2
Dtecteur 2
Foreur 2
Transporteur 3
Figure 3.12: Une organisation xe dont toutes les relations sont statiques. De plus, ici, la structure g en erale est hi erarchique.
Param` etres de concr etisation Ce type dorganisation est hypersp ecialis e puisquun agent naccomplit quune seule action (H = 1), mais la redondance nest pas pr ecis ee. Si pour la d etection la redondance dans une equipe est de 0 (mais peut etre plus elev ee en fonction du
126
nombre d equipe), elle est totalement fonction de la composition des equipes et donc de la concr etisation de la structure organisationnelle. On peut imaginer des equipes minimales ne comprenant quun seul foreur et quun seul transporteur (et dans ce cas la redondance de l equipe est egale ` a 0), ou bien avoir des equipes plus importantes si lon pense que les gisements de minerai sont riches et quil n ecessitent un travail important. La capacit e dadaptation dune organisation xe est par d enition minimale: quun agent essentiel vienne ` a dispara tre et toute une equipe est perdue. Dautre part, elle est particuli` erement peu performante, puisque si le d etecteur dune equipe tarde ` a trouver du minerai, ses foreurs et ses transporteurs resteront inutilis es. Il existe de nombreuses variantes de ce type dorganisation. On peut par exemple imaginer que des agents coordonnateurs ind ependants dirigent les op erations directement. Ces agents coordinateurs peuvent etre des robots qui accompagnent les equipes sur le terrain ou des agents logiciels qui restent ` a la base, re coivent des informations concernant la situation et donnent des ordres en retour. Les remarques restent valides pour ces variantes. En fait, les organisations xes ne sont pas bien adapt ees au probl` eme des robots explorateurs. On les rencontre surtout lorsque le nombre dagents nest pas tr` es important et, tout particuli` erement, dans les syst` emes de coop eration entre sp ecialistes, o` u chaque agent sait ` a qui il doit demander des informations et envoyer des r esultats. On se trouve donc en face de syst` emes tr` es rigides, plus modulaires en fait que v eritablement multi-agents. Nous ne rencontrerons ces organisations par la suite que pour la constitution dagents, les syst` emes multiagents etant d enis ` a laide dorganisations plus adaptatives.
3.5.3
Organisations ` a structure variable- egalitaire- emergente
Les organisations ` a structure organisationnelle variable et ` a constitution emergente sont caract eristiques des syst` emes peupl es dagents r eactifs qui sauto-organisent. Si les robots explorateurs sont totipotents, cela signie que chaque agent peut d etecter, forer et r ecup erer du minerai tout seul. Le probl` eme de ce type dorganisation est de faire en sorte que les agents r eussissent ` a coop erer an que si un agent trouve du minerai, les autres puissent b en ecier de cette d ecouverte. Nous verrons au chapitre 8 comment traiter ce probl` eme. La redondance du syst` eme est egale ` a 1, et lon se trouve donc en face dun syst` eme g en eraliste tr` es redondant. An dam eliorer les performances de mani` ere dynamique, les robots peuvent se sp ecialiser au fur et ` a mesure quils travaillent, de fa con que ceux qui ont d ej` a transport e du minerai deviennent de plus en plus transporteurs et que ceux qui forent deviennent de plus en plus foreurs. Nous verrons au chapitre 7 un exemple semblable dans le cas dune simulation dun nid de fourmis.
3.5.4
Organisations ` a structure variable- egalitaire-pr ed enie
Cette structure est caract eristique des organisations par appel dore qui sont caract eris ees par une tr` es grande variabilit e des liens daccointance. Elles fonctionnent ` a
` 3.5. ANALYSE DUNE ORGANISATION CONCRETE
127
partir dune m etaphore des march es economiques: un agent qui a besoin daccomplir une t ache envoie ` a dautres agents un appel dore et les agents qui se sentent concern es peuvent r epondre en envoyant des propositions au demandeur qui d ecide en dernier retour avec lequel il d esire passer un contrat. Cest ce type dorganisation qui est le plus utilis e dans les SMA cognitifs. Param` etres de concr etisation Il est possible de faire varier le param` etre de sp ecialisation et ainsi dobtenir des congurations tr` es di erentes. Si le degr e de sp ecialisation est 0, cest-` a-dire si les agents sont totipotents, chaque agent peut demander explicitement de laide aux autres si le besoin sen fait sentir. Par exemple, si un agent d etecteur trouve du minerai, il peut donner la position du lon aux autres, de telle mani` ere que le minerai soit r ecup er e le plus vite possible. Nous verrons au chapitre 7 les probl` emes quune telle organisation pose et la fa con de les r esoudre. Si au contraire les agents sont plus sp ecialis es et, en particulier, si le degr e de sp ecialisation est voisin de 1, les agents ne peuvent accomplir quune seule action. Dans ce cas, si lon suppose, comme pour les organisations ` a structure xe, que les d etecteurs jouent un r ole de chef, ces derniers peuvent demander aux robots foreurs de venir r ecup erer du minerai. Seuls les foreurs libres et proches r epondront a cette demande. Ils agiront de m ` eme avec les robots transporteurs (g. 3.13). Cette organisation permet ainsi de traiter avec beaucoup decacit e le fait que lon ne connaisse pas initialement la topologie du terrain et lemplacement des gisements de minerai. De plus, la disparition dun robot, et m eme dun robot d etecteur, ne p enalise pas trop le d eroulement des op erations, puisquaucun robot ne devient totalement indispensable ` a laaire. Le degr e de redondance est alors garant des capacit es du syst` eme ` a fonctionner avec des pannes.
3.5.5
Organisations ` a structure evolutive
Les organisations evolutives ont et e encore peu trait ees dans le cadre des syst` emes multi-agents. Il existe essentiellement deux mani` eres de les aborder. La premi` ere solution consiste ` a donner ` a lorganisation des m ecanismes pr ed enis an quelle puisse modier son fonctionnement et sa structure lorsque certains param` etres organisationnels atteignent un niveau critique. Cest cette approche qua choisie E. Le Strugeon (Le Strugeon 1995) en proposant quune organisation evolutive soit d enie par un ensemble de mod` eles dorganisations xes ou variables et que le syst` eme d ecide de lapplication de lune dentre elles en fonction de la valeur de certains param` etres internes. La seconde a et e etudi ee essentiellement dans le cadre de la vie articielle. En incorporant au sein de lorganisation (ou de ses agents) des algorithmes g en etiques, on laisse la soci et e evoluer et adopter lorganisation qui semble la plus adapt ee en fonction des conditions environnementales. C. Delaye notamment, avec son syst` eme Alia (Delaye 1993), a etudi e la mani` ere dont lintroduction dalgorithmes
128
? Dtecteur 1 ? ? ? ? Foreur 1 ? ? ? Dtecteur 3 Foreur 2 ?
Transporteur 1
Dtecteur 2
Transporteur 2
Transporteur 3
Figure 3.13: Une organisation ` a structure variable de constitution pr ed enie. Les relations de subordination sont variables et lallocation des t aches peut seectuer en fonction des demandes. Pour plus de clart e, seules les relations de subordination ont et e ach ees. g en etiques pouvaient aecter la structure et le fonctionnement dune organisation de robots explorateurs r eactifs et totipotents.
3.5.6
Autres travaux sur les organisations
Il existe relativement peu de travaux qui aient abord e le probl` eme de lorganisation avec une d emarche syst ematique comme la n otre. On peut citer cependant les travaux de Fox (Fox 1981) qui classe les organisations depuis le groupe, compos e dagents ind ependants et non coop erants, jusquau march e g en eral dans lequel les agents suivent des buts individuels, en fonction de leurs structures de d ecision. Mintzberg (Mintzberg 1982) a propos e une classication qui sapplique en fait aux organisations humaines, mais qui a eu une certaine inuence en IAD (Bouron 1992; Le Strugeon 1995). Il distingue cinq structures organisationnelles caract eristiques: la structure simple (centralisation), la bureaucratie m ecaniste (hi erarchie ` a d ecentralisation horizontale limit ee), la bureaucratie professionnelle (d ecentralisation verticale et horizontale), la structure divisionn ee (d ecentralisation verticale limit ee) et ladhocratie (fonctionnement par ajustements mutuels entre des groupes de projets). Gasser (Gasser 1992) propose une classication en quatre cat egories: centralis ee (qui correspond au mode dadaptation xe, avec des liens de subordination de type ma tre/esclave), de march e (ce qui correspond aux organisations variables pr ed enies avec appel dore), de communaut e pluraliste (correspond ` a nos organisations variables emergentes) et de communaut e` a r` egle de comportement (organisations variables pr ed enies avec interactions selon des protocoles explicit es). Il soutient aussi que ce que jappelle la k en etique devrait int egrer les r esultats de la th eorie des organisations an de constituer un domaine de recherche sur les organisations synth etiques (computational organization research) (Gasser 1995) qui serve ` a la fois a ` mieux ` a
3.6. ORGANISATIONS INDIVIDUELLES
129
comprendre les organisations humaines, mais aussi ` a apporter des concepts et des th eories fondamentales ` a la conception dorganisations articielles. Enn, les travaux de Pattison, Corkill et Lesser (Pattison et al. 1987) utilisent une d emarche tr` es semblable ` a celle propos ee ici pour lanalyse structurale. Les organisations sont constitu ees de composants caract eris es par di erents param` etres (responsabilit es, ressources, connaissances) li es entre eux par des relations. Ils distinguent ainsi les relations de communications, dautorit e (correspondant ` a nos relations de subordination) et de proximit e (nos relations daccointances). Ils donnent ensuite un langage permettant de d enir ais ement des organisations.
3.6
Organisations individuelles
Les agents constituent un cas particulier, mais essentiel, dorganisations. Celles-ci sont importantes non seulement parce quelles sont le point de d epart de la constitution dorganisations collectives, mais aussi parce quelles apparaissent comme le r esultat dune organisation de composants de niveau inf erieur. De ce fait, lanalyse structurale dun agent ressemble ` a celle dune organisation quelconque, ` a ceci pr` es que les composants dun agent ne sont g en eralement pas des agents eux-m emes, mais des modules (horizontaux ou verticaux) plus ou moins sp ecialis es. On retrouve cependant toutes les caract eristiques et tous les param` etres que nous avons examin es pr ec edemment pour les organisations quelconques. Le terme g en eralement employ e pour d ecrire lorganisation interne dun agent est celui darchitecture, par analogie avec la structure des ordinateurs. Un agent peut en eet etre compar e` a un ordinateur, avec ses organes de perception et daction et son syst` eme de d elib eration qui ressemble aux unit es dentr ees-sorties, de m emorisation et de calcul dun ordinateur. Mais il sagit ` a la fois dun ordinateur moins g en eralis e (puisquon peut simuler le fonctionnement dun agent et m eme dun syst` eme multiagent sur un ordinateur), et plus evolu e puisquil est capable de suivre ses propres objectifs de mani` ere autonome. La ressemblance qui existe entre ordinateur et agent ne doit donc pas etre pouss ee trop loin, m eme si elle sav` ere f econde pour celui qui veut comprendre lorganisation dun agent et etre ` a m eme de construire un agent ` a partir dune architecture donn ee, voire dinventer de nouvelles architectures. Si les architectures dordinateurs sont relativement homog` enes, du fait de lh eg emonie de larchitecture dite de von Neuman sur la quasi-totalit e des ordinateurs r ealis es aujourdhui, il nen est pas de m eme pour les architectures multi-agents qui pr esentent un eventail tr` es riche de solutions pour concevoir lorganisation interne dun agent an quil exhibe le comportement d esir e. Un agent cognitif dispose naturellement dune architecture plus elabor ee que celle dun agent r eactif. Mais la division cognitif/r eactif n epuise absolument pas le d ebat sur les architectures. Dabord parce quil en existe une vaste gamme aussi bien pour les agents cognitifs et r eactifs, mais surtout parce que lon peut tr` es bien r ealiser des agents r eactifs ` a partir darchitectures initialement destin ees ` a des agents cognitifs et vice versa. Mis ` a part quelques architectures, telles que celles fond ees
130
sur des r eseaux de neurones, pour lesquelles on ne peut toujours pas construire des agents pr esentant un comportement tr` es elabor e, la plupart peuvent sappliquer a des agents aussi bien cognitifs que r ` eactifs. N eanmoins, il faut temp erer cette armation en reconnaissant que certaines architectures ont et e d evelopp ees dans un certain cadre et quelles tendent donc ` a etre tout sp ecialement d edi ees ` a certains types dagents. Par exemple, nous verrons que les syst` emes ` a base de tableau noir sont plut ot r eserv es aux agents cognitifs, alors que les architectures de subsomption sont utilis ees pour des agents r eactifs, m eme si rien nemp eche th eoriquement de les employer lun pour lautre.
3.6.1
Tableau des principales architectures
On retrouve dans une architecture dagent les param` etres g en eraux valables pour lanalyse structurale des organisations articielles: le type dapproche, les structures de subordination, le couplage et la constitution.
Type Approche Type de d'architecture composant Modulaire horizontale Tableau noir Subsomption Tches comptitives Rgles de production Classifieurs Connexioniste Systme dynamique Multi-agents fonct. horiz. fonct. fonct. vert. fonct. vert. Module Tche Tche primitive Tche + actions primitives Rgle Rgle Neurone formel Fonction stimulicommande Agent
Structure de Couplage Constitution subordination hirarchique hirarchique (mta) hirarchique hirarchique (comptition) hirarchique (mta) hirarchique galitaire galitaire fixe (mais progr.) variable fixes variable prdfinie prdfinie prdfinie prdfinie
fonct. fonct. vert. fonct. vert. fonct. vert.
variable volutif fixe ( poids) fixe (mais progr.) variable
prdfinie prdfinie prdfinie mergente
objet/fonct.
galitaire
mergente
Table 3.7: Principales architectures dagents
Parmi lensemble des architectures possibles obtenues en faisant varier ces param` etres, seul un petit nombre a donn e lieu ` a susamment dimpl ementations pour pouvoir etre cat egoris e. Il sagit des architectures ` a base de modules horizontaux (ou
131
plus simplement architectures modulaires), de tableau noir, de subsomption, de t aches comp etitives, de r` egles de production, de classieurs, de syst` eme dynamique et de multi-agents et les architectures connexionistes. Elles sont regroup ees avec leurs param` etres associ es dans le tableau 3.7. On pourra noter que tous les types darchitecture (sauf eventuellement le type multi-agent) emploient une approche fonctionnelle, quelle soit horizontale ou verticale.
3.6.2
Architecture modulaire horizontale
Ce type darchitecture est certainement lun des plus r epandus. Quil sagisse de travaux th eoriques ou dapplications pratiques, la plupart des architectures propos ees pour la d enition dagents cognitifs sont fond ees sur la notion densemble de modules horizontaux li es par des connexions pr e etablies. Les architectures modulaires horizontales, que nous appellerons modulaires tout simplement par souci de simplication, sont con cues comme un assemblage de modules, chacun r ealisant une fonction horizontale particuli` ere. Les modules les plus courants sont: Les fonctions perceptives et motrices sil y a lieu. L emission et linterpr etation des communications. La base de croyances comprenant la mod elisation de lenvironnement et des autres agents. La gestion des engagements. Les expertises du domaine de comp etence. La gestion des buts et la prise de d ecision. La planication des actions, etc. Dans ce type darchitecture, toutes les liaisons sont xes, cest-` a-dire que le mode de circulation des informations est pr ed eni par le concepteur. La gure 3.14 montre un exemple caract eristique dune telle architecture, caract eris e par un ux dinformation montant puis descendant. Dans la phase ascendante, les signaux provenant de lext erieur par linterm ediaire de capteurs ou de bo tes aux lettres comprenant des messages sont ltr es de mani` ere a obtenir une information de nature de plus en plus abstraite, jusqu` ` a ce quelle puisse sint egrer aux mod elisations de lagent. La fonction la plus elev ee est eectu ee par le module de prise de d ecision qui, ` a partir des informations quil re coit et des objectifs qui lui sont propres, d ecide dagir. On passe ensuite ` a la phase descendante correspondant ` a la mise en application des d ecisions. Le module de planication ordonne les actions ` a eectuer pour satisfaire lobjectif choisi, celles-ci sont ensuite transmises au module dex ecution. Un grand nombre darchitectures propos ees pour les agents cognitifs, et en particulier celles que nous proposerons au chapitre 5, sappuient essentiellement sur ce mod` ele.
132
Agent

Objectifs
Prise de dcision
Modeles/ Representations
Planication
Perception
Excution de tche
Environnement
Figure 3.14: Repr esentation caract eristique dun agent ` a architecture modulaire horizontale
3.6.3
Les architectures ` a base de tableaux noirs
Larchitecture de tableau noir est lune des plus utilis ee dans les syst` emes multiagents cognitifs symboliques et elle a donn e lieu ` a une abondante litt erature. Originellement d evelopp ee dans le cadre de lintelligence articielle traditionnelle (cesta-dire, du point de vue de lIAD, pour r ` ealiser des syst` emes mono-agents), pour la reconnaissance de la parole avec le syst` eme Hearsay II (Erman et al. 1980), larchitecture de tableau noir sest rapidement impos ee en IAD comme une architecture susamment souple et puissante pour pouvoir impl ementer les m ecanismes de raisonnement et de calculs intervenant ` a lint erieur des agents, notamment avec le syst` eme DVMT (Lesser et Corkill 1983). Le mod` ele de tableau noir est fond e sur un d ecoupage en modules ind ependants qui ne communiquent directement aucune informations, mais qui interagissent indirectement en partageant des informations. Ces modules, appel es sources de connaissance ou KS (pour Knowledge Sources), travaillent sur un espace qui comprend tous les el ements n ecessaires ` a la r esolution dun probl` eme. Larchitecture dun syst` eme a base de tableau noir comprend trois sous-syst` ` emes (g. 3.15): Les sources de connaissance (KS). La base partag ee (le tableau proprement dit) qui comprend les etats partiels dun probl` eme en cours de r esolution, les hypoth` eses et les r esultats interm ediaires et dune mani` ere g en erale toutes les informations que s echangent les KS. Ces bases sont d ecompos ees en hi erarchies (conceptuelles, partitives, causales etc.) qui structurent la mod elisation du domaine dapplication comme
3.6. ORGANISATIONS INDIVIDUELLES lespace des hypoth` eses/solutions.
133
Un dispositif de contr ole qui g` ere les conits dacc` es entre les KS, ces derniers intervenant de mani` ere opportuniste cest-` a-dire sans etre d eclench es eectivement par un syst` eme centralis e de contr ole. Cest cette partie qui a connu le plus de modications au cours de l evolution de ces architectures.
KS Blackboard Reasoning and decision making KS Execution KS
Environment
Perception KS Control Control flow Data flow
Figure 3.15: Une architecture de syst` eme ` a base de tableau noir
Le contr ole dans les tableaux noirs Si le mod` ele de tableau noir est tr` es g en eral, puisquil ne dit rien sur la mani` ere dont sont organis es ces sous-syst` emes, de nombreuses r ealisations ont vu le jour, chacune pr esentant une vision di erente du contr ole, la partie en fait la plus ardue dun tableau noir. Le probl` eme du contr ole dans un tableau noir revient ` a essayer de savoir ce quil convient de faire ensuite, cest-` a-dire en fait de d eterminer quelle source de connaissance doit etre d eclench ee. Au d ebut, avec les premi` eres impl ementations de Hearsay II, le contr ole etait c abl e au sein dune proc edure, puis tr` es rapidement il fut donn e sous la forme dun ensemble de r` egles. Mais ce nest quavec le syst` eme BB1 de B. Hayes-Roth que lorganisation du contr ole dans les tableaux noirs acquit ses lettres de noblesses, en consid erant le contr ole comme un probl` eme susamment important pour quil dispose de son propre tableau (Hayes-Roth 1985). Larchitecture de BB1 comprend donc deux tableaux: le premier est destin e au traitement du probl` eme du domaine et le second ` a la gestion du contr ole. De ce fait, il est possible de traiter lactivation des sources de connaissance comme sil sagissait dun probl` eme ind ependant du domaine dapplication. Pour pallier certains des probl` emes decacit e des approches ` a base de tableau de contr ole ` a la BB1 et consid erant que la plupart des syst` emes de contr ole etaient en fait hi erarchiques, J.-P. Haton, H. Laasri et B. Maitre du Crin ` a Nancy ont cherch e une architecture pr esentant un bon compromis entre lexpressivit e et lecacit e. Ils
134
voulaient pouvoir d ecrire le contr ole sous forme de KS sans perdre en ecacit e par rapport ` a un contr ole proc edural pur. De cette r eexion est n e le syst` eme Atome (L aasri et Ma tre 1989; L aasri et al. 1987) qui a et e depuis utilis e dans un grand nombre dapplications. Citons notamment un syst` eme daide ` a la d ecision pour la gestion des r efections de la voirie de Nancy (Ferraris et Haton 1992) et un outil de gestion temps r eel des contre-mesures pour un pilote davion de chasse (Lalanda et al. 1992). On trouvera une bonne explication de la notion de tableau noir comme syst` eme ind ependant, de ses m ecanismes et de ses di erentes versions dans (Engelmore et Morgan 1988) et (Jagannathan et al. 1989). Tableaux noirs et syst` emes multi-agents Si, dans un premier temps, les syst` emes ` a base de tableaux noirs furent consid er es comme des syst` emes dIAD, chaque KS pouvant etre per cu comme un agent qui interagit avec les autres KS, il nen est plus de m eme aujourdhui. Du fait de leur m ecanisme de contr ole tr` es centralis e et de leur manque de m emoire locale et donc de localit e des informations, ces syst` emes sont maintenant envisag es comme des architectures pratiques pour la r ealisation de syst` emes intelligents et, en particulier, pour impl ementer la structure interne dagents cognitifs symboliques. Nombre de syst` emes multi-agents ont et e impl ement es de cette mani` ere aux EtatsUnis (Lesser et Corkill 1983; Hayes-Roth et al. 1988) et en Europe (Chevrier 1993; Ienecker 1992; Cambier 1994). Larchitecture de tableau noir pr esente de nombreux avantages dont, en tout premier lieu, une remarquable souplesse pour d ecrire des modules et articuler leur fonctionnement. Son int er et r eside dans ce quelle est ` a la fois opportuniste et centralis ee, les liaisons entre les modules (entre les KS donc) etant mutables. Elle est opportuniste au sens o` u les KS se d eclenchent lorsque des congurations du tableau les int eressent, suite ` a des modications provoqu ees par dautres KS. Elle est centralis ee par linterm ediaire dun module de contr ole qui ordonne lordre dans lequel les KS seront eectivement activ es, en essayant de d eterminer quelle est la meilleure action ` a eectuer compte tenu de l etat du syst` eme. Son principal inconv enient provient de sa relative inecacit e, due ` a la tr` es grande expressivit e de son contr ole. De ce fait, ce type darchitecture sav` ere particuli` erement utile lors de la phase de prototypage de la r ealisation de syst` emes ou lorsque les temps de r eponses ne sont pas trop contraints. N eanmoins, des versions de BB1 ont montr e que m eme dans des cas o` u il etait n ecessaire davoir des temps de r eponses en temps r eel, la gestion ne du contr ole pouvait acc el erer de mani` ere drastique son comportement en prenant les bonnes d ecisions et en choisissant les t aches importantes et urgentes au bon moment (Hayes-Roth et Collinot 1993). Le syst` eme Guardian, qui surveille un patient dans une unit e de soin intensif en est un bon exemple (Hayes-Roth et al. 1992). En tout etat de cause, les avantages de ce type darchitecture sont ind eniables: du fait de sa tr` es grande plasticit e, il est possible dimpl ementer nimporte quelle structure dagent en termes d el ements de tableaux et de KS. En particulier, toutes
135
les autres architectures peuvent etre mod elis ees en termes de tableaux noirs au prix parfois dune certaine lenteur dans lex ecution. Le tableau noir se pr esente donc comme une sorte de m eta-architecture, cest-` a-dire une architecture pour impl ementer des architectures.
3.6.4
Larchitecture de subsomption
Larchitecture de subsomption a et e propos ee pour la premi` ere fois par R. Brooks pour la constitution dagents tropiques-r eactifs (Brooks et Connell 1986). A linverse de larchitecture modulaire hi erarchique qui divise un agent en modules horizontaux, larchitecture de subsomption6 d ecompose un agent en modules verticaux, chacun deux n etant responsable que dun type de comportement tr` es limit e. Les interactions entre les modules sont xes et seectuent par linterm ediaire dun rapport de dominance d eni lors de la conception. Les modules eectuent leurs t aches en parall` eles, mais si deux modules sont en conit (cest-` a-dire que deux modules produisent des r esultats contradictoires), alors seules les informations fournies par le module dominant seront consid er ees. Si le module inf erieur produit un r esultat sans que le module dominant fonctionne, son eet sera pris en compte, mais si ce dernier produit lui aussi des informations, ceux-ci seront prioritaires devant ceux du module inf erieur, comme le montre la gure 3.16.
Dominant
Infrieur
Figure 3.16: Dans une architecture de subsomption, les modules sup erieurs sont dominants et inhibent, si n ecessaire, la sortie des modules inf erieurs. Il est ainsi possible de construire des syst` emes relativement complexes avec une telle architecture. Cependant, cest encore le concepteur qui d enit lensemble des modules et surtout les relations de domination qui sexercent entre eux. La gure 3.17 pr esente un exemple caract eristique darchitecture de subsomption pour un robot explorateur. Cette technique a surtout et e utilis ee pour d ecrire des agents r eactifs, mais il serait possible de lutiliser pour des agents cognitifs, en consid erant que les modules sup erieurs sont les plus r eexes et les modules inf erieurs sont les plus cognitifs, en induisant une priorit e dans les modules.
6 Subsomption, de subsumer, mettre sous. Ne pas confondre avec son usage dans le domaine de la repr esentation des connaissance, o` u lon parle de relation de subsomption entre concepts.
136
L'agent
Eviter les objets
Rcuprer de l'nergie
Optimiser les chemins
Construire une carte du territoire
Explorer
Prendre et dposer les objets
Capteurs
Avancer de manire alatoire
Effecteurs
l'environnement
Figure 3.17: Mod` ele de robot explorateur ` a base darchitecture de subsomption
3.6.5
Les t aches comp etitives
Alors que dans les deux architectures modulaires pr ec edentes, les liens sont xes, dautres architectures ont et e propos ees pour essayer dintroduire une certaine mutabilit e dans les liens entre modules an dobtenir plus de souplesse dans le choix de la s election du module. Ces modules repr esentent des fonctions verticales, ce que certains appellent des comportements ou t aches. Dans la structure des t aches comp etitives, un agent est compos e dun ensemble de t aches parmi lesquelles seule une peut etre active ` a la fois. Ces t aches sont ainsi en comp etition pour etre elues par un m ecanisme de d ecision qui prend en compte di erents param` etres: le poids de la t ache ` a un moment donn e, le contexte dapplication, les informations provenant de lext erieur, etc. Ce type darchitecture est d ecrit tout particuli` erement dans (Drogoul et Ferber 1992). Une t ache correspond ` a une action macroscopique qui pr esente une certaine unit e. Par exemple, allerChercherObjet, r ecup ererEnergie, ou explorer peuvent etre consid er ees comme des t aches, alors que bougerBras ou seD eplacer sont des actions trop el ementaires pour constituer des t aches ` a elles seules. Ce sont au contraires des primitives daction, cest-` a-dire les mots du langage avec lequel il est possible de
137
d enir des t aches. La gure 3.18 montre le processus d election de la t ache courante. Le module de s election re coit les valeurs des param` etres des di erentes t aches pour chacune dentre elles et s electionne celle dont la fonction d evaluation appliqu ee aux param` etres est la plus elev ee.
Lagent Slecteur de tches
Explorer Allerchercherobjet Rcuprernergie
Capteurs
Effecteurs
Environnement
Figure 3.18: Un agent ` a base de t aches comp etitives. Le s electeur de t ache choisit la t ache qui pr esente la valeur (issue dune fonction d evaluation) la plus elev ee. La t ache elue, une fois s electionn ee, est activ ee et la t ache courante pr ec edente d esactiv ee. Mais une t ache d esactiv ee nest pas totalement eteinte. Elle pr esente une activit e de veille qui consiste ` a recevoir les informations provenant des capteurs et ` a calculer les valeurs des param` etres de s election qui en d ependent an de demeurer dans la comp etition. Cest ce type darchitecture qui est utilis e dans le syst` eme Manta sur la simulation des fourmis (Drogoul et Ferber 1994) (cf. chap. 7). Dautres architectures fond ees plus ou moins sur le m eme principe ont et e propos ees. A partir dun point de vue ethologique (McFarland 1990; McFarland 1994), elles consistent toutes ` a proposer un m ecanisme de s election dactions pour agents r eactifs qui permette ` a ces derniers dorganiser leur comportement en fonction des stimuli environnementaux quils re coivent et des pulsions internes qui les motivent (besoin d energie, reproduction,...). On retrouvera cette probl ematique dans les architectures hybrides ci-dessous et dans la probl ematique du passage ` a lacte r eactif (cf. chap. 5).
3.6.6
Les syst` emes de production
Les syst` emes de production font certainement partie des architectures les plus connues de lintelligence articielle. Un syst` eme de production est d eni par la combinaison dune base de faits (BF), dune base de r` egles de production (BR) et dun interpr` ete, le moteur dinf erence (MI). Bien quil y ait une grande vari et e
138
de syntaxes pour la d enition de r` egles de production, les r` egles sont g en eralement donn ees sous la forme suivante: si <liste-conditions> alors <liste-actions> o` u <liste-conditions> est associ ee ` a des el ements de la base de faits et <liste-actions> comprend des actions el ementaires telles quajouter ou supprimer des el ements de la base de faits.
Agent Rule base
Inference engine
Perception
Fact base
E xecution
Environment
Figure 3.19: Un agent ` a base de syst` emes de production Certaines actions peuvent aussi directement activer les commandes dex ecution de lagent. Lorsquune r` egle peut valider chacune des conditions de sa liste, elle ex ecute les actions correspondantes. Si plusieurs r` egles peuvent etre activ ees, on dit quelles sont en conit, et le syst` eme de contr ole du moteur dinf erence d eclenche la r` egle quil consid` ere comme la plus prioritaire (en fonction de param` etres internes ` a la r` egle, ou tout simplement en prenant la premi` ere). Dans le cadre dun syst` eme multi-agent, chaque agent est repr esent e sous la forme dun syst` eme de production, muni des fonctions dinterpr etation et dex ecution (g. 3.19). La fonction de perception se borne ` a placer les informations per cues ou les messages ` a lint erieur de la base de faits pendant le fonctionnement du moteur dinf erence, pour que la base de r` egles puisse le prendre en compte directement. Bien quils aient et e longtemps consid er es comme loutil id eal pour l ecriture de grandes bases de connaissances, les syst` emes de production pr esentent n eanmoins deux inconv enients majeurs: La partie action des r` egles comportant g en eralement des m ecanismes de suppression daction, on dit que le moteur est non monotone. Cependant, dans un moteur non monotone, le r esultat obtenu nest pas ind ependant de lordre dapplication des r` egles. De ce fait, il est n ecessaire de conna tre lordre dapplication des r` egles pour etre s ur que le r esultat obtenu soit conforme
139
au d esir de r ealisation, ce qui est contraire au principe de mise en vrac des r` egles. Pour tenir compte de ce probl` eme, on regroupe g en eralement les r` egles ` a laide de paquets de r` egles. Mais de toute fa con, il est indispensable de conna tre les algorithmes du moteur dinf erence, cest-` a-dire les choix et lordre dapplication des r` egles, pour savoir utiliser ecacement un syst` eme de production. Les r` egles, ` a la di erence des proc edures et des fonctions des langages de programmation, ne sont pas combinables. En eet, alors quune fonction Lisp est d enie comme une combinaison de fonctions, les r` egles impl ementent directement la relation entre les conditions et les actions sans quil soit possible de d enir des abstractions sous la forme de r` egles de r` egles. La solution classique ` a ce dilemme consiste comme pr ec edemment ` a construire des paquets de r` egles r eunissant un ensemble de r` egles li ees fonctionnellement entre elles. Mais cette notion de paquet introduit un m ecanisme proc edural qui s eloigne des vertus initiales. De ce fait, la port ee de lapplication des syst` emes de production est n ecessairement r eduite et les programmes r ealis es de cette mani` ere doivent etre soigneusement test es pour v erier que les syst` emes sont coh erents. Cependant, ils orent lavantage, lorsque le nombre de r` egles est petit ou lorsque le d ecoupage de la base de r` egles en paquets de r` egles permet de diminuer le nombre de r` egles ` a envisager simultan ement, de fournir une forme d ecriture simple ` a la d enition de m ecanismes de raisonnement complexes. Dans le cadre de syst` emes multi-agents, les bases de connaissance associ ees a ` un agent sont relativement simples ou en tout cas d ecomposables en paquets de r` egles qui repr esentent alors les modules dune des architectures modulaires vues pr ec edemment.
3.6.7
Les syst` emes ` a base de classieurs
Les syst` emes ` a base de classieurs7 sont des cas particuliers de syst` emes ` a r` egles de production originellement introduits par Holland (Holland 1968; Holland 1978; Holland et al. 1986) pour concevoir des syst` emes autonomes evolutifs. Un syst` emes ` a base de classieurs se pr esente comme une variation dun syst` eme ` a r` egles de production dans lequel les faits (appel es messages) sont des cha nes de caract` eres (et les caract` eres sont g en eralement pris dans un alphabet binaire 0, 1) de taille xe et les r` egles (appel ees classieurs) sont des couples de cha nes de caract` eres dont les el ements sont pris dans lalphabet pr ec edent auquel on a ajout e un caract` ere joker ( ) qui peut sassocier ` a nimporte quel el ement. Les r` egles comportent un poids correspondant ` a leur probabilit e de d eclenchement. La gure 3.20 montre un tel syst` eme. Les informations provenant de lenvironnement sont cod ees par le syst` eme de perception sous la forme dun ensemble de faits. Les r` egles sappliquent sur ces faits et produisent dautres faits qui peuvent ` a leur tour
7 Il sagit dune francisation du n eologisme am ericain classier invent e par J.H. Holland. Je reprends le terme utilis e par E. Sutton dans son rapport sur les algorithmes g en etiques (Sutton 1994).
140
d eclencher dautres classieurs ou bien produire des actions dans lenvironnement via le syst` eme dex ecution. Les syst` emes ` a base de classieurs ne di ereraient pas des syst` emes de production si deux m ecanismes ne venaient profond ement modier leur perspective, ` a savoir un syst` eme dattribution de cr edit et un syst` eme de reproduction de r` egles par algorithmes g en etiques.
Reproduction de rgles (algorithmes gntiques) Lagent Base de rgles (classieurs)
0.4:1#10>1001 0.8:01##>0000 0.6:011#>0110
Rcompenses
Base de faits (messages)

1101 0101 0011
Perception
Excution
Environnement
Figure 3.20: Un agent con cu autour dun syst` eme ` a classieurs Le syst` eme dattribution de cr edit r ecompense les r` egles qui ont donn e lieu ` a une bonne action, cest-` a-dire une action consid er ee comme ayant permis daboutir a un but tel quobtenir de la nourriture par exemple. Dans ce cas, les poids de ` ces r` egles sont augment es, alors que dans le cas contraire, les r` egles nayant apport e aucun b en ece pour lagent voient leur poids d ecro tre. On d eclenche prioritairement les r` egles ayant le poids le plus fort. De plus, le syst` eme de reproduction des classieurs par algorithmes g en etiques est utilis e pour produire de nouvelles r` egles a partir des r` ` egles ayant le poids le plus fort par des m ecanismes de mutations et de croisements (cross over) (Goldberg 1989). Ces syst` emes de classieurs sont essentiellement utilis es pour cr eer des comportements adaptatifs. Par exemple, dans (Wilson 1991) des animats situ es dans un environnement apprennent ` a trouver leur nourriture le plus rapidement possible avec un tel syst` eme.
3.6.8
Les architectures connexionistes
Les architectures connexionistes, qui sont fond ees sur la m etaphore du cerveau, sont form ees dun r eseau d el ements tous identiques que lon appelle souvent neurones formels, ` a cause de leur ressemblance (assez vague en fait) avec les neurones du syst` eme nerveux des animaux. Chaque neurone d etermine sa valeur de sortie en
141
fonction des valeurs dentr ee quil re coit dautres neurones. La fonction de transfert du neurone est donn ee par l equation: yj = f (
i
wij xi )
o` u les xi sont les valeurs de sortie des unit es i, les wij sont les poids des connexions reliant les neurones i aux neurones j , et f est la fonction dactivit e. Les fonctions dactivit e les plus classiques sont les fonctions ` a seuil ou les sigmo des, qui indiquent quun neurone est actif (ou dautant plus actif) ` a partir du moment o` u la somme des valeurs quil re coit sur ses entr ees d epasse une certaine valeur. Il existe un grand nombre de mod` eles de r eseaux de neurones. Les plus classiques sont les r eseaux a ` couches. Ils supposent que les neurones sont regroup es en ensembles, appel es couches, et que les entr ees des neurones de la couche n sont reli ees aux sorties de la couche n 1. Dans un r eseau ` a n couches, la premi` ere couche est directement reli ee aux capteurs et la couche n aux eecteurs. Les couches interm ediaires, appel ees couches internes ou cach ees, servent ` a m emoriser des etats internes. La gure 3.21 montre un r eseau ` a trois couches.
Couche interne
Couche de sortie (excution)
Figure 3.21: Un r eseau de neurones ` a trois couches comprenant une couche interne (ou cach ee) En tant quarchitecture dagents, on peut d enir les poids des connexions entre neurones de trois mani` eres di erentes: 1. La premi` ere technique consiste tout simplement ` a d enir ces poids ` a la main ou a les faire ` evoluer avec des techniques extr emement simples. Lorsque larchitecture est tr` es simple, on peut parfois sen contenter. Braitenberg, notamment, d ecrit des petits robots autonomes situ es qui naviguent avec un tr` es petit nombre de neurones dont larchitecture est donn ee ` a la main (Braitenberg 1984). Par exemple, la gure 3.22 montre certainement lune des architectures les plus simples que lon puisse r ealiser avec des neurones. Avec seulement deux neurones crois es et reliant des capteurs ` a des eecteurs, on peut construire un petit v ehicule qui se dirige vers
142
une source lumineuse, chaque neurone activant un moteur proportionnellement ` a la puissance des informations re cues sur le capteur correspondant. Plusieurs auteurs sen sont inspir es, notamment (Beer et Chiel 1992) et (Cherian et Troxell 1993), pour d evelopper des agents r eactifs capables de sadapter ` a leur environnement.
Roues motrices
Capteurs
Neurones
Figure 3.22: Lun des petits v ehicules de Braitenberg. Il est capable de se diriger vers une source lumineuse bien que son contr ole se r esume ` a deux neurones. 2. Dans la deuxi` eme technique, le r eseau apprend lui-m eme ces poids ` a laide dun m ecanisme de r etropropagation de lerreur (backprop). On pr esente un ensemble de stimuli en entr ee et une r eponse attendue en sortie. L ecart entre la r eponse attendue et celle donn ee par le r eseau est r etropropag ee sur les poids des connexions entre les di erentes couches. Si ces techniques sont bien adapt ees ` a des situations dapprentissage relativement statiques comme la reconnaissance de visages ou d ecriture, elles ne conviennent pas toujours ` a des agents autonomes mobiles qui doivent apprendre un comportement dynamique. On trouvera n eanmoins dans (Lin 1992) une utilisation de la technique de r etropropagation ` a la d enition de comportement dagents r eactifs adaptatifs. 3. La troisi` eme technique, qui prend dailleurs de lessor, consiste ` a faire evoluer les poids ` a laide dalgorithmes g en etiques, ce qui permet dutiliser directement les r eponses environnementales comme m ecanismes de renforcement, comme dans les syst` emes de classieurs (Todd et Miller 1991). Mais la tendance est aussi de faire directement evoluer la structure du r eseau neuronal par lutilisation dalgorithmes g en etiques, en d eveloppant par apprentissage les neurones cach es n ecessaires ` a laccomplissement de la t ache (Cli et al. 1993) (Werner et Dyer 1992) (Werner 1994).
3.6.9
Les architectures ` a base de syst` eme dynamique
Dire quil existe des architectures dynamiques est un peu pr esomptueux pour linstant puisquil nexiste quune seule version darchitecture de ce type, celle qua d evelopp e L. Steels pour la r ealisation de robots autonomes coop eratifs (Steels 1994). Le principe consiste pr ecis ement ` a faire table rase de la notion darchitecture et ` a simplement impl ementer le comportement dun agent en d ecrivant directement les equations qui relient les valeurs (standardis ees pour des raisons decacit e) des capteurs ` a celles des commandes appliqu ees aux eecteurs.

IR avant Bumper gauche IR avant gauche IR gauche Moteur gauche Bumper arrire gauche Micro Bumper droit IR avant droit IR droit Moteur droit Bumper arrire droit
143
Haut-parleur
Figure 3.23: Synoptique g en eral dun robot dynamique de L. Steels Par exemple, L. Steels utilise un robot comportant un ensemble de capteurs et deecteurs lui permettant de sentir les chocs (bumper) ou de percevoir des obstacles par infrarouge (IR), dentendre et d emettre des bruits, de percevoir des lumi` eres et surtout de bouger en jouant directement sur la vitesse des moteurs droits et gauches du robot (g. 3.23). Pour exprimer un comportement, il sut de donner la valeur au temps t + 1 du param` etre de commande en fonction de sa valeur au temps t et de la valeur de tous les autres capteurs au temps t. Par exemple, pour dire au robot davancer, il sut de donner les equations du mouvement pour les vitesses des moteurs de droite (V D) et de gauche (V G). V D(t + 1) = V D(t) V D V DDef aut 10
et de m eme pour la commande de la vitesse du moteur de gauche. Ainsi, que le moteur aille trop vite ou trop lentement, il va peu ` a peu sadapter ` a sa vitesse nominale indiqu ee par le param` etre V DDef aut (qui vaut 150). Lorsque le capteur de contact (un bumper dans la terminologie des roboticiens) de gauche touche quelque chose, il faut que les moteurs sarr etent. Avec une architecture comme celle de subsomption, on ferait en sorte que le comportement eviterObstacle inhibe le comportement allerToutDroit. Ici au contraire, on modie directement les valeurs de commande des moteurs en ajoutant ou retranchant des valeurs num eriques de telle mani` ere que les moteurs aient tendance ` a aller en sens contraire. Par exemple, le fait daller ` a droite si on touche ` a gauche sexprime ` a laide du comportement suivant: Comportement allerADroiteSiToucheAGauche Si le bumper de gauche est touch e alors VG(t+1) = VG(t) - 300 * valeur(bumper de gauche) VD(t+1) = VD(t) - 400 Il sut ensuite dadditionner directement toutes les valeurs des moteurs pour obtenir le comportement d esir e. Dans ce cas, si le robot touche le bumper de gauche
144
il ira en marche arri` ere (puisque les valeurs de retrait sont tr` es sup erieures aux valeurs nominales pour aller en avant) avec un petit mouvement de rotation lui amenant le nez vers la droite. Aux temps suivants, si le robot ne touche plus lobstacle, il va retrouver progressivement sa vitesse nominale en marche avant ` a laide des equations de mouvement avant. De ce fait, toutes les commandes partielles (allerToutDroit, eviterObstacle, etc.) sont toujours somm ees, et le comportement global r esulte directement de la somme de tous les comportements partiels. L. Steels a appliqu e cette architecture ` a la r ealisation dun couple de (v eritables) robots coop erants qui d eambulent de mani` ere naturelle pour aller recharger leurs batteries et accomplir une fonction utile pour le concepteur. Evidemment, cette approche est tr` es li ee au mat eriel utilis e puisquil nexiste pas de repr esentations interm ediaires ` a partir desquelles il serait possible dabstraire un comportement ind ependant. N eanmoins, et bien que ce type darchitecture en soit encore ` a ses premiers d ebuts, on peut gager quil recueillera rapidement de nombreux adeptes, du fait de sa simplicit e et de sa capacit e ` a pouvoir eectuer de mani` ere naturelle plusieurs actions en m eme temps (cf. chap. 5).
3.6.10
Architectures multi-agents et acteurs
On appelle architecture multi-agent dun agent lapplication de la notion de syst` eme multi-agent ` a la d enition de larchitecture des agents eux-m emes, un agent etant alors consid er e comme un syst` eme multi-agent ` a part enti` ere. Le premier ` a avoir consid er e le psychisme dun etre (humain ou articiel) comme le r esultat dinteractions entre petits agents individuels est M. Minsky8 dans son c el` ebre livre La Soci et e de lesprit (Minsky 1988). Il y d ecrit, de mani` ere assez d ecousue, un ensemble de m ecanismes r esultant de conits et de coop erations entre petites entit es calculatoires quil appelle agents. Chacun est responsable dune activit e, dun souvenir, dune propri et e reconnue dun objet, sans quil y ait de v eritable syst` eme centralisateur coordonnant lensemble. De ce fait, Minsky consid` ere que le fonctionnement de lappareil psychique nest pas le r esultat dun ensemble dinf erences portant sur des symboles, mais plut ot le fruit de confrontations auto-organisatrices entre processus autonomes. Bien que tr` es peu de syst` emes aient et e con cus ` a partir des travaux de Minsky (et on peut dailleurs se demander si elles sont r eellement impl ementables dans leur totalit e), ses id ees ont certainement inuenc e tout un courant de pens ee, et en particulier les travaux de P. Maes dont on parle ` a la section suivante, qui consid` ere que le comportement dun agent r esulte dun ensemble dactivit es internes que lon peut associer au fonctionnement dun syst` eme multi-agent. En particulier tous les travaux portant sur les langages dacteurs et sur leur utilisation dans des syst` emes multi-agents peuvent dans une certaine mesure se rapporter ` a ce courant. Initialement, la notion dacteur est apparue avec les travaux de Hewitt d` es 1973 (Hewitt et al. 1973). Ils ont v eritablement et e rendus publics vers 1976 avec larticle initiateur Viewing Control Structures as Patterns of Passing
8 En fait, G. Bateson (Bateson 1979) avait d ej` a avanc e cette id ee en disant quun esprit est un ensemble de parties ou de composantes en interaction, mais il nen avait pas d egag e les cons equences op eratoires n ecessaires ` a une r ealisation informatique.
145
Messages (Hewitt 1977), qui d eveloppait une certaine conception des programmes con cus comme des soci et es de sp ecialistes r esolvant un probl` eme en communiquant par envois de messages. A cet eet, Hewitt montrait que son mod` ele dex ecution permettait de consid erer les structures de contr ole des langages traditionnels comme des sch emas (patterns) de communications entre entit es autonomes appel ees acteurs. Depuis, les langages dacteurs, en particulier sous linuence de Agha (Agha 1986) de Tokoro (Ishikawa et Tokoro 1986) et de Yonezawa (Yonezawa et Tokoro 1987), ont surtout et e etudi es comme des mod` eles dex ecution pour la programmation par objets concurrents. Mais quelques travaux ont voulu rester dans les id ees initiales que pr onaient Hewitt et quil conrma avec ses notions de s emantique des syst` emes ouverts (Hewitt 1991; Hewitt 1985). P. Carle (Carle 1992), S. Giroux (Giroux et Senteni 1992) et J. Ferber (Ferber 1987), tout en estimant que les langages dacteurs sont eectivement de tr` es bons outils pour limpl ementation de calculs parall` eles, consid` erent n eanmoins quils pr esentent des caract eristiques tellement originales quils modient par leur pr esence la notion m eme darchitecture multi-agent en envisageant les agents et les syst` emes multi-agents comme des extensions naturelles de la notion dacteur. Mais quest-ce quun acteur? Un acteur est une entit e informatique qui se compose de deux parties: une structure qui comprend ladresse de tous les acteurs quil conna t9 et ` a qui il peut envoyer des messages et une partie active, le script, qui d ecrit son comportement lors de la r eception dun message. Le comportement de chaque acteur, qui sex ecute ind ependamment et en parall` ele avec les autres, se r esume ` a un ensemble dactions extr emement r eduit: envoyer des messages, cr eer des acteurs et modier son etat (ou d eterminer un nouveau comportement pour le message suivant). Cest tout! Et cest susant pour pouvoir exprimer nimporte quel calcul parall` ele comme une combinaison de ces actions primitives. La communication entre acteurs seectue par envois de messages asynchrones, cest-` a-dire que l emetteur na pas besoin que le r ecepteur soit pr et pour recevoir un message. Mais loriginalit e la plus importante des langages dacteurs est certainement lusage de la continuation locale du calcul. Lorsquun acteur A a besoin dune r eponse a un message quil envoie ` ` a un acteur B, il nattend pas la r eponse: il passe en argument un nouvel acteur C, appel e customer chez Hewitt, qui se charge de traiter la r eponse et la suite du calcul. Cet acteur C agit donc comme la continuation locale du calcul initi e par lenvoi de message de A vers B. Lusage des continuations locales donnent une tr` es grande uidit e aux calculs exprim es en langages dacteurs puisque les acteurs nont aucunement besoin dattendre les r eponses. De nombreux langages dacteurs ont et e propos es. Les plus c el` ebres et actuellement op erationnels sont ABCL (Yonezawa 1990), Mering IV (Ferber et Carle 1991) et Actalk (Briot 1989), ce dernier etant con cu comme une extension de Smalltalk (Goldberg et Robson 1980).
9 En termes de langages dacteurs, on appelle ces acteurs les accointances dun acteur. Il ne faut cependant pas confondre cette notion daccointance, qui se r esume ` a une simple adresse, avec la gestion des accointances telle quon la rencontre dans les syst` emes multi-agents, laquelle suppose quil existe une repr esentation explicite des caract eristiques des autres agents (cf. le chapitre 6 sur la repr esentation des connaissances dun agent).
146
En etendant la notion dacteur vers celle dagent gr ace ` a lutilisation de la r eexivit e organisationnelle, S. Giroux (Giroux 1993) propose de consid erer un agent comme un ecosyst` eme, cest-` a-dire comme un ensemble dagents en interactions, et un ecosyst` eme comme un agent. Son syst` eme ReActalk, fond e sur une extension dActalk, fournit aux agents la possibilit e dadapter leur comportement en fonction du type de message quils re coivent et ainsi de pouvoir dialoguer aussi en mode synchrone si cela sav` ere n ecessaire. N eanmoins, ces agents ne disposent pas v eritablement de comportements autonomes (ils nont pas de syst` emes motivationnels) ni de repr esentations de leur environnement, lid ee d ecosyst` eme etant plut ot prise comme une m etaphore. N eanmoins ces travaux montrent quil existe un lien de continuit e entre la notion dacteur et celle dagents. Javais dailleurs, dans (Ferber 1989), propos e un syst` eme, Paladin, ecrit comme une extension du langage Mering IV dans lequel les acteurs pouvaient poursuivre un but et, si n ecessaire, raisonner sur leurs propres comp etences et expliquer leur comportement ` a dautres entit es du syst` eme. Les acteurs avaient v eritablement pris le statut dagent, la r eexivit e etant ici encore le lien n ecessaire au passage dun niveau acteur dans lequel les entit es neectuent que du calcul, ` a un niveau agent o` u les entit es disposent dune plus grande latitude comportementale, voire de capacit es de raisonnement ou de motivations (Ferber et Carle 1991). Enn, il faut signaler, dune part, que L. Gasser dans son syst` eme Mace (Gasser et al. 1987) a et e fortement inspir e par les id ees de Hewitt concernant les acteurs et, dautre part, que le langage Actalk est ` a la base dun grand nombre de platesformes multi-agents, la premi` ere en date ayant et e Mages III (Bouron et al. 1990). Le rapport entre acteurs et agents est ainsi des plus f econds et nul doute que lavenir verra dautres travaux tendant ` a montrer les liens tr` es etroits qui unissent ces deux concepts.
Chapter 4 Action et comportement

4.1
4.1.1
La mod elisation
Des mod` eles...
Un mod` ele, en science, est une image stylis ee et abstraite dune portion de r ealit e. Lactivit e scientique consiste principalement ` a faire des mod` eles des ph enom` enes et des objets quelle etudie. Ces mod` eles peuvent etre tr` es formels ou simplement fournir une repr esentation simple et pratique. Par exemple, la physique utilise des mod` eles tr` es math ematiques pour pr edire le mouvement des corps ou d eterminer le rayonnement dune source electromagn etique. En revanche la biologie utilise des mod` eles de transfert dinformation ou des images simples comme celle de la cl e et de la serrure pour comprendre le fonctionnement de la cellule, la reproduction et l evolution dun organisme. Lint er et dun mod` ele est dabord d etre plus explicite, plus simple et plus facile a manipuler que la r ` ealit e quil est cens e repr esenter. Les mod` eles eliminent ainsi un grand nombre de d etails consid er es comme inutiles par le mod elisateur an de mieux se consacrer aux donn ees que celui-ci juge pertinentes relativement au probl` eme quil d esire r esoudre. Par exemple, il est dicile de pr edire comment un corps sous la pression de forces di erentes va se d eplacer et se d eformer. Mais la m ecanique utilise des mod` eles simples de forces qui, une fois conjugu es, permettent de pr evoir pr ecis ement le mouvement de ce corps et les d eformations que ce dernier subira. Cest parce que lon a pu traduire le corps dans un mod` ele dynamique et parce que lon sait comment utiliser ce type de mod` ele pour pr evoir lavenir que la construction et lutilisation de ces mod` eles sav` erent particuli` erement utile. Les mod` eles sont ainsi des images homomorphes de la r ealit e, cest-` a-dire quil existe un homomorphisme entre lobjet d etude et le mod` ele qui permet dappliquer les r esultats du mod` ele ` a lobjet lui-m eme, comme le montre la gure 4.1. Le ph enom` ene observ e est traduit sous la forme dune abstraction, laquelle peut etre manipul ee (par transformations alg ebriques, par calculs num eriques ou par simples inf erences logiques) pour obtenir des r esultats qui peuvent alors servir a ` mieux comprendre ou ` a pr edire des situations futures. Cest par des op erations de cette nature que lon a pu calculer les orbites des plan` etes autour du Soleil ou mieux
148
Modle Modle abstrait
CHAPTER 4. ACTION ET COMPORTEMENT

dductions, raisonnements, calculs
Prvisions, Comprhension application valuation anticipation, comprhension du phnomne
abstraction modlisation phnomne observ questionnement
Figure 4.1: La pr evision et la compr ehension de ph enom` enes passe par l elaboration de mod` eles. comprendre le comportement des oies sauvages.
4.1.2
... et de leur utilit e pour les SMA
On peut se demander pourquoi les syst` emes multi-agents auraient besoin de mod` eles? Ne se susent-ils pas ` a eux-m emes? Le code des programmes permettant aux agents de sex ecuter nest-il pas susant ` a la compr ehension de leur fonctionnement? Malheureusement tout nest pas si simple. Pour un syst` eme multi-agents, comme dailleurs pour nimporte quel syst` eme informatique un tant soit peu complexe, analyser le comportement dun programme ` a partir de son impl ementation pr esente les inconv enients suivants: 1. Il est particuli` erement dicile dentrer dans le cur dun programme et danalyser son comportement simplement en regardant son impl ementation. 2. Le code dun programme introduit un grand nombre de d etails inutiles ` a la compr ehension de son fonctionnement. 3. Des impl ementations di erentes, en termes de langages et de choix de structures de donn ees, pr esentent des manifestations semblables, alors que des modications l eg` eres dans un programme peuvent avoir des cons equences importantes sur le comportement de ce dernier 4. Lex ecution des agents seectuant en parall` ele (que ce parall elisme soit simul e sur une machine monoprocesseur ou eectif sur une machine multiprocesseur) il est encore plus dicile de comprendre leur fonctionnement ` a partir de leur code, du fait du non-d eterminisme inh erent au parall elisme. 5. Enn, et surtout, les syst` emes multi-agents sont des logiciels complexes, diciles ` a appr ehender et ` a concevoir. Il est donc n ecessaire de r eduire leur complexit e en d egageant leur structure et en analysant s epar ement leurs di erents composants sans pour autant perdre de vue lorganisation g en erale.
4.1. LA MODELISATION
149
4.1.3
Que mod eliser?
Quels sont les caract` eres essentiels dun SMA? Quels sont les param` etres qui les di erencient les uns des autres? Que faut-il d ecrire pr ecis ement? Quest-ce qui se passe eectivement et comment cela se passe-t-il? En dautres termes, les questions fondamentales portent sur lintelligibilit e et la conception des m ecanismes mis en uvre et sur les cons equences visibles et attendues de leur fonctionnement, cesta-dire entre le point de vue de ling ` enieur attach e ` a concevoir les rouages dun syst` eme et celui de lobservateur qui analyse de lext erieur le comportement quil manifeste. Cest ` a ces questions que jessayerai de r epondre dans le reste du livre. On peut distinguer quatre notions principales pour lesquelles la mod elisation sav` ere particuli` erement pertinente: 1. La mod elisation des actions des agents et des cons equences de celles-ci dans lenvironnement. Ce dernier peut etre complexe et pr esenter aussi une evolution autonome, distincte des cons equences des actions des agents. Cette mod elisation met en jeu des langages de type L3 (mod elisation op eratoire) et L5 (formalisation) (cf. chap. 1). 2. Le fonctionnement dun agent, aussi bien dans le comportement observable que dans la m ecanique interne de lagent, en utilisant des langages de type L3 (mod elisation op eratoire) et eventuellement L4 (repr esentation des connaissances). 3. Linteraction des agents entre eux et en particulier les di erents modes de communication, pr eludes aux formes organis ees dinteractions que sont la coop eration, la coordination daction et la r esolution de conits, avec des langages de type L2 (communications) et L3 (mod elisation op eratoire). 4. L evolution du syst` eme multi-agent, ce dernier etant consid er e dans son ensemble, ` a partir dexp erimentations et de formalisations (langages de type L5). Il existe un grand nombre de mod` eles applicables ` a la compr ehension et ` a la conception de syst` emes multi-agents. On peut distinguer deux grandes familles: les mod` eles alg ebriques, qui tendent ` a d ecrire un agent en termes math ematiques (langages de type L5), et les mod` eles op eratoires (langages de type L3) qui utilisent des structures a priori plus informatiques, m eme si certains, tels les automates ` a etats nis ou les r eseaux de Petri, sont eux-m emes formalisables en termes alg ebriques. Les premiers sont essentiels car ils d eterminent tous les d eveloppements ult erieurs en d enissant les fondements ` a partir desquels ceux-ci seront rendus possibles, quil sagisse de mod` eles op eratoires, darchitectures, des etats mentaux des agents cognitifs ou de la d enition des interactions entre agents.
4.1.4
Agents et actions: des notions faussement el ementaires
La question ne cesse d etre r ep et ee: Quest-ce quun agent? Quest-ce quun agent pour son concepteur et pour celui qui lobserve? Comment d ecrire son comportement,
150
son architecture, ses caract eristiques internes et ce qui fait quil se comporte comme il le fait? Il y a de nombreuses r eponses et nous ne chercherons dans ce chapitre qu` a en donner une premi` ere esquisse: un agent sera simplement consid er e comme une entit e qui, en permanence, per coit, d elib` ere et ex ecute. Il sagit donc l` a dune version tr` es appauvrie de la notion dagent mais elle sera susante pour donner une mod elisation formelle des agents. Nous aurons loccasion, au cours des chapitres suivants, de lapprofondir. A c ot e de lagent, une autre question soul` eve encore plus dinterrogations, celle de laction. Comment d ecrire le fait que le monde evolue, quil se transforme sous la pouss ee de nos gestes et sous la pression de cette myriade de changements que les astres, la mati` ere, les plantes, les animaux et les etres humains provoquent ` a chaque moment et dont ils subissent les cons equences? Or laction, si elle se trouve a la base de notre existence, sert aussi de fondement aux syst` ` emes multi-agents. En eet, par rapport aux conceptions classiques de lintelligence articielle qui postulent que la manifestation de lintelligence repose sur un raisonnement logique, les syst` emes multi-agents prennent comme point de d epart non point le raisonnement mais le comportement des agents, les actions quils accomplissent dans le monde et les interactions qui en d ecoulent. Toute analyse des syst` emes multi-agents passe donc n ecessairement par une etude en profondeur de la notion daction et par la d enition dune th eorie de laction qui permette de traiter les interactions et leurs cons equences sur la soci et e. Mais quest-ce quune action? Bien quil sagisse dune notion qui paraisse evidente pour chacun de nous, une d enition pr ecise de ce concept pose de nombreux probl` emes et d epend des conceptions g en erales, quasi philosophiques, que nous pouvons avoir sur lagir et ses cons equences. Comme le signale E. Morin (Morin 1977): Aussi loin que nous puissions concevoir les profondeurs de la physis, nous trouvons agitation et interactions particuli` eres. Immobilit e, xit e et repos sont des apparences locales et provisoires, ` a l echelle de nos dur ees et perceptions. Tout bouge, le monde est instable et sujet aux changements qui sont le fruit des actions et donc des interactions, r eactions et r etroactions des agents les uns avec les autres. Les atomes, les mol ecules chimiques, les cellules, les organismes multicellulaires, les soci et es animales et humaines et les ecosyst` emes sont les fruits dun grouillement d etres en activit e permanente, les r esultats de mouvements incessants et dagitations turbulentes qui sorganisent ` a partir des actions el ementaires dentit es autonomes. Mais comment d ecrire ce ux danimation, comment repr esenter de mani` ere rigoureuse lactivit e dun agent et les interactions entre agents? Laction est dabord modication. Initialement, on a tendance ` a consid erer le monde comme immobile, les actions des agents venant modier cet etat stable pour quil prenne ensuite un autre etat stable. Laction est alors ce qui modie l etat global du monde. M eme sil sagit dune des th eories les plus en vigueur actuellement au sein de lintelligence articielle, nous verrons quelle est mal adapt ee a ` la prise en compte des interactions dans lesquelles plusieurs agents peuvent accomplir des actions en m eme temps et donc se trouver en situation de conit. Cest pourquoi dautres th eories tentent de saranchir du probl` eme de laction en l eliminant, soit en ayant recours ` a des mod` eles m ecaniques du mouvement, soit en ne consid erant que
4.1. LA MODELISATION
151
lencha nement des ev enements sans prendre en compte l etat de lenvironnement. Un autre probl` eme concerne la r eaction du milieu aux actions des agents et le fait quune m eme action puisse avoir des r esultats di erents. Car laction est aussi un geste, une tentative dinuer sur le monde pour le modier selon nos d esirs. Et la cons equence de ce geste ne suit pas toujours lintention qui le cause. Le but, source de lintention, porte sur un r esultat attendu; le geste est un moyen de laccomplir. Mais entre le geste et le r esultat peuvent sins erer des impond erables qui font que le r esultat nest pas ce que nous escomptions. Car lunivers est soumis ` a des lois, auxquelles nous ne pouvons pas nous soustraire. Nous proposons, mais lunivers dispose. Il combine lensemble de nos gestes, de nos tentatives et produit une r eponse qui est la cons equence de cette combinaison en fonction des lois de lunivers dans lequel ces gestes ont et e accomplis. Mais sans geste, le monde ne reste pas dans un etat stable comme semble le croire limpression premi` ere. Il evolue, se transforme sans que lon ait besoin de supposer un quelconque geste ext erieur ou, comme le pr etendait Aristote, un premier moteur qui viendrait le mettre en mouvement. De ce fait, il faut distinguer le geste et les cons equences du geste, lacte et la r eponse de lunivers ` a nos actes. Cest pourquoi nous proposerons une th eorie personnelle qui mod elise laction comme un syst` eme de r eponses ` a la production dinuences produites par les agents. Laction nest plus alors envisag ee comme le r esultat de ce que font les agents, mais comme le r esultat des r eactions de lunivers aux inuences des agents.
4.1.5
Mod eliser laction
Il nexiste pas quune seule voie pour mod eliser les actions et leurs cons equences. Plusieurs formalismes, plus ou moins math ematiques sont disponibles pour rendre compte de laction, de lactivit e des agents et de l evolution dun SMA. Voici quelques-uns des formalismes examin es par la suite: 1. Laction comme transformation dun etat global. Le mod` ele fonctionnel par transformation d etats est certainement le plus classique, et nous lexaminerons en premier. Toute la th eorie de la planication en IA a et e d evelopp ee dans ce cadre et la plupart des th eories sur la planication multi-agent sy r ef` erent. Il est donc indispensable de bien le conna tre. De plus, il sert de base ` a presque tous les autres mod` eles de laction qui ` a la fois sy rapportent et sen distinguent. 2. Laction comme r eponse ` a des inuences. Mais le mod` ele par transformation d etats soure de nombreuses limitations. Pour les r esoudre, je proposerai un mod` ele fond e sur la notion dinuence qui se pr esente comme une extension du mod` ele pr ec edent. 3. Laction comme processus informatique. Laction peut etre aussi vue comme un ensemble d ev enements produits et consomm es par des processus informatiques. On utilise alors des outils th eoriques tels que les automates ` a etats nis ou les r eseaux de Petri pour formaliser les comportements des agents et celui de lenvironnement.
152
4. Laction comme modication locale. Dans les mod` eles locaux, laction est consid er ee comme une modication locale qui se propage le long dun r eseau dautomates. Sils posent de nombreux probl` emes quant ` a la description des agents, ces mod` eles, en particulier avec les automates cellulaires, permettent de repr esenter facilement des environnements. 5. Laction comme d eplacement physique. Dans les mod` eles g eom etriques et physique, les actions sont consid er ees comme des d eplacements dans un espace g eom etrique. Ce mod` ele est evidemment tr` es pratique lorsquil sagit de d ecrire les actions dagents mobiles. 6. Laction comme commande. Dans le mod` ele cybern etique, laction est une commande. On ne sint eresse plus aux transformations apport ees par lagent dans lenvironnement mais seulement ` a ce quil per coit de cet environnement et aux commandes quil envoie ` a ses organes eecteurs de mani` ere ` a satisfaire un but ou une pulsion interne. Ce mod` ele est surtout utilis e pour d ecrire le comportement dagents r eactifs. Enn, je pr esenterai un mod` ele personnel qui tente de synth etiser les mod` eles pr ec edents de mani` ere ` a simplier la description et lintelligibilit e des syst` emes multi-agents. Il d ecrit les agents, leur comportement et lenvironnement comme un ensemble de composants interconnect es. Ce mod` ele, qui utilise le formalisme Bric, sera utilis e tout au long de cet ouvrage pour d ecrire les comportements des agents et leurs interactions.
4.2
4.2.1
Laction comme transformation dun etat global

Une repr esentation fonctionnelle de laction
Les conceptions classiques de laction en intelligence articielle reposent sur une approche par etat et transformation d etats. On suppose quil est possible de caract eriser lensemble (g en eralement discret) des etats possibles du monde. Une action op est alors d enie comme une transition d etat, cest-` a-dire comme un op erateur dont lex ecution produit un nouvel etat. Ainsi, ` a partir dune situation 1 de , lex ecution de laction op produit un nouvel etat 2 de . Par exemple, si ` a l etat 1 , lagent A se trouve au lieu L1 et quon applique laction op = aller(A, L1 , L2 ), la situation 2 qui en r esulte verra lagent d eplac e au lieu L2 (` a condition bien s ur que lop erateur soit applicable, cest-` a-dire quil ny ait pas dobstacle ` a laccomplissement de laction): 2 = Exec(aller(A, L1, L2), 1 ) o` u Exec est lop erateur dex ecution des op erateurs dactions, cest-` a-dire une fonc1 tion de type Op .
1
Un exemple analogue est donn e par la fonction Apply en Lisp.
4.2. LACTION COMME TRANSFORMATION DUN ETAT GLOBAL
153
On peut faire un parall` ele entre cette approche et celle de la pellicule dun lm. Chaque image repr esente un etat du monde et les actions d ecrivent le passage dune image ` a une autre. Cest alors le d eroulement du lm qui donne lillusion dune continuit e du mouvement.
4.2.2
Les op erateurs de type STRIPS
Mais comment d ecrire les situations, cest-` a-dire les etats du monde et les transformations? En 1971, pour r epondre ` a des probl` emes de planication, Fikes et Nilsson (Fikes et Nilsson 1971) propos` erent une repr esentation, connue encore sous le terme de repr esentation ` a la Strips en lhonneur du premier planicateur ` a lavoir utilis ee. Dans cette repr esentation, qui est encore la plus employ ee dans les probl` emes de planication en IA et en IAD, un etat du monde est d ecrit comme un ensemble de formules atomiques dont la conjonction est suppos ee armer la validit e de cet etat. Supposons par exemple que lon veuille repr esenter un monde dans lequel un robot, Clotaire, est capable de se d eplacer de pi` ece en pi` ece pour aller chercher des outils ou dautres objets du m eme genre, comme le montre la gure 4.2. On suppose que Clotaire est capable de se diriger dans lune des quatre directions (nord, sud, est, ouest) et de prendre ou de d eposer des objets. On suppose aussi quune pi` ece est un lieu atomique, un point dans un espace, et que les positions de Clotaire et des outils sont relatives aux pi` eces repr esent ees par leur num ero. Un etat du monde
Hangar 3
9 Remise 12
Atelier 2
11
10
Figure 4.2: Clotaire est un agent qui peut transporter des objets dun lieu ` a un autre. est d ecrit par lensemble des formules atomiques qui sont vraies dans cet etat2 . Par
Plus pr ecis ement, il faudrait d enir un etat non pas comme un ensemble de formules mais comme une structure alg ebrique pour laquelle ces formules sont satisfaites. Il sut pour cela de d enir chaque etat comme une structure alg ebrique =< D, R, F, C > o` u D est un ensemble d el ements appel es domaine de la structure et qui repr esente les ensembles des entit es dont on parle, R et F sont respectivement lensemble des relations et des fonctions d enies sur cette structure, et C est un ensemble d el ements distingu es de D, les constantes. On dit alors quune formule de la forme p(t1 , ..., tn ) est satisfaite dans l etat , ce que lon note |= p(t1 , .., tn ) si et seulement si < I (t1 ), ..., I (tn ) > R. Il en est de m eme pour les constantes o` u |= ci si et seulement si I (ci ) C et o` u I est une fonction dinterpr etation des formules. Pour g erer un ensemble d etats, il sut de d enir comme un ensemble de structures alg ebriques i = < Di , Ri , Fi , Ci > telles que
2
154
exemple, pour dire que Clotaire se trouve dans la pi` ece num ero 2 ` a l etat s1 il sut de pr eciser que la formule: positionRobot(Clotaire,2) appartient ` a s1, et il en est de m eme pour la d enition de la position des outils ainsi que de toutes les relations g eographiques que lon peut exprimer entre ces pi` eces lorsquelles communiquent: s1 = { positionRobot(Clotaire,2), positionOutil(Pince,12), nord(1,2), sud(2,1), est(1,4),... } Dans cette repr esentation, les op erateurs caract erisant les actions sont d ecrits sous la forme de triplets: op = <pr e, suppr, ajouts> o` u pr e, suppr et ajouts sont des ensembles de formules atomiques. pr e d ecrit la pr econdition de lop erateur, cest-` a-dire la condition qui doit etre v eri ee pour que lon puisse appliquer lop erateur. suppr et ajouts sont deux ensembles de propositions qui d ecrivent respectivement les faits quil est n ecessaire de retirer ou dajouter ` a l etat courant du monde pour passer dans l etat suivant. suppr et ajouts sont donc ce qui caract erise la transformation pour passer dun etat au suivant et cette transformation se r esume ` a la suppression et ` a lajout de nouvelles propositions a lensemble des propositions d ` ecrivant l etat pr ec edent. Par exemple, un op erateur permettant ` a Clotaire daller vers le sud serait formul e ainsi: Op erateur allerVersSud(x) pr e: positionRobot(x,l1), sud(l1,l2) suppr: lieu(x,l1) ajouts: lieu(x,l2) fin Et lapplication de cet op erateur ` a la situation initiale s1 produit un nouvel etat s2 dans lequel Clotaire sest d eplac e dans la pi` ece 2 (ou plus exactement dans lequel la formule positionRobot(Clotaire,2) ne sy trouve pas, celle-ci etant remplac ee par la formule positionLieu(Clotaire,1)): s2 = Exec(allerVersSud(Clotaire),s1) et donc
i , i , Di = Dj et Ci = Cj (il ny a que les fonctions et les relations qui peuvent evoluer entre deux etats, les domaines et les constantes restent inchang ees). On interpr` ete alors les op erations op comme des descriptions de fonctions de dans , qui associent ` a un etat de un etat op( ) de . Cette construction des etats est utilis ee par E. Pednault (Pednault 1986) pour son langage ADL et on pourra aussi consulter (Jacopin 1993) pour une pr esentation de quelques s emantiques associ ees ` a des notions daction voisines de Strips. Par la suite, nous en resterons ` a la d enition simpli ee dans laquelle on appelle etat un ensemble de formules. Pour plus de pr ecisions sur la description logique des etats, on pourra lire le livre (Genesereth et Nilsson 1987), qui pr esente simplement le probl` eme de la d enition dactions par un appareil logique.
4.2. LACTION COMME TRANSFORMATION DUN ETAT GLOBAL s2 = { positionRobot(Clotaire,1), positionOutil(pince,12), nord(1,2), sud(2,1), est(1,4),..
155
Les op erateurs ne d ecrivent pas enti` erement les etats initiaux et naux dune transition, mais seulement ce qui se transforme, et on suppose que tout ce qui ne bouge pas reste inchang e dun etat ` a lautre.
4.2.3
Planier avec des op erateurs de type STRIPS
Malgr e sa pauvret e, cette mod elisation de laction est bien adapt ee aux probl` emes de planication tels que lIA se les ait pos es depuis ses d ebuts. En eet un probl` eme de planication classique repose sur la donn ee dune situation initiale init et dune situation nale f in ` a laquelle on d esire aboutir, toutes deux appartenant ` a , et dun ensemble dop erateurs Op d enis comme ci-dessus par des fonctions de dans . R esoudre un probl` eme dans un tel contexte, cest trouver la suite dop erateurs X1,..,Xi,..,Xn o` u les Xi sont des variables qui prennent leurs valeurs dans Op, telles que: f in = Exec(Xn .. Xi .. X1 , init ) o` u le signe repr esente la composition fonctionnelle. Dans ce cadre, un probl` eme de planication peut etre d ecrit formellement sous la forme du quadruplet: P P = < , init , f in , Op > La solution dun probl` eme de planication est donn ee par la production dun ensemble de plans P , chaque plan p P etant repr esent e sous la forme dune suite X1 , ..., Xn de variables prenant leurs valeurs dans Op telles que: 1. laction associ ee ` a X1 est applicable ` a l etat initial init , ou autrement dit, init se trouve dans le domaine de lop erateur repr esent e par X1 ; 2. i 1 < i < n, lop erateur repr esent e par Xi est applicable ` a tous les etats r esultants de lapplication de Xi1 , cest-` a-dire que l etat r esultant de lapplication de Xi1 appartient au domaine de laction repr esent ee par Xi ; 3. lapplication de Xn produit un etat nal dans lequel se trouve f in , ce qui signie que f in se trouve dans lespace darriv ee (ou codomaine) de laction repr esent ee par Xn . La gure 4.3 repr esente la forme g en erale dun probl` eme de planication. A partir de la sp ecication des situations initiales, des buts et de lensemble des actions disponibles, le planicateur trouve un ensemble de plans {pi } parmi lesquels le plan p ` a ex ecuter est choisi. Ce plan est alors transmis ` a lex ecuteur qui se charge de laccomplir. Dans de nombreux syst` emes, le planicateur se contente de fournir un seul et unique plan. Dans ce cas, le module s electionneur peut etre supprim e.
156
Buts Init Actions Planificateur {pi } Slectionneur p Excuteur
Plans possibles
Plan excuter
Figure 4.3: Planier, cest produire un ensemble de plans parmi lesquels un seul sera ex ecut e.
C D A B A D B C
Figure 4.4: Un exemple de manipulation de cubes Lexemple le plus connu dans le domaine de la planication est celui du monde des cubes. Le probl` eme consiste ` a empiler des cubes les uns sur les autres de mani` ere a obtenir un empilement pr ` ecis ` a partir dun empilement initial en ne bougeant quun seul cube ` a la fois. La gure 4.4 donne un exemple de situation initiale et nale. Ces situations sont d enies simplement sous la forme dun ensemble de formules atomiques: init = {sur(C,D), sur(D,A), sur(A,Table), sur(B,Table)} f in = {sur(A,D), sur(D,Table), sur(B,C), sur(C,Table)} Les op erateurs correspondant aux deux actions classiques dempilement dun cube sur lautre et de d ep ot du cube sur la table peuvent s ecrire ainsi: Op erateur poser(x,y) pr e: libre(x),libre(y), sur(x,z) suppr: libre(y), sur(x,z) ajouts: libre(z), sur(x,y) fin Op erateur poserTable(x) pr e: libre(x), sur(x,y) suppr: sur(x,y) ajouts: libre(y), sur(x,Table)
4.2. LACTION COMME TRANSFORMATION DUN ETAT GLOBAL fin
157
Lop erateur poser(x,y) indique que pour poser un cube x sur un cube y, il faut que x soit libre, que y soit libre egalement et que x soit initialement sur z. Apr` es application de lop erateur poser(x,y), l etat du monde est tel que x nest plus sur z mais sur y, et tel que y nest plus libre mais z lest devenu. Mais comment fonctionne un planicateur de type Strips? Comme il existe de nombreuses variantes et que le propos nest pas ici de d evelopper lensemble des techniques de planication, nous nous contenterons de donner un aper cu susant pour comprendre la probl ematique de la planication multi-agent. An dillustrer cette technique nous reprendrons lexemple classique de lempilement des cubes. Supposons que lon veuille passer dun empilement initial ` a un autre empilement, comme le montre la gure 4.4. La technique g en erale de planication consiste ` a partir de l etat nal et ` a rechercher les op erateurs qui permettent dobtenir cet etat, en appliquant une technique r ecursive. Pour un etat nal donn e, on prend tous les op erateurs n ecessaires pour obtenir cet etat, puis on essaye de savoir sils sont applicables et de d eterminer les cons equences de leur application. Par exemple, pour obtenir la situation nale {sur(A,D), sur(D,Table), sur(B,C), sur(C,Table)} il sut dappliquer les op erateurs poser(A,D), poser(B,C), poser(C,Table) et poser(D,Table) ` a la situation pr ec edente: Op erateur: pr e: suppr: ajouts: fin Op erateur: pr e: suppr: ajouts: fin Op erateur: pr e: suppr: ajouts: fin Op erateur: pr e: suppr: ajouts: fin poser(A,D) libre(A),libre(D), sur(A,z) libre(D), sur(A,z) sur(A,D),libre(z)
poser(B,C) libre(B),libre(C), sur(B,z) libre(C), sur(B,z) sur(B,C),libre(z)
poserTable(C) libre(C), sur(C,y) sur(C,y) libre(y),sur(C,Table)
poserTable(D) libre(D), sur(D,y) sur(D,y) libre(y),sur(D,Table)
158
Mais ces op erateurs sont-ils eectivement applicables? Sachant que la situation initiale est la suivante {sur(C,D), sur(A,Table), sur(B,Table), sur(D,A), libre(C), libre(B)} on peut appliquer soit lop erateur poser(B,C) soit lop erateur poserTable(C). En appliquant le premier on obtient l etat {sur(B,C), sur(C,D), sur(A,Table), libre(Table), sur(D,A), libre(B)} qui emp eche lapplication de lop erateur poser(C,Table) puisque C nest plus libre et quil nest plus possible dappliquer lop erateur poserTable(C). Donc il est pr ef erable dappliquer le deuxi` eme op erateur et dobtenir l etat: {sur(C,Table), sur(A,Table), sur(B,Table), sur(D,A), libre(C), libre(B), libre(D)} On peut donc appliquer maintenant soit lop erateur poserTable(D), soit lop erateur poser(B,C). En eet ces deux op erateurs sont totalement ind ependants puisque lapplication de lun nemp eche pas lapplication de lautre et que le r esultat nal est ind ependant de leur ordre dapplication. Lapplication de ces deux op erateurs dans un ordre quelconque produit l etat: {sur(B,C) sur(C,Table), sur(D,Table), sur(A,Table), libre(B), libre(A), libre(D),libre(Table)} Il ne reste alors plus qu` a appliquer lop erateur poser(A,D) pour achever la construction du plan (g. 4.5).
poserTable(C) poser(B,C) poserTable(D) poser(A,D)
Figure 4.5: Un plan lin eaire pour la r esolution du probl` eme des cubes de la gure 4.4
4.2.4
Quelques cat egories de plans
Il est possible de classer les plans en plusieurs cat egories en fonction de la structure des plans et de la mani` ere dont les buts interagissent. On parle de planication lin eaire si les buts peuvent etre satisfaits ind ependamment les uns des autres, cest-` a-dire sils sont tels que lapplication des op erateurs ninduit aucun conit dans la satisfaction de ces buts. Par exemple, le probl` eme des cubes de la gure 4.6 peut etre r esolu par un planicateur lin eaire car tous les buts de la situation nale {sur(B,A), sur(D,C), sur(A,Table), sur(C,Table)}
159
A B
C D
B A
D C
Figure 4.6: Un probl` eme pouvant etre r esolu ` a laide dun planicateur lin eaire peuvent etre r esolus s epar ement. En eet pour que B soit sur A, il faut d eposer A sur la table et placer B sur A. Dautre part pour que D soit sur C, il faut poser C sur la table et placer D sur C. Ces deux lignes de plan sont totalement compatibles, ce qui permet de traiter chacun des probl` emes ind ependamment, les actions servant ` a r esoudre un but ninteragissant pas avec celles qui satisfont lautre but. Evidemment, la plupart des situations courantes ne sont pas lin eaires, car les buts ne sont pas ind ependants. Dans ce cas, on parle de planication non lin eaire. Par exemple, le probl` eme de la gure 4.7, apparemment plus simple puisquil ne fait intervenir que 3 cubes, ne peut pas etre r esolu par un planicateur lin eaire. En eet, la situation nale est donn ee par
C A B C B A
Figure 4.7: Un probl` eme de planication non lin eaire {sur(C,D), sur(B,A), sur(A,Table)} D` es que A est sur la table, il existe deux actions possibles qui correspondent au but nal: soit placer C sur B, soit placer B sur A. Si lon choisit la premi` ere possibilit e, on se trouve dans une impasse, car il nest plus possible de placer B sur A ensuite. De ce fait, lordre dapplication des op erateurs inue sur le r esultat nal, et la construction du plan doit tenir compte de cet ordre, do` u le terme de non-lin earit e qui est associ e a ce type de plan et surtout aux planicateurs capables de traiter cette situation. ` Il existe une autre sorte de distinction qui pr esente un int er et certain dans le cas de syst` emes multi-agents et porte sur la di erence entre plans totaux et plans partiels. Les premiers sont constitu es dune suite ordonn ee des op erateurs ` a appliquer. Le plan de lexemple de la gure 4.4 est un plan total car il est compos e dune s equence dop erateurs dispos es dans un ordre total. Mais, comme nous lavions vu, il existe plusieurs plans equivalents qui permettent dobtenir le m eme r esultat et qui ne di` erent que par lordre dex ecution. Dans ce cas, il nest pas n ecessaire dordonner totalement les op erateurs, et il est pr ef erable de les conserver sous la forme dun ordre partiel, mod elis e sous la forme dun graphe acyclique comme le montre la
160
gure 4.8. On obtient alors des branches parall` eles dex ecution dont nous verrons que les syst` emes multi-agents peuvent ais ement tirer prot.
poserTable(D) poserTable(C) poser(B,C) poser(A,D)
Figure 4.8: Un plan partiel correspondant ` a lexemple de la gure 4.6 Au moment de lex ecution du plan, on d ecidera de la mani` ere de parcourir ce graphe, de mani` ere ` a lin eariser le plan. Un autre int er et des plans partiels est d etre consid er es comme plus simples ` a produire m eme (et surtout) sil sagit de plans non lin eaires. Le principe consiste ` a retarder au maximum les choix portant sur lordre dans lequel des actions doivent etre appliqu ees. Dans ce cas, planier seectue en deux etapes. Dans un premier temps on construit un plan partiel sans tenir compte des conits eventuels, puis, dans un second temps, on ane ce plan de mani` ere ` a d eterminer les conits eventuels et ` a lin eariser le plan. Nous reverrons au chapitre 8 la probl ematique de la planication, mais cette fois-ci appliqu ee ` a plusieurs agents. Les probl` emes qui se posent sont nettement plus complexes et encore peu de mod` eles g en eraux permettent de les r esoudre.
4.2.5
Limites des planicateurs de type STRIPS
La planication par op erateurs de type Strips suppose que les op erateurs d ecrivent le passage dun etat ` a un autre en explicitant uniquement ce qui est modi e lors de ce passage. On dit alors que ce type de planication suit les hypoth` eses de Strips (Waldinger 1977): 1. On ne peut appliquer quun seul op erateur ` a un moment donn e, lequel pr ecise la mani` ere dont on passe dun etat du monde ` a un autre. On ne peut donc pas eectuer plusieurs actions en parall` ele. 2. Toutes les cons equences des modications apport ees par les actions sont explicitement pr ecis ees dans la partie ajout et suppression des op erateurs. 3. Un op erateur repr esente une action instantan ee. Comme nous lavions pr ecis e plus haut, laction nest pas repr esent ee dans son d eroulement (elle ne prend aucun temps) mais uniquement par le r esultat des transformations quelle apporte. Evidemment, ces hypoth` eses contraignent s erieusement les possibilit es de repr esentation des actions. La deuxi` eme hypoth` ese notamment est particuli` erement restrictive. Elle pr ecise que toutes les cons equences des actions doivent etre directement cod ees dans les op erateurs. Parfois cela pose de s erieux probl` emes. Par exemple,
161
supposons que lon veuille repr esenter un monde cher aux ecoliers de robinets et de baignoires qui se remplissent et qui fuient. Lop eration douvrir un robinet peut s ecrire ainsi: Op erateur ouvrirRobinet pr e: robinet(r), ferm e(r) suppr: ferm e(r) ajouts: coule(r,Eau), ouvert(r) fin Supposons maintenant que nous ayons un monde constitu e dun robinet R1 initialement ferm e et dun verre V1 vide qui se trouve juste au-dessous de R1. L etat initial du monde est alors: S1 = {verre(V1), vide(V1), robinet(R1), ferm e(R1), sous(V1,R1)} Lapplication de lop erateur ouvrirRobinet, produit le nouvel etat S1: S2 = {verre(V1), vide(V1), robinet(R1), ouvert(R1), coule(R1,Eau), sous(V1,R1)} dans lequel on peut constater que le verre reste vide bien que leau coule eectivement! En eet, pour d eduire quun verre se remplit sil se trouve sous un robinet duquel de leau coule, il faudrait un op erateur suppl ementaire de la forme: Op erateur remplirVerreSousRobinet pr e : robinet(r), verre(v), sous(v,r), coule(r,Eau), vide(v) suppr: vide(v) ajouts: rempli(v,Eau) fin et une information suppl ementaire qui nous indique que lapplication de cet op erateur est entra n ee par lapplication de lop erateur pr ec edent, an de disposer dune repr esentation qui sache g erer les cons equences des actions. Une telle extension est en dehors du cadre des planicateurs ` a la Strips et peu de planicateurs g en eraux savent saccommoder de la causalit e, bien que de nombreuses recherches aient et e accomplies dans le probl` eme de la repr esentation des liens causaux (Shoham 1988) qui n ecessitent une description plus complexe de laction.
4.2.6
Limites des repr esentations classiques de laction
Au-del` a des probl` emes de planication, cette repr esentation daction par transformation d etats montrent de nombreuses faiblesses d` es que lon s ecarte de lunivers initial pour lequel elle a et e d enie. Elles se situent ` a deux niveaux: 1. Au niveau du langage de description de laction lorsquon se borne ` a des op erateurs de type Strips.
162
2. Au niveau de la conception g en erale de laction consid er ee comme une transformation dun etat dans un autre. La premi` ere limite a et e souvent reconnue comme terriblement contraignante car elle ne permet de d ecrire que des actions tr` es el ementaires. Pour juger de la limite de cette notation, il faut seulement remarquer quil nest pas possible de d enir dans ce langage une action telle que: poser sur la table tous les cubes qui sont eux-m emes sur un cube. De ce fait dautres langages ont et e propos es pour pallier cet inconv enient, en am eliorant les capacit es de description des op erateurs tout en restant capable de trouver des plans daction (pour avoir une synth` ese de ces langages de description, de leurs possibilit es, et des probl` emes quils soul` event, voir (Jacopin 1993)). La seconde limite est plus ne car beaucoup moins etudi ee. Elle repose sur trois postulats qui posent probl` eme dans le cas de syst` emes multi-agents. 1. Postulat de staticit e. le mod` ele Strips consid` ere que le monde est a priori statique et que les seules evolutions possibles sont le fruit des actions des agents. Pour mod eliser un comportement sp ecique du monde (par exemple des changements atmosph eriques, l evolution du niveau dun euve), il faut donc express ement introduire des agents ext erieurs, tels que latmosph` ere ou le euve. Mais ce qui est plus grave, cest lincapacit e de ce syst` eme de prendre en compte la premi` ere loi de Newton: Tout corps pers ev` ere en son etat de repos ou de mouvement rectiligne uniforme, sauf si des forces imprim ees le contraignent den changer. En eet, pour un mobile anim e dun mouvement rectiligne uniforme, le passage dune position ` a une autre ne n ecessite pas lintervention dun agent car ses di erences positions successives sont les simples r esultantes du mouvement. Or les op erateurs de type Strips ne d ecrivent pas les mouvement des objets du monde, mais seulement les transformations obtenues par application dactions. De ce fait, les repr esentations par transformation d etats sont pr e-newtonniennes dans leur expression et toute description de mouvement devra utiliser une autre technique. 2. Postulat de s equentialit e. Un autre inconv enient provient de la dicult e ` a traduire les actions simultan ees. Par exemple, supposons que deux agents A et B aient ` a pousser un cube comme le montre la gure 4.9.
Figure 4.9: Deux agents tentent de pousser un cube en sens contraire. Si lon applique ce mod` ele de laction et que lon dispose de lop erateur d eplacer(x,y,d) o` u d est d eni comme un d eplacement dans la direction oppos ee o` u se trouve lagent x, quel sera le r esultat de lapplication de ces op erations aux deux agents A et B et au cube C? Les mod` eles fond es sur lapproche Strips supposent que lon appliquera soit d eplacer(A,C,+1), soit d eplacer(B,C,-1) ou linverse. Dans le premier cas,
163
le cube ira dabord en 3 puis reviendra en 2, et dans le second il ira dabord en 1 avant de sen retourner en 2, ecrasant peut- etre au passage lun des agents, mais il ne restera jamais immobile sous la pouss ee contraire des deux agents. 3. Postulat duniversalit e. Les actions ne sont pas d ecrites dans leur d eroulement mais par leurs r esultats. On ne distingue pas les actions elles-m emes, cest-` a-dire ce que font les agents, des cons equences de ces actions, ce qui n ecessite de d ecrire dans les actions toutes les catastrophes eventuelles qui peuvent survenir. En etant d ependantes de lenvironnement et des lois de lunivers, les descriptions daction doivent prendre en compte tous les cas de gure possibles, m eme ceux qui r esultent dune erreur ou de situations a priori inattendues. Ainsi, laction Avancer dun robot doit contenir le fait quil lui est possible de tomber dans un trou, d etre bloqu e contre un mur ou d etre ensabl e. Par exemple, si une personne peut, en se d epla cant, ecraser une fourmi, il faudra sp ecier explicitement tout ce qui peut eventuellement etre ecras e par le d eplacement dune personne. Le postulat de s equentialit e associ e` a celui duniversalit e pose un autre probl` eme lorsque deux agents agissent simultan ement: Comment d ecrire les cons equences dune collision eventuelle entre deux corps mobiles (g. 4.10)? Si lop erateur Avancer(a,dx,dy) repr esente le d eplacement dun corps a dun quanti` eme despace repr esent e par son vecteur vitesse < dx, dy >, comment d ecrire la rencontre entre deux mobiles et ses r epercussions sur la direction et la vitesse des mobiles?
Figure 4.10: Deux mobiles a et b se rencontrent et provoquent une collision. Il existe evidemment quelques solutions, linformaticien restant rarement d emuni: en ajoutant des arguments suppl ementaires pour synchroniser les actions (George 1983) ou r eier le temps, on peut r esoudre certains de ces probl` emes au prix dune ecriture plus complexe, et donc moins naturelle, des actions. Mais cela nest pas toujours susant et il faut parfois am eliorer la puissance dexpression du langage. Cest ce que fait E. Pednault avec ADL (Pednault 1986) dont il etend la puissance de description de mani` ere ` a pouvoir appliquer des quanticateurs universels et existentiels sur les variables, ainsi qu` a repr esenter explicitement des modications des valeurs fonctionnelles (champ update en ADL). En passant aussi le temps comme param` etre, il peut ainsi caract eriser des actions qui se passent au m eme temps t, m eme si, ` a lex ecution, les actions sont appliqu ees s equentiellement. De plus, il ore la possibilit e de d ecrire des m ecanismes ressemblant ` a des aectations de variables globales dans un langage de programmation, ce
164
qui lui donne la capacit e de repr esenter presque tout ce que lon peut coder dans un langage informatique. Pour r esoudre le probl` eme de collision, on peut coder dans le corps des actions le fait que sil existe un autre objet mobile au m eme endroit, alors il y aura un choc (et eventuellement une explosion), cest-` a-dire en d ecrivant explicitement dans les op erateurs de mouvement les tests permettant de v erier sil y a choc ou non. Mais il faut pour cela d ecrire explicitement dans les op erateurs tout ce qui concerne les chocs et leurs cons equences, ce qui devient rapidement tr` es lourd, et nous ram` ene au probl` eme pos e par le postulat duniversalit e. En outre, il faut faire tr` es attention aux probl` emes de synchronisation dactions, sous peine de rater des collisions, une dicult e bien connue des programmeurs de jeux vid eo. Mais dans tous ces cas, il nous semble quil sagit plus de trucs de repr esentation qui consistent ` a coder dans les objets de lenvironnement la synchronisation eventuelle des actions, que dune v eritable prise en compte de la simultan eit e des actions. Dans le cadre des syst` emes multi-agents, le probl` eme est patent: alors que nous supposons en permanence que les actions des di erents agents sont eectu ees en parall` eles, nous ne disposons pas de formalisme ad equat pour d ecrire facilement des actions simultan ees et donc repr esenter des actions collectives. Cest ` a la d enition dun tel formalisme que la section suivante est consacr ee.
4.3
4.3.1
Laction comme r eponse ` a des inuences

Pr esentation g en erale
Dans cette section, nous proposons un mod` ele de laction fond ee sur des principes dinuences et de r eactions aux inuences. Ce mod` ele reprend certains des el ements des approches fond ees sur la transformation d etats en l etendant de mani` ere ` a prendre en compte les cons equences des actions simultan ees des agents et donc de mod eliser les ph enom` enes dus ` a des interactions entre agents. De plus, ce mod` ele permet de d ecrire aussi bien les actions consid er ees comme des d eplacements dans un espace physique (et donc dint egrer les formalismes de la m ecanique classique) que celles qui rel` event dautres espaces (tels que laction d ecrire un programme par exemple). De plus, comme nous le verrons, il ne sagit que dune extension du mod` ele de laction par transformation d etats, et nous verrons que lon retrouve ce mod` ele classique comme un cas particulier, lorsque les modications du monde ne proviennent que dun agent unique. Il sagit donc dune th eorie g en erale de laction permettant den repr esenter ses di erents aspects tout en b en eciant des travaux eectu es dans chacun de ces domaines tels que celui du mouvement physique, des propagations locales par automates cellulaires ou m eme de la planication classique, qui nen sont que des cas particuliers. Le probl` eme des th eories pr ec edentes viennent de ce quelles confondent dans laction ce qui est produit par les agents de ce qui se produit eectivement. Elles m elangent le geste et le r esultat du geste. Il sut donc de s eparer ces deux notions pour que la plupart des probl` emes rencontr es pr ec edemment disparaissent. Un agent, quil sagisse dun robot qui pousse une porte ou dune personne qui change de place, ex ecute eectivement un geste. Mais le r esultat de ce geste d epend des autres gestes
` DES INFLUENCES 4.3. LACTION COMME REPONSE A
165
r ealis es par les autres agents, comme des capacit es de r eaction de lenvironnement. Les gestes sont ce que nous appelons des inuences, cest-` a-dire des moyens de modier le cours des choses sil ny avait pas eu ces inuences, et les r esultats de ces gestes sont obtenus en appliquant les lois de lunivers. Ces derni` eres sont donc des r eponses de lenvironnement qui agit en composant lensemble des inuences quil re coit des agents, puis, en fonction de ses propres particularit es, il en d eduit un nouvel etat global du monde. Lavantage de ce mod` ele qui est propos e ici est de pouvoir servir de cadre global pour int egrer les travaux d evelopp es dans di erents domaines: par exemple, dans le domaine de la m ecanique classique, l etat du monde est donn e par la position et la vitesse dun ensemble de corps. Les inuences sont alors les forces qui sexercent sur les corps ` a un instant t et lapplication des lois de lunivers consistent simplement a faire le bilan des forces en pr ` esence et ` a en d eduire, en fonction des positions et vitesses, la position et la vitesse des corps ` a linstant t + t. Dans un autre domaine, celui du contr ole, les inuences sont d ecrites comme des modications des variables de commandes du syst` eme ` a contr oler, et les lois de lunivers correspondent ` a la r eponse du syst` eme ` a ces valeurs dentr ees. Enn, comme nous lavons dit, si lon se r esume ` a un syst` eme mono-agent, et que les seules actions ` a prendre en compte dans le monde sont celles accomplies par lagent, alors ce mod` ele de laction devient identique ` a celui qui fonctionne par transformation d etats, les seules inuences ` a consid erer provenant dun seul agent.
4.3.2
Les etats
Le mod` ele inuence/r eaction etant une extension du mod` ele Strips, nous reprendrons la d enition des etats de ce dernier. Un etat du monde de est d ecrit a laide dun ensemble de formules atomiques de la forme p(a1 , ...an ) o` ` u p est un pr edicat darit e n et les a1 , .., an sont des constantes ou des termes fonctionnels ne comportant pas de variables. Dans ce cadre, la situation 1 pr esent ee ` a la gure 4.9, peut etre d ecrite ainsi: 1 = {cube(C), agent(A), agent(B), lieu(C, 2), lieu(A, 1), lieu(B, 3)} Mais alors que les th eories classiques ne comprennent quune seule structure, l etat du monde, nous introduisons une autre structure appel e inuence qui repr esente lensemble des gestes, ou tentatives dactions, accomplis par les agents ` a partir de l etat courant du monde. Ces structures sont d ecrites elles aussi ` a laide dun ensemble de formules atomiques d enies ` a laide dun langage equivalent ` a celui des etats du monde, et on appelle lensemble de ces structures dinuence qui peuvent etre d ecrites ` a laide de ces formules. Les actions r esultent de la combinaison des gestes en inuences et de la r eaction de lenvironnement ` a ces inuences.
166
4.3.3
Actions et r eactions
Pour des raisons de simplicit e, un op erateur prendra lallure et la syntaxe Strips. Il sera repr esent e sous la forme dun triplet < nom, pre , post > o` u nom est une expression de la forme f (x1 , ..., xk ) et o` u les xi sont les seules variables autoris ees ` a appara tre dans les formes pre et post. pre et post sont des ensembles de formules de la forme p(a1 , ..., an ) o` u p est un pr edicat darit e n et les ai sont soit des constantes soit des variables. Lapplication de lop erateur produit un ensemble dinuences. pre d ecrit les conditions qui doivent etre v eri ees pour que lop erateur sapplique et post lensemble des inuences qui seront produites directement par cet op erateur lors de son application. Lapplication dun op erateur peut etre d ecrit par une fonction Exec qui prend un op erateur, un etat courant et retourne une inuence: Exec : Op Exec(op, ) = qui est tel que Exec(< nom, pre , post >, ) = P ost si pre ( ) est v eri e et {} sinon Par exemple, les op erateurs de d eplacement de la gure 4.9 peuvent etre d ecrits ainsi: d eplacer = < nom: d eplacer(x,y,d), pr e: agent(x), cube(y), post: pouss ee(y,d) > et la tentative de d eplacement du cube C par lagent A ` a partir dune situation 1 sexprime alors ainsi: Exec(de placer(A, C, +1), 1 ) et produit linuence 1 : 1 = {Pouss ee(C,+1)} Les actions peuvent etre compos ees pour d enir une inuence r esultant de la simultan eit e des actions ex ecut ees ` a un etat du monde donn e. Lop erateur de combinaison dactions simultan ees, que lon ecrit || fait simplement lunion des inuences des actions prises s epar ement. La fonction Exec peut alors etre etendue pour devenir un morphisme de lespace des actions muni de lop erateur de simultan eit e vers lensemble des inuences : Exec : (Op, ||) Exec(a||b, ) = Exec(a, ) Exec(b, ) Les lois de lunivers sont d ecrites ` a laide dune fonction React qui pr ecise comment le monde se transforme dun etat ` a lautre, et en particulier comment il r eagit aux inuences. React :
` DES INFLUENCES 4.3. LACTION COMME REPONSE A
167
Cette fonction fait donc lobjet dune description particuli` ere pour chaque type denvironnement. Par exemple, dans un environnement dans lequel les cubes r eagissent aux pouss ees en se d epla cant dune distance proportionnelle aux pouss ees, on pourrait d ecrire cette fonction de la mani` ere suivante: React = < etat : Lieu(c,x) influences: Poussee(c,d) faire: supprimer{Lieu(c,x)} ajouter{Lieu(c,x+dep)} avec dep = +/{d | Pouss ee(c,d)} > o` u / repr esente un op erateur de r eduction permettant dappliquer un op erateur binaire ` a un ensemble de valeurs (ex: +/{1 2 3 4} = 10). Cette loi se lit ainsi: le nouvel etat est egal ` a lancien etat dans lequel on a supprim e toutes les indications de lieu, et dans lequel on ajoute toutes les descriptions de localisation apr` es avoir somm e les pouss ees sexer cant sur les objets du monde. Ainsi, le r esultat de lex ecution simultan ee de n actions est d eni ainsi: = React(, Exec(op1 ||..||opn , )) La r esolution du probl` eme de la gure 4.9 peut donc sexprimer ainsi: les deux agents A et B ex ecutent simultan ement leurs actions et produisent un nouvel etat dinuence 1 : 1 = Exec(d eplacer(A, C, +1)||d eplacer(B, C, 1),1 ) = {Pouss ee(C, +1), Pouss ee(C, 1)} Lapplication des lois de lunivers ` a l etat 1 initial produit le nouvel etat dinuence 2 suivant: 2 = React(1 , 1 ) = {cube(C), agent(A), agent(B), lieu(C,2), lieu(A,1), lieu(B,3)} Le traitement de lexemple des collisions entre mobiles, pr esent e ` a la gure 4.10, s ecrit de la m eme mani` ere: on d ecrit lop erateur de mouvement sans se soucier des collisions, laissant leur traitement aux lois de lunivers. Lop erateur de mouvement s ecrit donc ainsi: avancer = < nom: avancer(a,dx,dy) pr e: mobile(a,x,y) post: trans(a,dx,dy) >
168
et la loi de lunivers est d enie par la fonction React suivante, qui indique que les deux mobiles produisent une explosion sils se trouvent ` a la m eme position et quils changent simplement de position autrement. React = < etat : lieu(a1,x1,y1), lieu(a2,x2,y2) influences: trans(a1,dx1,dy1), trans(a2,dx2,dy2) faire: Supprimer{lieu(a1,x1,y1), lieu(a2,x2,y2)} si x1=x2 et y1=y2 alors Ajouter{explosion(a1,x1,y1), explosion(a2,x2,y2)} sinon Ajouter{lieu(a1,x1+dx1,y1+dy1), lieu(a2,x2+dx2,y2+dy2)} > et qui se lit ainsi: sil existe deux mobiles a1 et a2, supprimer leur indication de position de l etat courant; si leurs positions sont identiques, alors dire quil y a explosion, sinon ajouter les inuences de d eplacement ` a leurs positions initiales. Par exemple, si ` a l etat initial deux mobiles a et b se trouvent aux points (50,50) et (70,70), l etat 1 peut etre d ecrit ainsi: 1 = {lieu(a,50,50), lieu(b,70,70)} Lapplication des op erateurs avancer(a,10,-20) et avancer(b,5,10) conduisent a la production des inuences: ` {trans(a,10,-20), trans(b,5,10)} et, par application des lois de lunivers, on obtient le nouvel etat: 2 = {lieu(a,60,-50), lieu(b,75,80)} Si par contre les d eplacements consistent ` a d eplacer les mobiles ` a laide des actions Avancer(a,20,0) et Avancer(b,0,-20), les inuences seront evidemment de la forme: {trans(a,20,0), trans(b,0,20)} et, par application des lois de lunivers, on obtient: 2 = {explosion(a),explosion(b)} du fait que les mobiles se trouvent au m eme endroit.
4.3.4
Int er et du mod` ele inuences/r eactions pour les SMA
Lint er et majeur du mod` ele des inuences/r eactions est de bien distinguer ce qui appartient en propre aux agents des ph enom` enes qui se passent dans lenvironnement. En di erenciant les inuences produites par lagent des r eactions du milieu, il est plus facile de concevoir des syst` emes multi-agents h et erog` enes, dans lequel les agents pr esentent des structures et des organisations internes di erentes. Il sut simplement de d ecrire lensemble des inuences que les agents peuvent eectivement produire et dutiliser lenvironnement comme un syst` eme int egrateur dont les lois de lunivers sont les m emes pour tous.
4.4. LACTION COMME PROCESSUS INFORMATIQUE
169
4.4
Laction comme processus informatique
Linformatique classique ne prend jamais en compte l etat global du monde. Elle con coit lunivers (informatique) comme un ensemble dactivit es qui sex ecutent en parall` ele et que lon nomme processus. Il est presque impossible de donner une d enition pr ecise de ce quest un processus, car il sagit dun concept primitif comme celui dobjet ou de machine. Disons que pour linformaticien, un processus est un programme en cours dex ecution, que pour lautomaticien, un processus est un ensemble de t aches qui se d eroulent s equentiellement ou en parall` ele, et que pour un th eoricien tel que Hoare, un processus repr esente le comportement dun objet (Hoare 1985). Lint er et de ce concept est de pouvoir d ecrire un comportement en ne sint eressant quaux etats initiaux et naux dactions consid er ees comme atomiques. Ces actions en sex ecutant donnent lieu ` a la production d ev enements observables, la succession de ces ev enements permettant de d enir un processus du point de vue de lobservateur.
Message: Rapporte(x,L1,L2)
Rapporte(x,L1,L2)
Aller L1
Prendre x
Aller L2
Dposer x
Figure 4.11: Le comportement de Clotaire repr esent e sous la forme dun processus Bien que la notion de processus soit un peu oue, elle correspond n eanmoins ` quelque chose de fondamental d` a es quon g en eralise son application ` a des syst` emes multi-agents. En consid erant que le monde est compos e dun ensemble de processus, on ne sint eresse plus comme dans la section pr ec edente ` a l etat global du monde, mais ` a lensemble des entit es qui le composent, ` a leurs comportement et, surtout, aux interactions qui s etablissent entre ces processus. Il est possible de repr esenter un processus sous la forme dune sorte dorganigramme, dans lequel les carr es correspondent aux actions atomiques et les ` eches ` a lordre de succession. Reprenons lexemple de Clotaire qui doit rapporter des objets en se dirigeant dans une suite de pi` eces et en supposant quil nait plus de probl` emes pour se rep erer.
170
Lorsque Clotaire re coit un message de la forme3 Clotaire << Rapporte(x,L1,L2) qui indique quil doit aller chercher lobjet x qui se trouve dans le lieu L1 et lapporter au lieu L2, il ex ecute le processus de la gure 4.11.
Message entrant
Recevoir message
Pr3 Pr2
ChercherPice(P,L)
Pr1
Rapporter(X,L1,L2)
Buffer des messages
Aller L1
Aller au Stock
Prendre X
Demander la pice P pice indisponible
Aller L2
Pice disponible
Dposer X
Aller L
Dire: pas disponible
Message vers l'agent demandeur
Dposer P
Figure 4.12: Le comportement de Clotaire est ici d ecrit par la combinaison de trois processus: deux processus Pr1 et Pr2, qui sexcluent mutuellement, et un processus de gestion des messages, Pr3. Mais lint er et des processus vient de la possibilit e de pouvoir les coupler entre eux en leur donnant la possibilit e de sex ecuter en parall` ele. Par exemple, supposons que Clotaire puisse accomplir dautres t aches, telles qualler sapprovisionner au stock de pi` eces d etach ees. Supposons de plus que Clotaire puisse mettre en attente les messages quil re coit et les ex ecuter au fur et ` a mesure de ses possibilit es. Le processus r esulte alors du couplage de trois processus el ementaires: celui qui sert a rapporter des objets (Pr1 ), celui qui consiste ` ` a aller chercher des pi` eces au stock (Pr2 ), et celui de la gestion des messages en attente (Pr3 ) (g. 4.12). Pr3 se d eroule en parall` ele par rapport ` a Pr1 et Pr2 qui sexcluent mutuellement. Buffer est un
3
La syntaxe et la s emantique des messages sont d ecrites ci-dessous, section 4.11.2, et au chapitre
6.
171
composant qui sert ` a m emoriser des messages et ` a synchroniser la r eception et 4 linterpr etation des messages qui seectuent de mani` ere concurrente . Il est possible aussi de coupler le comportement de plusieurs agents de la m eme mani` ere, en consid erant que les messages produits par les uns vont directement au processus de r eception des autres. Il existe de nombreuses mani` eres de repr esenter des processus. Les plus courantes sont les automates ` a etats nis, les automates ` a registres (ou r eseaux de transitions augment es) et les r eseaux de Petri.
4.4.1
Repr esentation de processus par automates ` a etats nis
Lint er et de la notion dautomate ` a etats nis est, dune part, de pouvoir d ecrire tr` es facilement le comportement dun agent capable de m emoriser l etat dans lequel il se trouve et, dautre part, d etre soutenu ` a la fois par un support th eorique important et davoir et e utilis e dans de nombreux domaines de linformatique, tels que les architectures dordinateurs, lautomatisme, lalgorithmique, les langages formels, les techniques de compilation, les r eseaux, etc. Etats et transitions Un automate ` a etats nis est d ecrit par lensemble de ses etats et par ce que lon appelle sa fonction de transition qui sp ecie l etat suivant en fonction de l etat actuel et des informations quil re coit en entr ee. On repr esente un automate ` a etats nis sous la forme dun graphe orient e dont les nuds sont les etats de lautomate et les arcs ses transitions. Sur les arcs, on indique ` a la fois les ev enements qui le font passer dun etat ` a un autre et les actions qui doivent etre entreprises lors de cette transition. Par exemple, supposons que lon veuille repr esenter le comportement dun distributeur de bonbons, tel que celui de la gure 4.13.
1F ou 2F Annuler Petit Grand
Bonbons
Monnaie
Figure 4.13: Un distributeur de bonbons. Il accepte des pi` eces de 1 F ou 2 F, et distribue des petits (prix 1 F) ou des grands bonbons (prix 2 F).
4 Jutiliserai indi eremment les termes parall` ele et concurrent pour parler de processus qui peuvent sex ecuter simultan ement. Avec les Anglo-saxons, on di erencie parfois ces deux termes en attribuant parall` ele aux ex ecutions qui seectuent physiquement en m eme temps sur plusieurs processeurs distincts, et concurrent a ` laspect logique de cette simultan eit e, que les processus sex ecutent en m eme temps ou non, mais je ne ferai pas ici cette distinction.
172
Il accepte des pi` eces de 1 F ou de 2 F et il distribue des petits ou des grands bonbons. Lorsque il re coit trop dargent, il rend la monnaie et, lorsquon appuie sur annuler, il rend la somme d ej` a introduite. Ce distributeur peut etre repr esent e comme une bo te noire comportant des entr ees et des sorties (g. 4.14). Les entr ees sont les ev enements externes (mettre une pi` ece de 1 F ou 2 F, demander un petit ou un grand bonbon, annuler tout) et les sorties sont des commandes qui d eclenchent les op erations de la machine (donner un bonbon, rendre la monnaie). Les entr ees comme les sorties sont des variables bool eennes. On suppose quune seule des entr ees est valide ` a un instant donn e, mais que plusieurs sorties peuvent etre vraies simultan ement.
Entres
Petit Grand 1F 2F Annuler
Sorties
PETIT-BONBON
Distributeur
GRAND-BONBON RENDRE-1F RENDRE-2F
Figure 4.14: Repr esentation en termes dentr ees-sorties du distributeur Lautomate d ecrivant cette machine est pr esent e gure 4.15. Il comprend trois etats, marqu es s0 , s1 et s2 . L etat s0 est l etat initial, cest-` a-dire celui dans lequel se trouve la machine lorsquon la met en marche. Les etats s1 et s2 repr esentent le fait que la machine a re cu respectivement 1 F et 2 F. Chaque transition est d ecrite par un couple < ev enement,action> qui d ecrit l ev enement initiateur du changement d etat ainsi que laction qui est accomplie par la machine. Formellement un automate ` a
petit,{}
petit,{PETIT-BONBON} annuler,{RENDRE-1F} grand, {GRAND-BONBON}
S0
grand,{}
1F,grand,{}
S1 annuler, RENDRE-2F 1F,{}
2F,petit,{PETIT-BONBON, RENDRE-1F}
2F,{RENDRE-1F}
2F,RENDRE-2F
S2
1F,RENDRE-1F
Figure 4.15: La repr esentation graphique de lautomate de distribution de bonbons etats nis comportant k entr ees et p sorties est d eni comme un sextuplet: A = < E, S, C, , , s0 >
173
o` u E est un ensemble ni d ev enements (d ecrits par des mots comprenant k caract` eres), S est un ensemble ni d etats, C est lensemble des commandes egal ` a Bp (o` u B est le domaine 0,1), s0 est un el ement particulier de S que lon appelle etat initial, est la fonction de transitions, cest-` a-dire une fonction de la forme: :SE S et est la fonction dactivit e, cest-` a-dire la fonction qui lance une commande et applique une op eration lors dune transition: :SE C Par exemple, lautomate d eni ci-dessus pour repr esenter le comportement dun distributeur de machine peut etre donn e ainsi: E S C = Petit,Grand,1F,2F,Annuler = s0 , s1 , s2 = <PETIT-BONBON, GRAND-BONBON, RENDRE-1F, RENDRE-2F>
Les deux fonctions et peuvent etre repr esent ees par le tableau 4.1. En ligne, on trouve les etats, en colonne les ev enements et dans les cases, les couples form es de l etat suivant et de lensemble des actions ` a accomplir.
, Petit s0 s1 s2 s0, {} s0, {PETITBONBON}
grand s0, {} s1, {}
1F s1, {} s2, {}
2F s2, {} s2,
annuler s0,
s0, {RENDRE-1F} {RENDRE-1F}
s0,{PETIT-
s0, {GRAND- s2, s2, s0, BONBON, BONBON} {RENDRE-1F} {RENDRE-2F} {RENDRE-2F} RENDRE-1F}
Table 4.1: La table des transitions dun automate ` a etats nis
Avantages et inconv enients des automates ` a etats nis Les automates ` a etats nis sont tr` es simples ` a manipuler et ils permettent de d ecrire assez facilement des comportements de syst` emes logiques simples. Les architectures dordinateurs en font notamment un grand usage. Il est en eet possible de les simplier ou de v erier des propri et es5 . Cependant ils sav` erent tr` es rapidement limit es pour repr esenter des comportements plus complexes, et encore plus pour d ecrire l evolution dun syst` eme multi-agent:
5 Pour en savoir plus, on pourra consulter nimporte quel livre parlant darchitectures des ordinateurs tels que le (Tanenbaum 1991) qui traite de la d enition des automates ` a partir de fonctions bool eennes, et de leur simplication par des m ethodes telles que celle des tables de Karnaugh.
174
1. Leur capacit e de calcul est limit ee, du fait que leur nombre d etats est ni. Ils ne peuvent donc se souvenir dune suite d ev enements arbitrairement longue, ni v erier, par exemple, quune suite de parenth` eses quelconque est bien form ee. Cette limitation constitue rarement une g ene, bien quelle emp eche des robots de m emoriser le chemin quils ont pris pour pouvoir revenir sur leurs pas. Si lon veut d epasser cette limite, il faut etendre le formalisme des automates ` a etats nis. 2. Les automates ne peuvent d ecrire que des processus s equentiels. De ce fait, tous les calculs, toutes les actions parall` eles leur sont pratiquement interdits. Par exemple, il est impossible de repr esenter un agent qui agisse et qui communique en m eme temps avec un autre agent, sans passer par des m ecanismes de fusion dautomate extr emement lourds et rapidement impraticables (la fusion de deux automates de N etats chacun produit un automate de N 2 etats). Il faut passer alors ` a des formalismes plus puissants tels que celui des r eseaux de Petri d ecrits plus loin (cf. section 4.4.3). 3. Enn, toutes les m emorisations, telles que des changements de valeurs pour des registres, passent n ecessairement par la transformation dun etat en un autre. Par exemple, si le prix des distributeurs de bonbons etait de 2,40 F et que la machine accepte des pi` eces de 10 c, 20 c, 50 c, 1 F et 2 F, il faudrait augmenter consid erablement le nombre d etats pour prendre en compte toutes les situations interm ediaires entre 10 c et 2,40 F, par pas de 10 c et en tenant compte des additions interm ediaires. Par exemple: si lon est dans l etat 60 c et que lon mette 50 c, on passe alors dans l etat 1,10 F. On pourra samuser ` a dessiner le graphe complet de cet automate qui nest pourtant encore pas tr` es compliqu e! Pour d epasser cet inconv enient il faut pouvoir ici aussi etendre les capacit es du formalisme, et nous allons maintenant voir que les automates ` a registres permettent de pallier cet inconv enient.
4.4.2
Automates ` a registres
Toutes ces limitations, et en particulier la derni` ere, ont amen e` a etendre la notion dautomates ` a etats nis en introduisant des registres pouvant contenir des valeurs quelconques telles que des nombres, des cha nes de caract` eres, des symboles, des vecteurs, etc. On parle alors dautomates ` a registres ou de r eseaux de transitions augment es (ou ATN pour Augmented Transition Network). Ce formalisme permet dobtenir un pouvoir de description plus etendu, au prix dune perte des propri et es (et en particulier des propri et es de synth` ese et de simplication des automates) associ ees ` a celui des automates ` a etats nis. Les automates ` a registres sont d ecrits, comme les automates ` a etats nis, par un ensemble d etats et une fonction de transition sur ces etats. La di erence majeure vient du fait que lon ajoute aux etats un ensemble de registres qui peuvent etre manipul es lors de d eclenchement des transitions, ce qui permet dappr ehender des comportements plus elabor es quavec les automates ` a etats nis. Les automates ` a
4.4. LACTION COMME PROCESSUS INFORMATIQUE registres sont d enis comme des n-uplets de la forme: AR = < E, S, C, , , s0 , R, D, T >
175
o` u les E , S , C ,, s0 , sont identiques ` a ceux des automates ` a etats nis, o` u D est une famille de domaines de valeurs, o` u R est un ensemble de registres ri ` a valeurs dans lun des domaines Di de D, o` u C est un ensemble de fonctions bool eennes qui testent les valeurs des registres. La fonction est alors l eg` erement modi ee, puisquelle poss` ede le type suivant: = S E C S [R D ] cest-` a-dire quelle soccupe non seulement de faire passer lautomate dun etat ` a lautre, mais aussi de modier la valeur des registres, le type fonctionnel R D exprimant la d enition dun nouveau jeu de valeurs des registres. La gure 4.16 donne la repr esentation graphique dun automate ` a registres d ecrivant le fonctionnement dun distributeur de bonbons acceptant des pi` eces de valeurs quelconques, sachant que le petit bonbon vaut 1 F et le grand bonbon 2,40 F. On a ajout e un registre V qui comptabilise la somme d ej` a introduite dans la machine. Les transitions sont d ecrites par des quadruplets < ev enement, condition, modification des registres, commandes> qui indiquent l ev enement initiateur du changement d etat, la condition portant sur des valeurs des registres, les modications apport ees ` a ces registres si la transition seectue et les commandes accomplies par la machine. Les ev enements portent maintenant des param` etres dont les valeurs peuvent etre plac ees dans des registres.
<pice(x),v+x < 1,v=v+x,> <petit,-,-,-> <petit,-,v=v-1,PETIT-BONBON> <annuler,,, RENDRE(v)> <pice(x),v+x < 2,40,v=v+x,> S1 <pice(x),v+x 1, v=v+x,>
<annuler,,, RENDRE(v)>
S0
<grand,-,-,->
<grand,,v=v-2,40, GRAND-BONBON>
<pice(x),v+x 2,40, v=v+x,>
<pice(x),,v=v+x,>
S2
Figure 4.16: Un distributeur de bonbons mod elis e par un automate ` a registre Lint er et des automates ` a registres est bien evidemment d etre beaucoup plus simple que leurs homologues ` a etats nis d` es que le nombre d etats devient trop
176
important. Gr ace ` a leurs registres et aux conditions suppl ementaires associ ees aux transitions, ils factorisent des informations qui doivent etre r eparties sur plusieurs etats dans les automates ` a etats nis.
4.4.3
Repr esentation de processus par r eseaux de Petri
Les automates ` a etats nis comme les automates ` a registres ne peuvent repr esenter que des processus s equentiels et sont donc bien limit es pour prendre en compte les aspects de parall elisme caract eristiques des syst` emes multi-agents. De ce fait, lorsque les agents deviennent plus complexes, ou tout simplement lorsque lon cherche ` a pr eciser ce qui se passe lors dinteractions entre agents, il faut disposer de formalismes plus elabor es pour d ecrire des comportements et des organisations mettant en uvre plusieurs processus. Principes g en eraux Lun des mod` eles les plus formels mais aussi les plus d evelopp es pour repr esenter des syst` emes multi-processus est celui des r eseaux de Petri. Ces derniers peuvent etre consid er es comme des outils de mod elisation de processus essentiellement asynchrones fond es sur une repr esentation ` a la fois graphique et math ematique. Laspect graphique permet de visualiser simplement les processus et de faciliter la conception et la communication de mod` eles de comportement, tandis que la formulation math ematique assure ` a ce formalisme des fondements rigoureux (cf. par exemple (Murata 1989)). Ils sont utilis es dans de nombreux domaines o` u il est n ecessaire de repr esenter des m ecanismes qui sex ecutent en parall` ele: commandes de proc ed es industriels, protocoles de communications dans des r eseaux, s emantique de programmes et de langages, prototypage de syst` emes parall` eles, etc. Enn, il existe non pas un mod` ele de r eseau de Petri, mais toute une famille permettant de mod eliser des m ecanismes aussi complexes que cela sav` ere n ecessaire. Un r eseau de Petri est d eni comme un graphe orient e comprenant deux sortes de nuds: des places et des transitions. Ce graphe est constitu e de telle sorte que les arcs du graphe ne peuvent relier que des places aux transitions ou des transitions aux places, suivant en cela les r` egles de formation des r eseaux de transitions augment es d enis pr ec edemment. On repr esente graphiquement les places par des cercles et les transitions par des barres (g. 4.17). Les r eseaux de Petri, ` a lencontre des automates, permettent la repr esentation des aspects dynamiques des processus en d epla cant des marques de places en places. Dans les r eseaux de Petri ordinaires, ceux qui sont ` a la base de toute la famille des r eseaux de Petri, ces marques ne sont que des jetons, cest-` a-dire des el ements simples et indiscernables, alors que dans dautres types de r eseaux, tels que les r eseaux color es que nous verrons plus loin, ces marques sont des structures nettement plus complexes qui sapparentent ` a des records ` a la Pascal. Les marques evoluent de place en place en suivant ce que lon appelle des r` egles de franchissement. On dit quune transition T peut etre franchie, ou encore quune transition est valid ee, si toutes ses places dentr ees P pour lesquelles il existe un arc orient e de
177
Figure 4.17: Un exemple de r eseau de Petri comprenant 6 places et 5 transitions P vers T poss` edent une marque. Parmi toutes les places valid ees on en prend une au hasard qui sera eectivement d eclench ee, et on dira que les marques franchissent cette transition. Franchir une transition revient ` a enlever une marque sur chaque place dentr ee et ` a en ajouter une sur chaque place de sortie (les places P pour lesquelles il existe un arc de T vers P). La gure 4.18 montre un exemple de franchissement de transition.
Figure 4.18: Exemple de franchissement de transition, avant (a) et apr` es (b) Lorsquil y a plusieurs transitions possibles en sortie dune place, la r` egle de tirage au sort permet de d eterminer laquelle des transitions doit etre franchie, comme le montre la gure 4.19. On appelle marquage une distribution de jetons sur les places, et marquage initial la distribution initiale de jetons dans le r eseau. R eseaux de Petri color es Si on souhaite distinguer les jetons entre eux, il est possible dutiliser des r eseaux de Petri color es. Dans ce cas, on peut associer une valuation dans un domaine ni, que lon appelle couleur du jeton. Il est aussi possible, et cest ce que nous ferons par la suite, dutiliser des n-uplets de variables color ees (sous la forme <a,a,b> par exemple) en lieu et place des jetons ordinaires (Jensen 1992). Lint er et des
178
Figure 4.19: Les transitions T1 et T2 etant valid ees en (a), le tirage au sort des transitions ` a franchir produit le marquage (b) ou (c). r eseaux color es est de pouvoir d ecrire des dynamiques relativement complexes avec un petit nombre de places et de transitions. Dans ce mod` ele de r eseau de Petri, les transitions peuvent etre consid er ees comme des sortes de r` egles qui ne peuvent etre d eclench ees que si les conditions associ ees ` a leurs arcs entrants sont remplies. Elles produisent des marques correspondant aux informations associ ees ` a leurs arcs sortants. Lexemple de la gure 4.20 montre le m ecanisme de franchissement. La transition T1 ne peut etre franchie que sil existe une marque de la forme <x,x,n> sur la place P0 et une marque de la forme <x,y> sur la place P1 . Dans lexemple, cela est possible puisquil existe une marque <a,a,2> sur P0 et une marque <a,c> sur P1 ` a la situation (a). Ces marques sont alors supprim ees des places dentr ees, et des marques correspondant aux indications des arcs sortants sont produites sur les places de sorties. Dans lexemple, les marques <a,c>, <3> et <c,c> sont respectivement ajout ees ` a la liste des marques des places P2 , P3 et P4 (b).
Figure 4.20: Franchissement dune transition dans un r eseau color e Il existe bien dautres mod` eles de r eseaux de Petri. En particulier les r eseaux de Petri ` a objets qui supposent que les marques sont des objets qui peuvent eux-m emes contenir des r ef erences ` a dautres objets et dont les champs peuvent etre modi es (Sibertin-Blanc 1985), les r eseaux de Petri ` a pr edicats, les r eseaux synchrones et temporis es, voire m eme les r eseaux continus (David et Alla 1989). Pour linstant, notre choix sest port e sur les r eseaux de Petri color es, qui pr esentent lavantage
179
de fournir d ej` a une bonne puissance de mod elisation tout en etant encore capables dorir des possibilit es de v erication formelle sur leurs propri et es. Mod elisation de processus par r eseaux de Petri Si le mod` ele des r eseaux de Petri est assez simple ` a comprendre, il pose deux probl` emes: il sav` ere dicile de mod eliser un comportement ` a cause de la grande souplesse et du grand pouvoir dexpression du mod` ele et il devient malais e de voir ce qui se passe de visu d` es que le processus ` a mod eliser sav` ere un peu complexe. Le premier de ces probl` emes requiert un peu dexpertise. Il sagit dune autre forme de programmation: mod eliser un ensemble de processus sous la forme dun r eseau de Petri rel` eve simplement dun art au m eme sens que l ecriture dun programme ou de l etablissement dune sp ecication. Le second peut etre r esolu en d enissant un formalisme de repr esentation de plus haut niveau mais dont la structure peut etre transform ee en un r eseau de Petri. On dispose alors dun langage plus intelligible, tout en b en eciant des propri et es formelles associ ees ` a ces r eseaux. Lautre int er et des r eseaux de Petri est de pouvoir int egrer le formalisme des automates ` a etats nis comme une sous-classe des r eseaux de Petri. On repr esente alors les etats de lautomate sous la forme de place dans le r eseau, et sa fonction de transition comme un ensemble de transitions, chacune ne poss edant quune place en entr ee et une place en sortie. On les appelle alors machines ` a etats. Les r eseaux de Petri ont un pouvoir dexpression bien sup erieur ` a celui des automates ` a etats nis car ils peuvent facilement mod eliser un ensemble de processus et d ecrire des conits eventuels dacc` es aux ressources.
P0 Pr1 P1 T3 P3 T1 Pr1 Pr2 P2 T4 P4 T1 P1 T3 P3 P0 Pr2 T2 P2 T4 P4
T2
(a) (b)
Figure 4.21: Pr1 et Pr2 sex ecutent simultan ement en (a) et alternativement en (b). Par exemple, la gure 4.21 montre deux exemples densembles de processus mod elisables par r eseaux de Petri. Dans le premier cas (a) les processus Pr1 et 6 Pr2 sex ecutent simultan ement. En eet, un jeton plac e en P0 franchit la transition T1 et occupe les places P1 et P2 simultan ement. Ensuite, les transitions T3 et
6 Dans ces exemples et les suivants, nous avons fait gurer les processus en gris e pour faciliter la compr ehension des gures. Mais la notion de processus ne fait pas partie des r eseaux de Petri
180
T4 sex ecutent ind ependamment lune de lautre, mais la transition T2 sert de synchronisation. Elle ne pourra etre franchie que si les places P3 et P4 comportent toutes les deux au moins un jeton. En revanche, dans le second cas (b) les processus Pr1 et Pr2 sex ecutent ind ependamment lun de lautre, et sil nexiste quun seul jeton en P0 , ils sexcluront mutuellement. En eet, le jeton en P0 passera soit par Pr1 ou par Pr2 , et il faudra attendre que le jeton ait franchi toutes les transitions associ ees au processus pour que le jeton revienne en P0 et que les deux processus soient de nouveau ex ecutables. Mais si P0 contient plusieurs jetons, les deux processus Pr1 et Pr2 pourront eventuellement sex ecuter en parall` ele.
message
Pr3 Pr1
Rapporte(x,L1,L2) Aller L1
P0
ChercherPice(P,L)
Pr2
Aller au stock
Demander la pice P Prendre x P disponible P indisponible Aller L
Aller L2
P1
Dposer x Dposer P
Figure 4.22: La repr esentation du comportement de Clotaire exprim e sous la forme dun r eseau de Petri Il est ainsi possible de d ecrire pr ecis ement le comportement de Clotaire tel quon lavait pr esent e ` a la gure 4.12, o` u lon avait suppos e quil pouvait rapporter des objets et aller chercher des pi` eces en stock tout en recevant des messages. Il sagit dune modication du sch ema de la gure 4.21.b. Les deux processus travaillent en exclusion mutuelle, laquelle est g er ee par la place P1 , qui contient initialement un jeton. Lorsquun message arrive, il est rang e dans la place P0 , et si P1 contient un jeton, lun des deux processus Pr1 ou Pr2 est choisi en fonction de la nature du message. Sil sagit dun message Rapporte, alors le processus Pr1 est choisi et activ e et le jeton de la place P1 est consomm e ainsi que le message. Les marques passent alors de place en place jusqu` a atteindre la place P1 . Pendant ce temps, puisque P1 ne contient aucun jeton, aucun autre message ne peut etre pris en compte par lun des deux processus. Mais d` es quil r ecup` ere un jeton, cest-` a-dire lorsque Pr1 ou Pr2 sont termin es, et si P0 contient des messages, lun de ces deux processus pourra de nouveau etre activ e, en fonction de la forme du message.
stricto sensu, qui ne font intervenir que des places, des transitions (et leurs arcs associ ees) et des

P1 P2 b P3 c T
181
Figure 4.23: Un r eseau de Petri dont larc a est inhibiteur Les r eseaux de Petri que nous venons de voir ne permettent pas de repr esenter facilement des m ecanismes de priorit e entre actions. Il faut en eet pouvoir indiquer que quelque chose emp eche une transition, ce qui nest pas possible dans le mod` ele normal. On peut alors ajouter des arcs inhibiteurs qui relient une place ` a une transition et qui fonctionnent de mani` ere invers ee par rapport aux arcs normaux, en emp echant le franchissement dune transition si la place inhibitrice contient une marque. Dans la gure 4.23, larc (a) est inhibiteur, ce qui bloque la transition tant que la place P1 poss` ede une marque. Les arcs (b) et (c) sont des arcs normaux.
T1
module dominant
[Action D]
fin action D
condition D condition I
P1
P2
fin action I
[Action I]
T2
module infrieur
Figure 4.24: Un mod` ele darchitecture de subsomption utilisant un arc inhibiteur Par exemple, un mod` ele darchitecture de subsomption (cf. chap. 3), qui repose sur la d enition dune hi erarchie entre modules, peut etre d ecrit ` a laide de r eseaux de Petri ` a arcs inhibiteurs (g. 4.24). On constate que si le module dominant est activ e et donc quune marque se trouve sur la place P1 , alors la transition T2 est inhib ee, ce qui emp eche le module inf erieur de fonctionner. Tr` es vite, les mod elisation par r eseaux de Petri deviennent fort complexes et il est alors n ecessaire de d ecomposer le r eseau en modules distincts. Cest ce que nous ferons avec la d enition du formalisme Bric ` a la section 4.11.
marques.
182
4.4.4
Autres mod` eles ev enementiels
Il existe de nombreux autres mod` eles de m ecanismes concurrents qui peuvent etre utilis es pour d ecrire des syst` emes multi-agents. En particulier les mod` eles CCS (Milner 1989) et CSP (Hoare 1985) qui servent ` a d ecrire de mani` ere formelle le fonctionnement de syst` emes parall` eles et distribu es en interactions, pourraient faire lobjet dun emploi plus important dans le cadre des syst` emes multi-agents. N eanmoins, il reste un travail important ` a entreprendre, du fait que ces outils formels ont et e d evelopp es dans le cadre des processus distribu es et de la s emantique des langages parall` eles, et quils ne sont pas toujours tr` es bien adapt es ` a la probl ematique des syst` emes multi-agents et notamment celle des syst` emes multi-agents situ es, pour lesquels les agents accomplissent des actions dans un environnement.
4.5
Laction comme d eplacement physique
Pourtant bien ant erieur dans son d eveloppement, le concept daction tel quil est utilis e en physique a peu inuenc e le monde de lintelligence articielle, peut- etre trop obnubil e par les formalismes logiques. Pour la physique, laction est avant tout ce qui entra ne le mouvement, ce qui change l etat dynamique dun corps, cest-` a-dire une acc el eration. La premi` ere loi de Newton le d ecrit bien: Un corps pers ev` ere dans son etat de repos ou de mouvement rectiligne uniforme, sauf si des forces le contraignent den changer (Newton 1985). Pourquoi ne pas sinspirer de ces principes pour exprimer des comportements dagents situ es pour lesquels lenvironnement est con cu comme un espace m etrique? En eet, cette approche peut sav erer particuli` erement f econde dans le cas dagents r eactifs qui doivent planier leur trajectoire, eviter dentrer en collision, et si besoin, etre capables de se rencontrer, et d evoluer ensemble. Il sut de penser au vol dune escadrille davions ou ` a un ux de voitures sur une route principale pour avoir une id ee de cette application m ecanique de laction. En eet, lorsque des agents se d eplacent, quil sagisse de robots mobiles ou de v ehicules qui tentent de s eviter, leur comportement se manifeste naturellement comme un mouvement dans un espace euclidien. Pourtant, bien quil puisse para tre naturel de consid erer les syst` emes ` a base de robots mobiles comme des solides mat eriels se d epla cant dans lespace au cours du temps, pendant longtemps les recherches en planication de mouvement de robots mobiles se sont cantonn ees dans une analyse symbolique et logique de lanalyse des d eplacements. Ce nest que r ecemment que des points de vue r eactifs utilisant des techniques issues de champs de potentiels ont vu le jour, et elles sont encore consid er ees comme presque r evolutionnaires, alors quelles peuvent en fait appara tre bien simples car elles ne mettent en uvre que du calcul vectoriel. Il est en eet naturel pour des syst` emes r eactifs de se tourner vers des repr esentations analogiques de la r ealit e, les d eplacements etant trait es comme des additions de vecteurs dans un espace euclidien (g. 4.25). Si au temps t0 lagent se trouve au point M , il se trouvera au point M au temps t0 +t ayant accompli alors le d eplacement D, ce qui permet d ecrire vectoriellement
4.5. LACTION COMME DEPLACEMENT PHYSIQUE

O
183
M D M'
Figure 4.25: Le d eplacement g eom etrique est une forme daction qui sexprime comme une transformation g eom etrique dans un espace. que: OM = OM + D
Il est possible de pousser encore plus loin lanalogie avec les particules physiques en consid erant la notion de champ. Quil sagisse de champs gravitationnel, electriques ou magn etiques, les champs servent en physique ` a expliquer lorigine des forces et donc le mouvement des particules. On distingue g en eralement deux types de champ: les champs scalaires et les champs de vecteurs. Ces champs associent ` a tous points de lespace une valeur. Lorsquil sagit dun champ scalaire, la valeur est un scalaire, cest-` a-dire un nombre qui repr esente lintensit e du champ au point consid er e. Dans le cas dun champ vectoriel, la valeur est un vecteur. Ces champs peuvent se combiner et se superposer sil sagit de champs de m eme nature. G en eralement ces combinaisons sexpriment sous forme additive en additionnant les grandeurs des champs en chacun des points de lespace. Si lon appelle U(p) et V(p) deux champ d enis par leurs valeurs en tout point quelconque p de lespace, alors la somme des champs est un champ W(p) dont la valeur est simplement la somme des valeurs en chaque point: W(p) = U(p) + V(p) Il est aussi possible de combiner des champs de m eme nature en ne retenant que la valeur la plus importante sil sagit de champs scalaires. Dans ce cas, lop eration max est d enie ainsi: max(U(p), V(p)) = U(p) si U(p) V(p), V(p) sinon La visualisation de la valeur dun champ scalaire en fonction de sa position dans un espace ` a 2 dimensions donne un eet de relief: les pics sont les lieux de plus grandes intensit es, et les vall ees les zones de moins grande inuence du champ. Les pentes de ces montagnes donnent ce que lon appelle le gradient dun champ, cest-` a-dire sa variation en fonction du lieu et d etermine la direction de plus grande pente associ ee a chaque point. Le gradient est une fonction vectorielle qui associe ainsi un champ `
184
de vecteurs au champ scalaire initial. Si le champ scalaire d enit un potentiel, alors le gradient d enit une force correspondant au potentiel: F (p) = U(p) (4.1)
o` u repr esente lop erateur gradient. Ces champs vont d eterminer des tendances attractives ou r epulsives (que lon exprime souvent sous la forme de forces) qui font se mouvoir les particules dans une direction correspondant au point de la plus grande attraction dun champ. Le gradient joue alors un r ole essentiel, car plus le gradient est important, cest-` a-dire plus on passe rapidement dune vall ee ` a un mont, plus la force attractive ou r epulsive est forte.
4.5.1
D eplacements dans un champ de potentiel
Cette notion de champ est surtout utilis ee dans les syst` emes r eactifs pour d eterminer le comportement des agents. Il sagit dune technique relativement r ecente qui prend sa source dans une critique radicale des techniques classiques de planication pour d eterminer un chemin ou une route ` a suivre (Latombe 1991; Barraquand et Latombe 1989). Le principe g en eral est de consid erer que les objets de lenvironnement emettent des signaux dont lintensit e est proportionnelle ` a la distance (ou plus g en eralement au carr e de la distance) au but, ces signaux sont dius es dans tout lespace et d enissent un potentiel U(p), dont il est possible de tirer un champ de vecteur force F(p) ` a partir de l equation (4.1). On consid` ere alors que les buts d enissent des champs de potentiel attractifs, alors que les obstacles correspondent a des champs de potentiel r ` epulsifs. De ce fait, le champ global U est d eni comme la somme vectorielle des champs dattraction et de r epulsion: U(p) = Uattr (p) + Urepul (p) Ces champs sont g en eralement d enis en fonction de la distance au but ou aux obstacles. Les champs attractifs peuvent pr esenter une intensit e proportionnelle ` a la distance avec le but ou, par analogie avec les champs naturels, proportionnelle au carr e de cette distance: Uattr (p) = k dist(p, pbut )2 Les champs de potentiel des obstacles sont souvent un peu plus compliqu es, car ils doivent servir seulement ` a emp echer le mobile dentrer en collision avec lobstacle sans quil inue trop sur sa trajectoire ` a une longue distance. Il sut pour cela de d enir une barri` ere dinuence, cest-` a-dire une distance distinf luence ` a partir de laquelle linuence des obstacles ne se fera plus sentir. Urepul(p) = k 1 si dist(p, pobs ) distinf luence dist(p, pobs )2 = 0 sinon
Dans ce cas, lintensit e du champ cro t tr` es fortement lorsquon se rapproche des obstacles (elle est m eme innie ` a lendroit de lobstacle). Le d eplacement dun
4.5. LACTION COMME DEPLACEMENT PHYSIQUE
185
robot revient alors ` a descendre le champ de potentiel en suivant la ligne de plus grande pente, le but repr esentant la vall ee et les obstacles les montagnes quil faut fuir. Cette technique est donc tr` es simple ` a mettre en uvre et surtout tr` es facile a ` comprendre du fait de son caract` ere eminemment visuel. En eet, si les d eplacements des robots seectuent dans un plan, il est possible de repr esenter ces champs ` a laide de graphiques en trois dimensions, la hauteur repr esentant lintensit e du champ. La gure 4.26 montre un tel champ de potentiel pour un but et deux obstacles.
Figure 4.26: Dans un syst` eme ` a champs de potentiels, lagent est attir e par le but et repouss e par les obstacles. On peut voir que lagent essaye de trouver une trajectoire pr esentant le meilleur compromis entre lattirance du but dune part et la r epulsion des obstacles dautre part. Si lon d esire que la trajectoire passe plus pr` es des obstacles, il sut de donner une valeur plus pentue aux champs r epulsifs et inversement de les arrondir si lon d esire sen eloigner. Si les champs de potentiel ont le m erite de la simplicit e, ils pr esentent malheureusement plusieurs inconv enients dont le principal est lexistence de minima locaux. En eet, face ` a certains obstacles concaves, un robot peut etre bloqu e dans un puits de potentiel qui lemp eche de revenir en arri` ere et donc de faire le tour de lobstacle. Pour r esoudre ce probl` eme, il sut de construire les champs attractifs di eremment en consid erant non pas la distance absolue entre le but et les points de lespace, mais la distance minimale des chemins qui vont du but ` a ces points de lespace en contournant les obstacles. Cette distance peut etre calcul ee tr` es simplement ` a partir dun syst` eme de vague (Barraquand et Latombe 1989). On parcourt tous les points de lespace en parall` ele ` a partir du (ou des) but(s), en incr ementant ` a chaque fois la valeur de lintensit e du champ et en contournant les obstacles. Ce calcul seectue donc comme la propagation du front dune vague, ayant pour origine le but, qui emplit tout lespace libre en contournant les obstacles. Pour construire un tel champ, il faut au pr ealable digitaliser lespace en le d ecomposant en
186
un ensemble de cellules de tailles egales ayant g en eralement la forme de carr es ou mieux dhexagones (sil sagit dun espace de dimension 2, mais on peut g en eraliser facilement ` a la dimension 3). Lalgorithme est alors distribu e de telle mani` ere que chaque cellule agisse de mani` ere autonome. Lorsquune cellule re coit une nouvelle valeur qui est inf erieure ` a sa propre valeur de potentiel, elle la stocke et propage ` a toutes les cellules voisines cette valeur incr ement ee dune unit e: Type Cellule Champs potentiel: Nombre voisins: Liste de Cellule Proc edure valeur(x, v) si x.potentiel nest pas d efini ou si v < x.potentiel alors x.potentiel := v pour tout y dans x.voisins valeur(y,v+1) sinon ne rien faire Fin Il est possible de faire tourner cet algorithme de mani` ere totalement parall` ele et, si lon dispose des calculateurs ad equats, dobtenir rapidement la valeur du potentiel en chaque point de lespace7 . Le lecteur d esirant en savoir plus sur les techniques de d eplacement dagents mobiles et en particulier sur les techniques fond ees sur la notion de champ de potentiel pourra se r ef erer ` a lexcellent livre de Jean-Claude Latombe (Latombe 1991). Nous reverrons souvent cette technique appliqu ee aux SMA r eactifs, comme celui de la simulation dun monde de fourmis (cf. chap. 7), ou dun agent situ e qui doit se d eplacer dans un monde comprenant des obstacles (cf. section 4.9.3). Ces techniques peuvent ainsi sappliquer aussi bien aux mouvements dans un plan qu` a la diusion de marqueurs chimiques qui agissent comme des champs dattraction pour le comportement des agents.
4.5.2
Int er et de cette conception de laction
Cette approche physique de laction sav` ere tr` es ecace dans deux cas: 1. Lorsque les actions se ram` enent naturellement ` a des d eplacements dans un espace m etrique. En particulier, tous les syst` emes multi-agents qui con coivent
7 Cette version fonctionne tr` es bien mais ne permet pas de savoir si les calculs sont eectivement r ealis es en parall` ele, lorsque le programme termine. Pour avoir une telle information, il faut employer des algorithmes un peu plus compliqu es qui estampillent les sources des signaux et retournent les valeurs locales de terminaison, comme nous le verrons au chapitre 7 pour les algorithmes dallocation de t aches. On pourra se r ef erer ` a (Raynal 1987) pour avoir de plus amples informations sur les probl` emes de terminaisons dans les algorithmes de propagation de vagues.
4.6. LACTION COMME MODIFICATION LOCALE
187
les agents comme des sortes de petits robots qui se d eplacent dans un environnement peuvent en tirer facilement prot. 2. Lorsque les actions doivent etre d ecompos ees dans le temps et quil est possible dutiliser des notions de champs pour d ecrire les tendances des agents a ` eectuer quelque chose. Les champs de vecteurs orent une gestion assez ecace de la coordination dactions entre agents multiples lorsque les actions se r esument ` a des d eplacements dans un espace physique. Leur utilisation, pour r esoudre des probl` emes de coordination de d eplacements de plusieurs agents mobiles tels que celui de la r egulation de trac a erien, sav` ere particuli` erement f econde comme nous le verrons au chapitre 8. N eanmoins, les champs de vecteurs pr esentent quelques inconv enients. Le premier est de ne pas sint egrer naturellement ` a une conception logique de lintention et de laction. Comment relier en eet la description dun etat du monde sous forme de formules logiques et les actions sous formes de d eplacements dans un espace muni dun champ de potentiels et comment planier ces actions dans de telles situations? Le deuxi` eme, plus fondamental, est de se montrer inecace dans les situations qui ne savent pas repr esenter les situations dans un espace m etrique. Par exemple, il est clair que lon ne sait pas r esoudre des probl` emes administratifs de cette mani` ere. En particulier, tous les syst` emes multi-agents fond es sur la notion de coop eration dexpertises (cf. chap. 1) ne savent absolument pas tirer parti de tels mod` eles m ecanistes. Le troisi` eme enn provient de ce quil est dicile de rendre compte de l evolution globale dun syst` eme lorsque les agents sont individuellement capables de d ecider de leurs propres actions. En eet, un agent, ` a la di erence dune particule simple dont l evolution est d etermin ee par les caract eristiques des champs dans lesquels elle evolue, peut disposer dune v eritable autonomie de d ecision qui rend tr` es dicile toute pr evision quant au comportement global du syst` eme. Sauf ` a r eduire la capacit e de ces agents en les rendant tous semblables (et tr` es simplistes souvent), il nexiste pas de v eritable th eorie qui sache pr evoir le comportement dun syst` eme dans le cadre dune telle autonomie. On dit alors que le comportement global du syst` eme emerge de lensemble des interactions locales.
4.6
Laction comme modication locale
A lencontre des conceptions qui consid` erent que chaque action transforme de mani` ere globale le monde, notre intuition commune appr ehende laction comme une modication locale: mes actes ne transforment que les entit es qui se trouvent proches de moi. Si je fais tomber un verre par terre, je ne suppose pas que le cours des plan` etes sen trouvera modi e. Toute action ne produit quune perturbation locale, une alt eration qui se trouve en contact ou de toute mani` ere ` a une distance nie de la cause de cette action. M eme si elle pr esente des cons equences importantes, telles quune explosion nucl eaire par exemple, laction peut etre vue comme une cause
188
locale dont les eets sont propag es de proche en proche dans une grande portion despace. A la di erence de lapproche par transformation d etats qui d ecrit le monde comme un ensemble de formules valides, on suppose ici que le monde est constitu e dun r eseau dont les nuds repr esentent des entit es r eelles (des portions despace, des objets physiques, des etres, des animaux, des personnes, mais aussi des id ees, des situations, des ev enements, des t aches) et les arcs correspondent aux liens qui existent entre ces entit es: liens de contacts, de relations sociales (les accointances), de d ependances, etc. Chaque nud agit de mani` ere ind ependante et modie son propre etat en fonction de ses perceptions. On retrouve ici lid ee m eme de syst` eme multiagent comme fondement de la notion daction. Bien quil existe peu de mod` eles permettant de traiter de ce type daction dans toute sa g en eralit e, il existe des outils th eoriques et pratiques qui, en r eduisant les objectifs, permettent de prendre en compte cette id ee de laction.
4.6.1
Les automates cellulaires
Les automates cellulaires sont des syst` emes dynamiques dont le comportement est totalement d etermin e en termes de relations locales. Un syst` eme ` a automates cellulaires est compos e dun ensemble dautomates ` a etats nis r epartis sur les nuds dun r eseau p eriodique, g en eralement une grille ` a deux dimensions ` a maille carr ee (g. 4.27). Chaque automate, appel e cellule, est li e aux automates qui lentourent et ses entr ees sont li ees aux etats de ses voisins. De ce fait, l etat dune cellule ` a linstant t + 1 d epend non seulement de son etat pr ec edent mais aussi des etats de tous ses voisins ` a linstant t. De plus, on suppose que tous les automates sont identiques, quils ob eissent ` a la m eme fonction de transition, et que leurs transitions sont synchrones, cest-` a-dire quils changent d etats tous en m eme temps.
Figure 4.27: Un automate cellulaire plan de connexit e4 Lun des exemples les plus connus des automates cellulaires est celui du jeu de la vie d u` a John Conway dont le fonctionnement tente dimiter celui des organisations vivantes. Ce jeu fut tr` es c el` ebre dans les ann ees 60, en particulier gr ace ` a la publicit e que leur donna Martin Gardner, journaliste scientique de Scientic American, qui les d ecrivit en d etail dans sa rubrique r ecr eations math ematiques.
4.6. LACTION COMME MODIFICATION LOCALE
189
Une cellule du jeu de la vie ne peut avoir que deux etats: 1 ou 0, l etat 1 repr esentant une cellule vivante et l etat 0 une cellule morte. La fonction de transition des automates est la suivante: Naissance: si lautomate est mort, il devient vivant (il passe ` a l etat 1) si exactement trois de ses voisins sont vivants. Dans tous les autres cas, il reste mort. Mort: si lautomate est vivant, il reste vivant si 2 ou 3 de ses voisins sont vivants et il meurt dans les autres cas. La gure 4.28 montre une evolution possible du jeu de la vie sur quelques instants. Lint er et de ce jeu est davoir montr e quil etait possible davoir des congurations dynamiques relativement stables. En particulier, lune dentre elle, le planeur (glider), se reproduit ` a lidentique ` a linstant t + 4 mais en s etant d eplac ee dun cran. Ce jeu est fort int eressant car il montre qu` a partir de r` egles locales tr` es simples, il est possible dobtenir des congurations complexes et stables.
Figure 4.28: Le d eplacement dun planeur (glider), une gure classique du jeu de la vie qui se reproduit ` a lidentique au bout de 4 cycles en se d epla cant dune case en diagonale. Les automates cellulaires sont tr` es utilis es de nos jours pour r ealiser des simulations en physique et plus particuli` erement dans le cadre de la dynamique des uides. Des extensions des automates cellulaires pour incorporer non plus des etats discrets mais des etats continus ont et e utilis ees dans le cadre de la dynamique des populations. Ils sont de plus en plus utilis es pour etudier l emergence de ph enom` enes collectifs tels que les turbulences, le chaos, etc. En particulier, le domaine de la vie articielle fait un usage intensif de ces techniques (Langton 1988). Dans tous les domaines o` u il est possible de caract eriser des r` egles locales fond ees sur la proximit e et la g eographie, les automates cellulaires peuvent etre utilis es avec prot.
4.6.2
Repr esentation dun automate cellulaire
La cellule dun automate est repr esent ee par une fonction de transition qui associe a son ` etat et ` a l etat de ses cellules voisines son etat suivant. Chaque cellule est donc d enie par une fonction de transition unique d enie ainsi: (s0 , s1 , ...sn ) = s0 o` u s0 est l etat de la cellule au temps t 1 et les si sont les etats des cellules voisines au m eme instant, et o` u s0 est l etat de la cellule au temps t. Il est possible den
190

Entres des cellules voisines Synchro out
Synchro In Sortie vers les cellules voisines Synchro In
Synchro out tat de la cellule
(a)
(b)
Figure 4.29: Repr esentation dune cellule dautomate cellulaire (a) et de son syst` eme de synchronisation (b) en termes de r eseaux de Petri donner une image sous la forme dun r eseau de Petri, comme le montre la gure 4.29.a. Les entr ees sont fournies par les etats au temps t 1 des cellules voisines qui sont bueris ees pour chaque cellule (les places dentr ees du r eseau servent de buer). La fonction de transition de la cellule est d ecrite comme une simple transition qui modie l etat courant de la cellule et propage ce nouvel etat ` a toutes les cellules voisines. Pour etre bien s ur que toutes les cellules fonctionnent en m eme temps, il faut les synchroniser. Cest ` a cette fonction que sont d edi ees les bornes Synchro In et Synchro Out, qui respectivement proviennent et vont vers un composant de synchronisation pr esent e` a la gure 4.29.b. Les entr ees Synchro Out du synchronisateur sont directement li ees aux sorties du m eme nom des cellules, et les sorties Synchro In du composant vont directement aux entr ees de m eme nom de chacune des cellules. Lorsque les cellules ont ni leur transition, elles envoient un signal sur leur sortie Synchro Out. Ce nest que lorsque toutes les cellules ont envoy e ce signal que la transition interne du synchronisateur peut se d eclencher et envoyer un signal sur les bornes Synchro In des cellules, leur permettant deectuer leur transition.
4.6.3
Automates cellulaires et syst` emes multi-agents
La question que lon se pose souvent est de comprendre la relation qui existe entre syst` emes multi-agents et automates cellulaires. Les syst` emes multi-agents sont-ils des sortes dautomates cellulaires? Ou linverse? Malgr e leur ressemblance, les automates cellulaires ne sont pas des syst` emes multi-agents. Si lenvironnement des SMA peut facilement etre repr esent e sous la forme dune grille de cellules, il nen est pas de m eme des agents, qui sont des entit es autonomes et peuvent se d eplacer tout en conservant leur identit e et surtout modier les liens quils etablissent avec dautres agents. De ce fait, les automates cellulaires peuvent etre consid er es soit comme des syst` emes multi-agents d eg en er es dans lesquels les agents seraient devenus xes, soit, au contraire, comme de bons mod` eles denvironnement, dans lesquels
4.7. LACTION COMME COMMANDE
191
il est possible de d enir avec pr ecision des r` egles de propagation de signaux ou plus g en eralement les lois de lunivers. Par exemple, la diusion de potentiel par vague, comme nous lavons vu ` a la section pr ec edente, sexprime assez facilement sous la forme dun automate cellulaire. Le comportement dune cellule se borne alors ` a prendre la valeur maximale de lintensit e dun signal sur ces valeurs voisines et ` a d ecr ementer sa propre valeur dune unit e: valeur cellule courante = max(valeurs des cellules voisines) 1 Lorsque le r eseau se stabilise, les cellules ont comme valeur lintensit e du signal en ce point.
4.7
Laction comme commande
La th eorie du contr ole et la cybern etique (Cougnal 1963) se sont int eress ees ` a laction dun point de vue particulier en consid erant le probl` eme de la commande de proc ed es industriels et la r ealisation de machines r egul ees. Le probl` eme de laction consiste alors ` a faire varier un certain nombre de param` etres dentr ees, appel es variables de commandes, dun syst` eme physique pour obtenir des valeurs particuli` eres des variables de sorties. Ainsi dans un probl` eme de r egulation, les variables de sorties doivent atteindre et garder des valeurs de consigne x ees. Prenons lexemple du pilotage automatique dun bateau. Pour aller dans un endroit d etermin e, le pilote dun bateau manipule la barre de telle mani` ere que le bateau se dirige dans la direction voulue. Cette action est obtenue en emp echant le bon d eroulement des ux liquides dus ` a la vitesse du bateau, ce qui exerce une force sur la barre et modie le d eplacement du navire. Mais le milieu liquide est lui-m eme agit e de mouvements et modie le cap du bateau, ce qui oblige le pilote ` a compenser la direction par le biais dun m ecanisme de r etroaction, comme le montre la gure 4.30.
rgulateur Angle voulu Angle de commande gouvernail Effecteurs interaction gouvernail/eau processus
Angle peru
Capteurs yeux du pilote
Figure 4.30: La cybern etique et en particulier la th eorie de la commande, consid` ere laction comme une commande que lon applique ` a un syst` eme pour r eguler et contr oler son fonctionnement. Ici laction du pilote consiste donc ` a contr oler le syst` eme physique ` a partir des informations provenant de ses capteurs (ses organes de vues) et ` a corriger le
192
comportement du bateau en agissant sur les eecteurs (le gouvernail) pour aller dans la direction voulue. Laction nest donc plus seulement une transformation d etats du monde, ni un simple mouvement, mais une activit e complexe enti` erement dirig ee vers un but, qui tient compte des r eactions du milieu et des corrections ` a apporter aux actions pr ec edentes. Cette conception de laction comme commande est ` a la base de tous les syst` emes de r egulations et, dune mani` ere g en erale, de tout ce qui touche au contr ole de machines. La cybern etique, puis la th eorie g en erale des syst` emes, sest dailleurs faite le chantre de cette conception de laction avec les travaux de N. Wiener (Wiener 1948), de L. von Bertalany (Bertalany 1968), ou de M. D. Mesarovic et Y. Takahara (Mesarovic et Takahara 1975). Cette conception cybern etique de laction est evidemment tr` es importante pour les SMA: les actions des agents doivent tenir compte des r eactions du milieu et savoir y apporter les corrections n ecessaires. Toute action seectue dans un milieu et suppose un ensemble de m ecanismes de r egulation de son ex ecution qui puisse corriger les d efauts eventuels de son application. Nous verrons en particulier que les agents eux-m emes peuvent etre consid er es comme des etres cybern etiques. Mais, malgr e son int er et, la cybern etique et la vision de laction quelle propose ne peuvent rendre compte de la richesse des interactions qui sexpriment entre agents. Si en dernier ressort, agir pour un agent r eside dans la capacit e` a faire varier les param` etres de commande de ses eecteurs, cette conception ne permet pas de prendre en compte les interactions entre agents. Il lui manque notamment la possibilit e de traiter la simultan eit e des actions et en particulier celle d etre ` a m eme de d ecrire des coordination dactions, de pouvoir r epartir des t aches entre plusieurs agents, toutes choses pour lesquelles une simple technique de r egulation est loin d etre susante.
4.8
Agents tropiques et hyst er etiques
Apr` es avoir etudi e di erents mod` eles daction, nous pouvons passer ` a la description des agents et des syst` emes multi-agents. Lapproche emprunt ee consiste ` a partir du mod` ele inuences/r eactions de laction, en introduisant les agents comme des entit es capables de produire des inuences et de distinguer parmi les etats du monde ceux qui sont utiles pour leurs actions. Ces mod` eles dagents sont fortement inspir es du travail de Genesereth et Nilsson (Genesereth et Nilsson 1987) qui, les premiers, ont donn e une repr esentation alg ebrique de la structure et des comportements des agents. Cependant, comme ils sont rest es dans une conception de laction comme transformation d etats, ils nont pu donner que des mod` eles de syst` emes monoagents, dans lesquels un seul agent est responsable des modications quil apporte ` a lenvironnement. Au contraire, en partant de laction comme production dinuences il sera possible dintroduire les actions simultan ees et donc de pr esenter des mod` eles eectivement multi-agents. Les agents sont des entit es capables de prendre en compte ce qui les entoure, ce qui se traduit pour les agents purement situ es par la capacit e de percevoir lenvironnement et dagir en ex ecutant des actions qui tendent ` a modier l etat
ETIQUES 4.8. AGENTS TROPIQUES ET HYSTER

Agent
dlibration
193
perception
excution
Environnement
Figure 4.31: La structure perception-d elib eration-ex ecution dun agent du syst` eme multi-agent (soit en agissant directement sur lenvironnement, soit en emettant des messages ` a ladresse dautres agents), apr` es avoir d elib er e de ce quil convenait de faire. On dit ainsi quun agent se compose des trois volets: perception, d elib eration, action, comme le montre la gure 4.31. La perception est la qualit e pour un agent de pouvoir classer et distinguer les etats du monde ` a la fois en fonction des traits saillants de lenvironnement, mais aussi en fonction des actions quil entreprend. De ce fait, on consid erera la perception comme une fonction qui associe ` a lensemble des etats du monde un ensemble de valeurs que lon appelle percepts ou stimuli8 . Si lon appelle Pa lensemble des percepts associ es ` a un agent a, alors la fonction de perception dun agent peut etre d enie ainsi: P ercepta : Pa qui associe un percept ` a chaque etat du monde. Les capacit es dex ecution ont et e trait ees pr ec edemment: elles consistent ` a produire des inuences qui seront combin ees et trait ees par lenvironnement ` a partir des lois qui le caract erise. De ce fait, lex ecution consiste ` a appliquer un op erateur par la fonction Exec d enie pr ec edemment: Exec : Op o` u Op et d ecrivent respectivement lensemble des op erations r ealisables par les agents et lensemble des inuences produites par les agents. Ce qui se situe entre lentr ee et la sortie, cest-` a-dire entre la perception et lex ecution, sappelle d elib eration et constitue la partie la plus essentielle dun agent. Cest elle en eet qui rend compte de son comportement eectif, et constitue donc la partie la plus etudi ee et la plus complexe. Alors que les capacit es de perception et dex ecution peuvent souvent etre consid er ees comme de simple fonctions, il nen
8 On pr ef erera percepts dans le cadre des agents cognitifs et stimuli dans celui des agents r eactifs. N eanmoins, jutiliserai indi eremment lun ou lautre pour d esigner ce qui est per cu par un agent.
194
est plus de m eme de la d elib eration, car, sauf ` a consid erer des agents extr emement simples, cest l` a que s elaborent les objectifs, les prises de d ecisions, les facult es de m emorisation et, en ce qui concerne les agents cognitifs, les repr esentations du monde et les concepts utilis es pour d ecider de laction ` a entreprendre. On distinguera, dans un premier temps, deux grandes cat egories dagents: les agents tropiques et les agents hyst er etiques9 . Les premiers caract erisent des agents r eactifs el ementaires qui sont toujours dans lici et le maintenant, sans pouvoir m emoriser quoi que ce soit, alors que les seconds qualient des agents aux comportement aussi complexes que lon veut et qui utilisent leur exp erience pass ee pour anticiper sur lavenir.
4.9
4.9.1
Agents tropiques
Approche formelle
Les agents tropiques sont des agents qui agissent de mani` ere totalement r eexe aux etats du monde. On suppose donc que les agents nont aucun but, ni m eme aucun etat interne. Dans ce cas, lex ecution dun agent est directement li ee ` a ses perceptions, ce qui signie que la facult e de d elib eration peut etre repr esent ee comme une simple fonction Reexe qui associe une op eration ` a un percept: Ref lexea : Pa Op Un agent tropique a dans un syst` eme daction < , , Op, Exec, React >, o` u , , Op, Exec et React sont d enis comme nous lavons vu plus haut, peut donc etre d ecrit comme un triplet: a = < Pa , P ercepta , Ref lexea > cest-` a-dire comme un ensemble de percepts, une fonction de perception et une fonction de d ecision qui se borne ` a r eagir de mani` ere r eexe aux perceptions quelle re coit. De ce fait, si lon appelle Comporta la fonction qui repr esente le comportement de lagent a, alors cette fonction combine simplement le r eexe et la perception de cet agent pour produire une nouvelle op eration. Comporta : Op Comporta ( ) = Ref lexea (P ercepta ( ))
4.9.2
Un syst` eme multi-agent tropique
La dynamique dun syst` eme multi-agent tropique (et donc situ e) est donn e par l evolution de l etat de lenvironnement (t) en fonction du temps. Pour un agent a, l equation de cette evolution est: (t + 1) = React(Exec(Comporta ( (t)), (t)), (t))
9
Cette distinction vient de (Genesereth et Nilsson 1987).
4.9. AGENTS TROPIQUES
195
L etat de lenvironnement est donc le r esultat de lapplication des lois de lunivers aux inuences produites par lapplication de lop eration choisie par le comportement de lagent. Lorsque plusieurs agents a1 , ..., an agissent simultan ement, il faut combiner les inuences produites par chacun des agents:
n
Exec(Comport1 ( (t))||..||Comportn ( (t))) =

i=1
Exec(Comporti( (t)))
do` u on d eduit la dynamique de l etat de lenvironnement:

n
(t + 1) = React(
i=1
Exec(Comporti ( (t))))
L evolution dun syst` eme multi-agent tropique consiste donc en une suite d etats, chacun d ependant ` a la fois des lois de lunivers et du comportement de chacun des agents. La gure 4.32 donne une repr esentation graphique dun syst` eme multi-agent comprenant trois agents tropiques. Nous avons donn e une version discr etis ee de cette evolution dans laquelle tout ce qui se passe entre linstant t et linstant t + 1 est consid er e comme instantan e. Il serait possible den donner une version continue, mais il faudrait pour cela que les op erateurs React et Exec aient une expression continue.
Figure 4.32: Repr esentation graphique dun SMA comprenant trois agents tropiques
4.9.3
Agents tropiques et actions situ ees
Bien que lon puisse a priori penser que les agents tropiques, du fait de leur simplicit e, ne soient pas tr` es utiles, tout un domaine de recherches issu initialement de la planication a pu montrer quil etait possible de d enir des agents tropiques exhibant un comportement relativement complexe en utilisant lenvironnement comme rep` ere et m emoire. On dit alors que les actions dun agent tropique sont situ ees, cest-` a-dire quelles sont relatives ` a sa position et ` a l etat du monde quil per coit. Pour cette notion, une expression a et e forg ee: celle daction situ ee . Introduites initialement en 1987 par Suchman (Suchman 1987), reprises par P. Agre et D. Chapman (Agre et Chapman 1987), soutenues par P. Maes (Maes 1990), et adapt ees ` a lunivers
196
multi-agent par Connah et Wavish (Wavish et Connah 1990), les actions situ ees constituent le mod` ele le plus el ementaire des actions r eactives. Le principe en est tr` es simple et repose sur un sch ema de type stimulus/r eponse. La perception joue un r ole essentiel dans ce mod` ele. Cest en eet par le biais de la perception dindices caract eristiques situ es dans lenvironnement que laction associ ee peut etre d eclench ee. Cette notion dindice sert de fondement ` a la compr ehension du d eclenchement des actions situ ees. Un indice est un trait saillant de lenvironnement utile ` a laction quest en train de mener lagent. Par exemple, si pour me rendre chez un ami je sais que je dois tourner ` a droite juste apr` es la pharmacie qui se trouve en face du tabac, cette pharmacie devient un indice pour le d eclenchement de mon action tourner-` a-droite. Un indice est toujours relatif a lagent et ` ` a ses actions. Il ny a pas dindice en soi. Par exemple, cette pharmacie ne devient un indice pour mon action de tourner ` a droite que parce que je suis en train de me rendre chez mon ami et elle perd son caract` ere dindice une fois que jaurai tourn e` a droite. De m eme un herbivore ne constitue pas n ecessairement un indice pour un pr edateur. Il ne prend son caract` ere dindice que lorsque le pr edateur a faim, cest-` a-dire lorsquil sest engag e dans une action de chasse et quil consid` ere cet herbivore comme une proie. De ce fait, les indices sont des d eclencheurs dactions relatifs ` a un agent. Les percepts sont alors d enis comme des combinaisons dindices signiants pour laccomplissement des actions. La fonction de perception peut donc etre d enie comme une combinaison de fonctions de reconnaissances dindices, o` u chaque fonction partielle de reconnaissance dindice, P erceptIndicei , indique si lindice est pr esent ou non dans lenvironnement par rapport ` a lagent: P erceptIndicei : Ag Bool Bool repr esente lensemble des valeurs {V rai, F aux}. Dans le cas de Clotaire, par exemple, la fonction qui reconna t sil y a ou non une pince ` a lendroit o` u se trouve Clotaire retournera V rai si la pince se trouve eectivement dans la pi` ece o` u se trouve Clotaire et F aux sinon. Il est possible de composer ces fonctions de reconnaissance partielle ` a laide dop erateurs logiques tels que (et), (ou) ou (non). La perception est alors d enie comme une combinaison de fonctions partielles de tests dindices. Par exemple, le percept etre-dans-la-remise-et-rep ^ erer-une-pince est obtenu si les deux fonctions de perceptions dindice ^ etre-dans-la-remise et rep erer-une-pince retournent toutes les deux la valeur V rai. La classication des situations se fait donc en fonction de la position de lagent, ce qui suppose que les positions des agents soient cod ees dans les etats du monde. Le comportement de d elib eration dun agent peut donc etre donn e sous la forme dun ensemble dactions situ ees, cest-` a-dire comme un ensemble de fonctions partielles qui associent une action particuli` ere ` a un percept. Pour les commodit es de sa description, on repr esentera chaque action situ ee comme une r` egle: si <percept> alors <action>
197
o` u <percept> est donn e sous la forme dune combinaison logique de tests dindices. Ces id ees ont et e originellement d evelopp ees par Agre et Chapman dans un programme informatique, Pengi, fond e sur un jeu vid eo, Pengo, dans lequel un pingouin tente de capturer un maximum de diamants en se d epla cant dans un labyrinthe constitu e de cubes de glaces et peupl e dabeilles qui pourchassent le pingouin et tentent de le tuer en le piquant ou en lui lan cant des cubes de glaces. Ces derniers peuvent en eet etre pouss es par les abeilles et par le pingouin. Ils se d eplacent alors en ligne droite jusqu` a toucher un autre cube ou le bord de l ecran et tuent les animaux, abeilles ou pingouin, qui se trouvent sur leur passage (g. 4.33). Lint er et de ce jeu, comme dailleurs de la plupart des jeux vid eo daction, provient de limpossibilit e de planier ` a lavance lensemble des actions du pingouin. Il faut r eagir rapidement aux situations qui peuvent se pr esenter sur un mode r eexe.
Figure 4.33: Le jeu Pengi. Le pingouin doit capturer le plus grand nombre de diamants en evitant les abeilles (extrait de (Drogoul et al. 1991)). Dans la version dAgre et Chapman, les actions du pingouin sont cod ees sous la forme dactions situ ees. Par exemple, laction consistant ` a essayer d ecraser une abeille peut sexprimer sous la forme dune r` egle10 de la forme: R` egle tuer-abeille-1 si il y a un cube-de-glace-` a-c^ ot e-de-moi et il y a une abeille-de-lautre-c^ ot edu-cube-de-glace-qui-est-` a-c^ ot e-de-moi alors pousser le cube-de-glace-` a-c^ ot e-de-moi Les deux premi` eres pr emisses de la r` egle indiquent les pr emisses d eclenchantes de laction et la conclusion pr ecise laction quil y a lieu dactiver.
10 Bien quil ny ait pas ` a proprement parler de r` egles dans leur syst` eme, il est plus facile de linterpr eter de cette mani` ere.
198
Quoique tr` es s eduisante de par sa simplicit e, l ecriture de comportements dagents situ es pose de nombreux probl` emes. Le premier porte sur la coh erence. Par exemple, si le pingouin se trouve pr` es dun diamant et quil rep` ere une abeille situ ee de lautre c ot e dun cube de glace, doit-il prendre le diamant ou essayer dabord de tuer labeille? La solution la plus simple consiste ` a donner un ordre de pr ef erence entre les actions de mani` ere ` a eviter les conits eventuels. Cet ordre se traduit souvent en attribuant une coecient de priorit e aux actions ou en utilisant une architecture de subsomption (cf. chap. 3). Un autre probl` eme r eside dans le fait que les actions situ ees ne consid` erent ni la notion de but interne, ni celle de m emoire: un agent agit uniquement en fonction de ce quil per coit ici et maintenant et il ne peut donc pas prendre en compte l etat dans lequel il se trouve. Par exemple, supposons que lon veuille ecrire le comportement de Clotaire ` a qui lon demande de porter une pince de la remise ` a latelier (g. 4.2). Une solution est evidemment de d ecrire son comportement ` a laide de lensemble des r` egles R1 suivant: R` egle chercherPince si je ne suis pas ` a la remise et je ne porte rien alors aller ` a la remise R` egle prendrePince si je suis ` a la remise et je ne porte rien, alors prendre la pince R` egle allerAtelier si je ne suis pas ` a latelier et je porte quelque chose alors aller ` a latelier R` egle deposerObjet si je suis ` a latelier et je porte un objet alors d eposer ce que je porte Maintenant, supposons que lon veuille que Clotaire ramasse ce quil laisse tomber. Avec les r` egles pr ec edentes, d` es que Clotaire na plus rien, il retourne chercher une pince ` a la remise, et ne tient absolument pas compte du fait quil en portait une quelques instants auparavant. En revanche sil savait quil portait une pince, il ne retournerait pas directement ` a la remise, mais chercherait autour de lui pour retrouver la pince. La solution consisterait ` a coder un etat interne sous la forme dune variable bool eenne, en-train-deramener, et ` a r e ecrire lensemble des r` egles de la mani` ere suivante: R` egle chercherPince (R2) (R1)
4.9. AGENTS TROPIQUES si je et je et je alors ne suis pas ` a la remise ne porte rien ne suis pas en-train-de-ramener aller ` a la remise
199
R` egle prendrePince si je suis ` a la remise et je ne porte rien, alors prendre la pince et me placer dans l etat en-train-de-ramener R` egle allerAtelier si je ne suis pas ` a latelier et je porte quelque chose alors aller ` a latelier R` egle deposerObjet si je suis ` a latelier et je porte un objet alors d eposer ce que je porte et me placer dans l etat pas en-train-de-ramener R` egle rechercherPince si je ne porte rien et je suis en-train-de-ramener et je ne per cois pas la pince par terre alors chercher autour de moi la pince R` egle reprendrePince si je ne porte rien et je suis en-train-de-ramener et je per cois la pince par terre alors prendre la pince Malheureusement, les agents tropiques nont pas de m emoire, ce qui les prive de tout etat interne! Doit-on pour autant faire le deuil des agents tropiques? Non, il sut de faire bien attention ` a la mani` ere dont on code les actions situ ees et de faire en sorte que lon donne ` a lagent les capacit es de reprendre la pince sil ne se trouve pas ` a latelier. Il sut de reprendre lensemble de r` egles R1 et de lui ajouter la r` egle suivante pour r esoudre le probl` eme: R` egle reprendrePince si je ne porte rien et je per cois une pince et je ne suis pas ` a latelier alors prendre la pince (R3)
200
Ainsi, d` es quil per coit une pince en dehors de latelier, quil lait port e juste avant ou quau contraire il lait rencontr e par hasard, Clotaire reprendra la pince et donc son chemin vers latelier, sans n ecessiter un quelconque etat interne.
4.9.4
Souplesse des actions situ ees
Lint er et des syst` emes dactions situ ees vient de leur souplesse pour accomplir des t aches et leur facult e de prendre en compte des modications non pr evues du monde. Par exemple, supposons que lon demande dabord ` a Clotaire dapporter une pince de la remise ` a latelier comme pr ec edemment, et que lon veuille quil aille ensuite chercher un marteau dans le hangar. Une des possibilit es consiste, en s ecartant du principe des actions situ ees, ` a donner ` a lagent une variable bool eenne interne, pince-d epos ee, qui, si elle prend la valeur 1 lui indique que la pince a et e d epos ee et quil peut aller chercher la pince. Les r` egles pour aller chercher un objet sont alors les suivantes (ensemble de r` egles R4): R` egle chercherPince si je ne suis pas ` a la remise et je ne porte rien et je ne suis pas en-train-de-ramener et non pince-d epos ee alors aller ` a la remise R` egle chercherMarteau si je ne suis pas dans le hangar et je ne porte rien et je suis pas-en-train-de-ramener et pince-d epos ee alors aller au hangar Clotaire peut savoir ainsi sil doit aller chercher une pince ou un marteau en tenant compte de son etat interne. Cet etat constitue une repr esentation du monde (cf. chap. 5): la variable pince-d epos ee repr esente le fait que la pince se trouve eectivement dans latelier. Supposons maintenant que pour une raison ou une autre, il y ait eu une erreur et que la pince nait pas et e d epos ee. Clotaire se mettra en route pour aller chercher le marteau alors que la pince na pas encore et e apport ee a lendroit voulu, ce que lon peut consid ` erer comme une erreur ou un bug dans le comportement de Clotaire. Mais cette erreur nest pas de son fait: il se contente dappliquer son programme ` a la lettre. Lerreur vient dune incoh erence entre sa repr esentation (la valeur de pince-d epos ee est ` a V rai) et l etat du monde (la pince na pas et e d epos ee). Or cest justement lint er et des agents tropiques que de ne pas avoir de repr esentation du monde, et donc de pouvoir eliminer les incoh erences (et celles de leur gestion) dues ` a une inad equation entre la r ealit e et sa repr esentation. Pour eviter ce probl` eme, il est possible de sen tenir simplement ` a une perception en consid erant lenvironnement comme une m emoire. Il sut de faire en sorte que Clotaire aille dabord voir dans latelier si une pince a et e d epos ee ou non, et de (R4)
201
d eclencher son comportement de recherche de pince ou de marteau en fonction de cette perception. Ce que lon obtient en codant les r` egles de recherche de la mani` ere suivante (ensemble de r` egles R5):
R` egle chercherObjet si je ne porte rien et je suis pas-en-train-de-ramener et je ne suis pas ` a latelier alors aller ` a latelier R` egle chercherPince si je ne porte rien et et je ne suis pas en-train-de-ramener et je suis ` a latelier et je ne per cois pas de pince alors aller ` a remise
(R5)
R` egle chercherMarteau si je ne porte rien et je suis pas-en-train-de-porter et je suis ` a latelier et je per cois une pince // il est temps daller chercher alors aller ` a hangar // le marteau
Cest ici lenvironnement qui fait oce de m emoire, en indiquant si la pince a et e apport ee dans latelier ou non, la perception de la pince d epos ee jouant pour Clotaire le r ole dune variable bool eenne. Le monde conna t son propre etat, quil sut de percevoir. Une repr esentation est donc inutile puisquil sut pour Clotaire de percevoir cet etat pour agir de mani` ere coh erente, sans quil soit n ecessaire de v erier lad equation entre une repr esentation et le monde environnant. Cet avantage se paye par une augmentation des d eplacements de Clotaire qui doit initialement aller v erier dans latelier si la pince sy trouve. Ces d eplacements suppl ementaires permettent n eanmoins ` a Clotaire de sassurer que la pince nest pas dans latelier et quil doit eectivement aller la chercher dans la remise, ce qui peut sav erer avantageux lorsque le monde evolue ind ependamment des actions de Clotaire (par exemple, parce quil y a des ouvriers qui utilisent les outils transport es par Clotaire) et que les ordres que re coit Clotaire sav` erent incoh erents. Lenvironnement est ainsi une m emoire formidable que les agents peuvent utiliser ` a leur avantage, en d eposant eventuellement des marques qui leur serviront dindices pour accomplir leurs actions ult erieures. Comme le Petit Poucet, lenvironnement peut enregistrer des etats et donner la possibilit e` a des agents ayant tr` es peu de capacit es cognitives daccomplir des t aches int eressantes. On verra au chapitre (cf. chap. 8) que ces capacit es de m emorisation de lenvironnement peuvent etre utilis ees avec prot pour coordonner des actions collectives et amplier ainsi les capacit es naturelles des agents.
202
4.9.5
Les buts sont dans lenvironnement
Puisquil ne savent agir quen fonction de l etat de lenvironnement, on imagine les agents r eactifs soit comme des sortes de marionnettes m ecaniques totalement d epourvues dint er et, soit comme des etres totalement lunatiques qui se laissent ballotter au gr e des impulsions que leur procure lenvironnement. Il est dicile de comprendre que les agents tropiques situ es utilisent lenvironnement pour accomplir des t aches utiles et parfois relativement complexes. Comment en eet, un agent tropique serait-il capable de poursuivre un but? Les actions de d eplacements de Clotaire, comme celle daller ` a la remise, etaient pr ec edemment consid er ees comme atomiques: on supposait quelles etaient tr` es simples et pouvaient etre cod ees directement. Mais si Clotaire ne peut plus aller dune pi` ece ` a une autre en une seule action, comment peut-il parvenir ` a la pi` ece indiqu ee? Il existe de nombreuses solutions dont certaines, qui ne n ecessitent aucune m emorisation, peuvent etre appliqu ees aux agents tropiques. Codage en dur La premi` ere solution consiste ` a coder dans le comportement de Clotaire la suite des pi` eces quil doit traverser. Par exemple pour aller de latelier ` a la remise il doit parcourir les pi` eces {1, 4, 5, 6, 9, 12} et pour aller de latelier au hangar il doit parcourir les pi` eces {1, 4, 5, 6, 3}. Seulement cette technique est bien trop c abl ee: il faudrait d enir tous les trajets possibles permettant daller dune pi` ece ` a lautre, ce qui cro t exponentiellement avec le nombre de pi` eces. De plus, toute modication de lenvironnement n ecessiterait une compl` ete reprogrammation de lagent. Exploration et m emorisation La seconde utilise la technique dexploration de labyrinthe par m emorisation des pi` eces travers ees. Il sut ` a Clotaire dexplorer lensemble des pi` eces en empilant tous les choix quil a eectu e` a un carrefour et en m emorisant toutes les pi` eces quil a d ej` a explor ees, pour eviter de tourner en rond. Cette m ethode, qui repose sur une m emorisation et donc s ecarte des actions situ ees, est tr` es co uteuse, parce quil faudra peut etre explorer toutes les pi` eces avant que Clotaire ne trouve la remise. Elle peut n eanmoins etre int eressante en permettant ` a des agents davoir des repr esentations de leur environnement an quils puissent optimiser leurs d eplacements. Exploration et marquage La troisi` eme est encore une technique dexploration de labyrinthe, mais qui a ` linverse de la pr ec edente utilise lenvironnement pour marquer les pi` eces par lesquelles Clotaire est pass e. Il lui sut de d eposer une marque chaque fois quil arrive dans une nouvelle pi` ece, et de syst ematiquement mettre une croix dans toutes les pi` eces o` u il passe. Sil tombe dans un cul-de-sac, il retourne en arri` ere en suivant les marques, et il enl` eve ces marques jusqu` a revenir ` a un lieu qui donne dans une pi` ece quil na
203
pas encore explor e. De cette mani` ere, il utilise les marques pour revenir en arri` ere et les croix pour eviter de tourner en rond. Cette technique, qui est fond ee sur les actions situ ees, est pourtant semblable ` a la pr ec edente: les marques jouent le r ole de la pile des choix et les croix repr esentent la m emorisation des pi` eces d ej` a vues. Elle pr esente donc les m emes inconv enients que la pr ec edente en supposant des parcours qui croissent exponentiellement avec le nombre de pi` eces. En outre, plus le nombre dissues par pi` ece est important, plus le nombre de choix ` a envisager sera cons equent et donc plus il sera dicile daller dun point ` a un autre. Enn, pour un agent tropique, tout nouveau d eplacement requerra une nouvelle exploration sans quil puisse m emoriser les chemins d ej` a parcourus. Hill climbing La quatri` eme m ethode repose sur la technique de la boussole, aussi appel ee hill climbing par analogie avec la technique des montagnards qui grimpent en suivant les lignes de plus grande pente. Si lon conna t la position g eographique de la pi` ece o` u lon d esire se rendre, il sut de prendre la direction qui m` ene le plus directement a cette pi` ` ece en vol doiseau. Cest une technique evidemment tr` es simple et qui fonctionne bien lorsque lenvironnement nest pas trop accident e. Dans ce cas, en eet, il nest plus n ecessaire dexplorer toutes les pi` eces, et il sut daller dans la direction indiqu ee par la boussole. Evidemment, comme tout le monde le sait, cette technique ne permet pas de toujours se diriger en ville ` a cause des sens interdits et des culs-de-sac. Il en est de m eme pour Clotaire, qui peut se trouver facilement bloqu e dans des voies sans issues. Dans cet exemple, sil utilise cette technique et sengage malencontreusement dans la pi` ece 11, il se trouvera irr em ediablement bloqu e sans pouvoir se rendre dans la remise. Diusion par vague La cinqui` eme m ethode, qui pallie les inconv enients de la pr ec edente, est une variante de celle qui a et e d evelopp ee pour contourner des obstacles ` a laide de champs de potentiels (cf. section 4.5). Elle est tr` es simple et sav` ere tr` es utile pour le d eplacement dagents situ es. Son principe ressemble ` a une diusion de liquide dans un r ecipient, la source du liquide correspondant au but que lon cherche ` a atteindre. Le liquide, ` a la di erence des boussoles, epouse les obstacles et indique ensuite le chemin quil faut prendre pour eviter les barri` eres et les voies sans issues. On marque lenvironnement en associant une intensit e` a une portion despace. La source prend la valeur 0 et chaque fois que lon s eloigne on aecte ` a la nouvelle portion despace une valeur incr ement ee dune unit e par rapport ` a la pr ec edente. Si elle sav erait d ej` a marqu ee, on ne laisse que la valeur la plus faible. La gure 4.34 montre une diusion par vague permettant ` a Clotaire de se rendre ` a la remise. Il sut ` a Clotaire de suivre la ligne de plus grande pente, cest-` a-dire de prendre le chemin dont la valeur descend. Il ira ainsi de la pi` ece 2 (valeur 6) ` a la pi` ece 1 (valeur 5), puis il ira en 4 (valeur 4), en 5 (valeur 3), en 6 (valeur 2) en 9 (valeur 1) et enn en 12 (valeur 0). Il prend ainsi le chemin le plus direct et evite tous les culs-de-sac.
204
3 Hangar 6 Atelier 5 1 2 3

2 6 3 5 4 4 5 7 4 8 6 10 1 0 9 Remise 5 11 12
Figure 4.34: Diusion par vague par rapport ` a la remise Cette technique de marquage pr esente lavantage de ne pas d ependre de lagent et de sa position, mais seulement de celle des buts. Par exemple, si Clotaire veut aller de la pi` ece 10 ` a la remise, il suivra le m eme marquage. En revanche, sil veut aller au hangar, il faudra propager un autre marquage ` a partir du hangar. Les d eplacements de Clotaire entre latelier, le hangar et la remise peuvent etre enti` erement d etermin e par 3 marquages correspondant respectivement ` a chacune de ces pi` eces. Cette m ethode est donc particuli` erement int eressante pour d eplacer un agent tropique dans un espace quelconque, et a et e utilis ee dans de nombreuses applications (Barraquand et Latombe 1989; Drogoul et al. 1991). Son inconv enient majeur r eside dans le marquage, dont la complexit e est proportionnelle au nombre de portions despace envisag e. Lorsque les buts sont statiques cela ne pose pas de probl` eme, mais lorsquil sagit de simuler des situations plus dynamiques, la propagation des marques devient certainement lactivit e la plus co uteuse du fonctionnement dun syst` eme multi-agent de simulation. Enn, ` a cause des ph enom` enes de propagation tr` es sp eciques des signaux dans la nature (rebond des signaux, bruit, variations dintensit es, etc.), de la limitation des capteurs, il nest pas toujours possible dutiliser cette technique dans le cas de robots situ es dans le monde r eel. Nous avons pr esent e pr ec edemment le jeu Pengi et son traitement par le biais de routines d eclench ees par des indices de lenvironnement. En fait, il sest av er e` a la fois plus simple, plus performant et plus imm ediat dimpl ementer Pengi ` a laide dune technique de diusion par vague (Drogoul et al. 1991). Le pingouin est attir e par les diamants et repouss e par les abeilles. Bien que les comportements des agents du monde de Pengi soient el ementaires, le pingouin est capable de jouer tout ` a fait correctement, compar e` a un joueur humain. On pourrait n eanmoins penser quun mod` ele fond e sur des comportements locaux, sans aucune planication, a ses limites (g. 4.35.1). Dans cet univers particulier, le pingouin ne doit pas pousser les cubes droit devant lui, sous peine de cr eer des murs infranchissables (g. 4.35.2) (il ne peut pousser quun cube ` a la fois). Avec un comportement simpliste, il ne peut atteindre le diamant. La solution est de le doter dun comportement dagression envers les cubes un peu plus sophistiqu e : il ne doit pas pousser de cube dans la direction quil emprunte pour rejoindre un diamant, mais de mani` ere perpendiculaire au gradient

1 3
205
Figure 4.35: Le pingouin peut se tirer de situations tr` es complexes (1) ` a condition quil evite de pousser les cubes droit devant lui (2). Pour cela, il lui sut de pousser les cubes perpendiculairement ` a la direction de son but (3). attractif11 . Ceci complique un peu la d enition de son comportement mais permet de r esoudre le probl` eme sans planication (g. 4.35.3). Cartographie La sixi` eme et derni` ere m ethode consiste ` a donner ` a Clotaire le plan des lieux an quil d etermine lui-m eme, sans se d eplacer, le chemin ` a entreprendre. Il sut alors pour Clotaire de planier son trajet en utilisant une technique de planication ` a la Strips ou lune des m ethodes pr ec edentes. La carte est alors employ ee comme une sorte de monde virtuel dans lequel Clotaire peut anticiper lensemble des actions ` a r ealiser avant de les accomplir eectivement. Evidemment, cela suppose que Clotaire dispose de capacit es cognitives importantes pour eectuer cette activit e de planication, ce qui est impossible dans le cas dagents tropiques. Quelle technique pour les agents tropiques? De fait, seules les techniques utilisant le codage en dur, lexploration et le marquage, le hill climbing et la diusion par vagues peuvent sappliquer ` a des agents tropiques. Elles montrent quil est possible de donner un but ` a un agent ` a condition que ce but puisse etre d eni dans lenvironnement. En eet, donner un but ` a un agent, cest souvent d enir dans lenvironnement les objets ou les lieux auxquels il doit sattacher. Ces m ethodes utilisent g en eralement des techniques de marquage de lenvironnement, ce qui permet aux agents de sy retrouver et daccomplir les buts qui leur ont et e assign es. Il faut mettre au cr edit des travaux portant sur les agents r eactifs davoir mis en evidence limportance de lenvironnement pour diriger laction avec des capacit es psychiques tr` es r eduites. Certaines facult es consid er ees comme essentiellement cognitives telles que la m emoire ou le comportement apparemment intentionnel peuvent ais ement etre expliqu ees ` a partir dindices situ es dans lenvironnement,
11 Cf. le chapitre 8 pour une utilisation semblable de forces perpendiculaires aux champs de potentiels dans le cadre de l evitement de collision.
206
et indiquent quil est possible daccomplir des t aches complexes avec tr` es peu de comp etences cognitives si lenvironnement est lui-m eme susamment complexes pour quun agent simple puisse y trouver les nombreux indices dont il a besoin pour guider son action12 .
4.10
Agents hyst er etiques
Malgr e leur int er et, les agents tropiques sont tout de m eme relativement limit es. Si lon veut que les agents puissent acqu erir personnellement une exp erience ou quils soient capables de r esoudre des probl` emes sans avoir ` a marquer lenvironnement, il faut leur donner la capacit e de conserver des informations, et donc davoir de la m emoire. On les appelle agents hyst er etiques.
4.10.1
Approche formelle
Pour un agent, m emoriser une information, ou si lon pr ef` ere, agir en fonction non seulement des perceptions mais aussi des exp eriences pass ees suppose que les agents hyst er etiques peuvent etre caract eris es par un etat interne sa appartenant a Sa lensemble des ` etats interne dun agent a. M emoriser des informations ou une exp erience, cest alors passer dun etat interne ` a un autre. La capacit e de d elib eration ne peut plus etre d ecrite comme une simple fonction Ref lexe, mais comme deux fonctions, celle de m emorisation et celle de d ecision. La fonction de m emorisation, M em, prend un percept, un etat interne et retourne un nouvel etat interne, alors que la fonction de d ecision, Decision, prend un percept, un etat interne et d ecide de lop eration ` a ex ecuter. Ces deux fonctions peuvent etre d ecrites ainsi: M ema : Pa Sa Sa Decisiona : Pa Sa Opa La perception peut alors etre d enie, ` a linstar des agents tropiques, comme une fonction qui produit des percepts ` a partir des seuls etats de lenvironnement. Il est aussi possible de consid erer que la perception d epend aussi des etats internes de lagent, par exemple pour caract eriser le ph enom` ene de la focalisation de la perception. Dans ce cas, la fonction Percept prend deux arguments, un etat de lenvironnement et un etat interne: P ercepta : Sa Pa Un agent hyst er etique a, dans un syst` eme daction < , , Op, Exec, React >, peut donc etre d eni comme un n-uplet: a =< Pa , Sa , P ercepta , M ema , Decisiona >
12
Cette notion est tr` es courante en ethologie (McFarland 1990).
ETIQUES 4.10. AGENTS HYSTER
207
Le comportement est alors plus complexe que dans le cas dun agent tropique, puisquil sagit dune fonction qui associe ` a un couple < etat de lenvironnement, etat interne> un autre couple <ensemble dinuences, nouvel etat interne>: Comporta : Sa Sa Comporta (, s) =< Decisiona (p, s), M ema (p, s) > avec p = P ercepta ( )
4.10.2
Un syst` eme multi-agent hyst er etique
Le mod` ele des multi-agents hyst er etiques situ es en d ecoule simplement. Un syst` eme multi-agent compos e dagents hyst er etiques est d eni par le n-uplet: < Ag, , , Op, Exec, React, Cycle > o` u , , Op, Exec et React sont d enis comme pr ec edemment, et o` u Ag est un ensemble dagents hyst er etiques, chaque agent ai etant d eni ainsi: ai =< Pi , Si , P ercepti , Decisioni , M emi > La dynamique dun syst` eme multi-agent comprenant des agents hyst er etiques est d enie par n + 1 equations: une premi` ere equation d ecrit l etat de lenvironnement en fonction du temps et des comportements de chaque agent et les n autres correspondent aux modications dans les etats internes des agents.
n
(t + 1) = React(
i=1
Exec(Decisioni (pi (t), si (t)))
s1 (t + 1) = M em1 (p1 (t), s1 (t)) ... sn (t + 1) = M emn (pn (t), pn (t)) avec pi (t) = P ercepti ( (t)) Le probl` eme consiste donc ` a d eterminer lensemble des etats internes dun agent et ` a d ecrire les deux fonctions de d ecision et de m emorisation de telle mani` ere que lagent se comportent comme lait voulu le concepteur et que les ph enom` enes collectifs d esir es se mettent bien en place. La gure 4.36 montre la repr esentation graphique dun SMA comprenant trois agents hyst er etiques.
4.10.3
Mod elisation dagents hyst er etiques par automates
Pour d enir les deux fonctions de m emorisation et de d ecision, le plus simple consiste certainement ` a faire appel ` a la notion dautomate ` a etats nis que nous avons pr esent e section 4.4.1. On identie alors lensemble des etats internes dun agent a celui des ` etats de lautomate, et les fonctions de m emorisation et de d ecision respectivement aux fonctions et de ce dernier. Les ev enements conduisant au changement d etat sont donn es par les percepts issus de la fonction de perception.
208
Figure 4.36: Repr esentation graphique de la formalisation dun SMA comprenant trois agents hyst er etiques (` a m emoire) Prenons lexemple dun robot explorateur qui doit chercher du minerai et le rapporter ` a sa base. Le robot explore dabord son environnement d` es quil a re cu lautorisation de partir. Sil aper coit du minerai, il se dirige vers le lieu o` u se trouve le minerai. Puis il remplit sa benne jusqu` a ce quelle soit pleine ou quil ny ait plus de minerai. Lorsquil a termin e ce remplissage il se dirige alors vers sa base. La gure 4.37 repr esente graphiquement lautomate associ e` a cet agent. On a repr esent e les percepts sous la forme dun vecteur de bool eens comprenant les indices suivants: <autorisation-partir, minerai-en-vue, sur-lieu-minerai, a-la-base, benne-pleine, benne-vide> ` Par exemple, si lagent aper coit du minerai et quil a encore la benne vide, son percept sera: <0,1,0,0,0,1> Sur la gure, les percepts sont repr esent es par les indices ayant une valeur non nulle. Lensemble des etats internes Sa de lagent a est egal ` a: Sa = {Pr^ et ` a partir, en exploration, pistage, chargement, retour, d echargement} et les op erations quil peut r ealiser sont: Opa = {explorer, pister, charger, retourner, d echarger} Les automates ` a etats nis, malgr e leur int er et, sont relativement limit es car ils ne savent pas m emoriser des valeurs autres que bool eennes. Les capacit es de m emorisation de tels agents sont donc contraintes par le nombre d etats discrets que lon sait d ecrire a priori, toute linformation m emoris ee se trouvant dans les etats
4.11. MODELISATION DE SMA EN BRIC
209
Figure 4.37: Le comportement dun agent explorateur ` a m emoire repr esent e sous la forme dun automate ` a etat ni de lautomate. Cette limite entra ne des cons equences non n egligeables: lagent ne peut facilement compter les objets quil voit, il ne peut m emoriser les chemins quil a pris, il ne peut pas savoir quel est son niveau d energie interne et donc r eagir de mani` ere ` a r ecup erer de l energie dune mani` ere ou dune autre. M eme la position de lagent doit etre donn ee comme une information de perception, puisque lagent est pratiquement incapable de m emoriser ce type dinformation. Pour r esoudre ces probl` emes, il sut dintroduire des registres et donc de mod eliser un agent ` a laide dautomates ` a registres (cf. section 4.4.2). N eanmoins, ces mod elisations ne permettent pas de d ecrire des agents qui font plusieurs choses en m eme temps. Par exemple, a laide dun syst` ` eme ` a base dautomates ` a etats nis, il est pratiquement impossible de repr esenter un robot explorateur qui communique avec dautres agents, ou qui planie ses actions pendant quil ex ecute les plans d ej` a etablis. Pour cela il faut utiliser un formalisme plus puissant, tel que Bric qui int` egre la notion de r eseaux de Petri.
4.11
4.11.1
Mod elisation de SMA en BRIC

D ecrire des SMA ` a laide de composants
Le formalisme Bric (Basic Representation of Interactive Components), que jai d evelopp e, a pour fonction de donner une repr esentation op eratoire du fonction-
210
nement dun agent et dun syst` eme multi-agent ` a partir dune approche componentielle. La m etaphore de Bric est celle des circuits electroniques que lon peut composer relativement facilement les uns avec les autres. Comme des composants electroniques, les composants Bric saccrochent les uns aux autres ` a laide de bornes et de ls le long desquels transitent des messages. Le formalisme Bric est constitu e de deux langages de type L3 (cf. chap. 1). 1. Un langage graphique de haut niveau d ecrit la structure modulaire des composants Bric. Les agents et lenvironnement, mais aussi les composants internes dun agent sont d ecrits sous la forme de briques connect ees les unes aux autre, chaque brique etant d enie par ses interfaces et ses composants. Cest ce langage qui, en sinspirant de l electronique, facilite la construction de composants complexes par assemblage de composants plus el ementaires. 2. Le comportement des composants de base est d ecrit ` a laide dun formalisme de plus bas niveau qui utilise les r eseaux de Petri color es, lesquels sont bien adapt es ` a lexpression du parall elisme. Une pr esentation plus compl` ete de ce formalisme est donn ee en annexe. Nous nen donnerons ici quun aper cu rapide. Chaque composant Bric peut etre consid er e comme un module, cest-` a-dire une entit e logicielle d enie par lensemble des op erations quelle peut accomplir, et qui sont gur ees sous la forme de bornes dentr ees/sorties (g. 4.38). Les composants interagissent par le biais de liens de communication etablis entre leurs bornes, une borne de sortie etant li ee ` a une (ou plusieurs) bornes dentr ees dun autre composant. Les composants sont des modules opaques: il nest pas possible daller directement modier la structure interne dun composant. De ce fait, les composants sont tous ind ependants les uns des autres, et le comportement dun composant ne peut pas etre alt er e par celui dun autre. En termes de g enie logiciel, on dit que leur structure interne est encapsul ee par les messages quon peut leur envoyer. Le fonctionnement des composants seectue de mani` ere ev enementielle. Ce sont les messages v ehicul es le long des lignes de communication qui d eclenchent leur activit e. De ce fait, chaque composant Bric agit en parall` ele avec les autres agents, le parall elisme etant vu comme une activit e normale du fonctionnement dun agent, quil sagisse dun agent r eactif ou cognitif.
Bornes de sortie Composant Bornes de sortie Bornes d'entres
Bornes d'entres
Figure 4.38: Structure dun composant et de ses bornes Le comportement de ces composants peut etre d eni soit par lassemblage dautres composants dont le comportement est d ej` a sp eci e et lon parle alors
211
de composant composite, soit directement par linterm ediaire dun r eseau de Petri associ e. Dans ce dernier cas, on dira quil sagit de composants el ementaires. Enn, il est aussi possible dintroduire des composants primitifs, dont le comportement nest pas d ecrit par un r eseau de Petri, mais dont lint er et est de prendre en charge des fonctionnalit es externes ` a lagent ou au syst` eme. Par exemple, les activit es de base dun agent mobile (par exemple, aller tout droit, tourner ` a gauche, suivre un gradient...) peuvent etre d ecrites sous la forme de composants primitifs. Les composants Bric peuvent etre utilis es pour mod eliser des agents et des syst` emes multi-agents. Lint er et de lapproche est d etre r ecursive: un agent est un composant Bric, d eni lui-m eme en termes de composants plus el ementaires. Un SMA est alors d ecrit comme un ensemble de composants interconnect es. Le reste de cet ouvrage fait un emploi constant de ce formalisme qui constitue le langage principal de description op eratoire des SMA. Nous allons aborder le cadre g en eral de mod elisation de syst` emes multi-agents en Bric, laissant aux chapitres suivants le soin den d evelopper leurs particularit es. Nous mod eliserons des SMA mettant en uvre trois types dagents: des agents purement communicants, puis des agents purement situ es avant de nir par des agents communicants et situ es.
4.11.2
Mod elisation de SMA purement communicants
Mod elisation dagents purement communicants Les agents purement communicants peuvent etre d ecrits de deux mani` eres di erentes (g. 4.39). Dans la premi` ere (a) ils sont repr esent es sous la forme dun composant ne comportant quune seule borne dentr ee, le r ecepteur des messages, et quune seule borne de sortie, le syst` eme denvoi des messages. Le module de r eception se borne ` a conserver les messages dans sa le dattente et ` a les distribuer aux modules internes, repr esentant les fonctions de m emorisation et de d ecision. Inversement le module denvoi des messages se charge de la collecte de toutes les demandes et informations provenant des modules internes et les envoie aux agents concern es. Dans la seconde (b), les modules de r eception et denvoi de messages ont disparu. Bien que cette deuxi` eme forme soit moins pr ecise, puisque les modules de communication ont disparu, nous lutiliserons souvent ` a cause de sa simplicit e. Mod elisation de lunit e dacheminement des messages Les communications seectuent par linterm ediaire dune unit e dacheminement des messages qui joue le r ole dune poste en se chargeant de la collecte et de la distribution des messages entre agents. Les messages externes envoy es par un agent a un autre agent sont donn ` es sous la forme: A << M(x1,...,xk) o` u A est le destinataire, M est len-t ete d ecrivant le type du message (cf. chap. 6) et les xi sont les arguments du message.
212
Vers les autres agents
messages internes Envoi des messages externes
Vers les autres agents
Rception des messages externes
C Autres modules (dcision et mmorisation)
C Modules de dcision et mmorisation
(a)
(b)
Figure 4.39: Repr esentation en Bric dagents purement communicants Le module dacheminement des messages est tr` es simple, puisquil se limite ` a r ecup erer les messages de tous les agents et ` a les envoyer aux agents concern es ` a partir de ladresse du destinataire, comme le montre la gure 4.40.
A = A1 A = A2 Entre des messages A << M(x1,..,xk) A = An-1 M(x1,..,xk) sortie vers l'agent An-1 A = An M(x1,..,xk) sortie vers l'agent An M(x1,..,xk) sortie vers l'agent A1 M(x1,..,xk) sortie vers l'agent A2
Figure 4.40: Le module dacheminement des messages
Mod elisation des syst` emes multi-agents communicants Il est alors possible den d eduire la structure dun syst` eme multi-agent communicant. Chaque agent (en utilisant la repr esentation (a)) voit sa borne de sortie connect ee a la borne dentr ` ee des messages du modules dacheminement, et sa borne dentr ee reli ee ` a la borne de sortie correspondante de ce module, comme le montre la gure 4.41.
4.11.3
Mod elisation des environnements
Avant de passer ` a la mod elisation dagents situ es, il faut dabord passer par un probl` eme cl e, lenvironnement. Celui-ci constitue en eet une partie essentielle des syst` emes multi-agents situ es. Malheureusement, tr` es peu de travaux ont et e
213
Agent A1 Unit d'acheminement des messages
Agent A2
Agent An
Figure 4.41: Larchitecture dun syst` eme multi-agent communicant consacr es ` a leur mod elisation, et les expos es portant sur lenvironnement sont en g en eral perdus dans les explications des syst` emes les ayant impl ement es, voire totalement noy ees dans le code de leur impl ementation. Cest pourquoi il nous a paru important de bien d egager les di erents mod` eles denvironnement possibles et den pr esenter une mod elisation pr ecise en nous pla cant dans une conception de laction par inuences. Il est possible de repr esenter un environnement de deux mani` eres: soit en le consid erant comme un bloc monolithique, et lon parlera alors denvironnement centralis e , soit en le mod elisant comme un ensemble de cellules r eunies en r eseau pour former une sorte dautomate cellulaire et constituer ainsi un environnement distribu e. Dans un environnement centralis e, tous les agents ont acc` es ` a la m eme structure. Ils produisent des inuences, qui peuvent sexprimer comme des demandes dactions a lenvironnement, et celui-ci r ` epond en renvoyant les el ements consomm es ou per cus comme le montre la gure 4.42. Les environnements centralis es sont de loin les plus utilis es dans les syst` emes o` u la propagation de signaux nest pas trop complexe, cest-` a-dire des syst` emes dans lesquels le nombre de stimuli possibles est r eduit. Les probl` emes de poursuites (proies/pr edateurs) comme ceux relatifs ` a la repr esentation de robots mobiles (avions, v ehicules terrestres, bateaux) evoluant dans un environnement ne permettant quune d etection optique ou electromagn etique sont g en eralement mod elis es ` a laide denvironnements centralis es. Par exemple, les syst` emes Mace (Gasser et al. 1987), Mice (Durfee et Montgomery 1989), Craash (Zeghal et Ferber 1993), Pandora II (Maruichi 1989), Mages (Bouron 1991; Bouron et al. 1990) utilisent de telles techniques. Au contraire, un environnement distribu e est constitu e dun assemblage de cellules dispos ees en r eseau, ` a la mani` ere des automates cellulaires. Chaque cellule se comporte comme un environnement centralis e en miniature, cest-` a-dire quelle g` ere les inuences des agents qui sont localis es sur cette cellule, et envoie les marques consomm ees aux agents qui le demandent (g. 4.43). Cette technique est plut ot utilis ee dans les SMA qui font une d ecomposition de lenvironnement en
214

Agents B A
Environnement
Lgende
Perceptions Influences Consommations
Figure 4.42: Repr esentation sch ematique dun environnement centralis e. Les agents peuvent percevoir ce qui se passe autour deux dans lenvironnement; ils peuvent consommer des el ements de lenvironnement et inuencer son d eroulement en accomplissant des actions. petits espaces connect es dans les jeux de type war game.
A B
<Agent,A> <Agent,B> Cellules
Figure 4.43: Repr esentation dun environnement distribu e Les di erences essentielles qui s eparent les environnements distribu es de leurs homologues centralis es sont les suivantes: 1. L etat de la cellule d epend des autres cellules qui lenvironnent et donc aussi des inuences produites par les agents dans les cellules voisines. 2. La perception des agents s etend g en eralement au-del` a dune cellule, ce qui fait quil nest pas possible denvoyer ` a lagent uniquement les informations de l etat de la cellule sur laquelle il se trouve. 3. Les agents se d eplacent de cellule en cellule, ce qui fait quil faut g erer les liens que les agents entretiennent avec une cellule particuli` ere.
215
4. Des signaux peuvent se propager de cellule en cellule. Cette propagation prend un certain temps et il faut alors synchroniser le d eplacement des signaux avec les mouvements des agents. On ne traitera ici que de la mod elisation denvironnements centralis es. Mod elisation dun environnement centralis e Puisque les actions peuvent saccomplir en parall` ele, il faut disposer dun formalisme capable de supporter ce parall elisme. Bric est un de ceux-l` a, et je lutiliserai pour pr esenter les di erents mod` eles denvironnements. N eanmoins, ce qui est dit ici est ind ependant du formalisme utilis e et peut etre g en eralis e` a dautres repr esentations. Il existe essentiellement deux mani` eres de mod eliser un environnement: Soit on mod elise lenvironnement de mani` ere abstraite, ind ependamment des inuences quil peut subir. Soit on tend au contraire ` a particulariser ses caract eristiques en le sp ecialisant pour un ensemble dactions bien d eni. Pour mod eliser lenvironnement, il faut dabord savoir comment repr esenter ses di erents etats (t) et, en particulier, comment repr esenter la mani` ere dont sont symbolis es les objets, les agents et leur positionnement dans lenvironnement. Pour cela, jutiliserai une technique classique semblable ` a celle qui avait et e pr esent ee avec les repr esentations daction ` a la Strips: les objets et les agents sont donn es sous la forme de constantes et les relations qui existent entre ces objets et ces agents sont repr esent ees par un ensemble de formules pr edicatives que lon appellera faits. Les variables seront not ees par des minuscules et le nom des constantes sera pr ec ed e dune minuscule. On supposera quil existe pour chaque agent un fait de la forme agent(a,p) o` u a repr esente lidenticateur de lagent (qui doit etre unique dans le syst` eme) et p la position de lagent (d enie par exemple sous la forme de coordonn ees cart esiennes dans le plan ou dans lespace). Par exemple, lenvironnement de la gure 4.34 peut etre traduit par la formule suivante o` u sig(R,x,y) repr esente le niveau x du signal de la remise dans la pi` ece y: {chemin(1,2),chemin(1,4),chemin(4,5),chemin(5,6), etc. sig(R,3,3),sig(R,5,1),sig(R,6,2),sig(R,0,Remise), sig(R,3,Hangar), etc.,..., agent(Clotaire,2)} Environnement g en eralis e Les environnements centralis es peuvent etre repr esent es en Bric sous la forme dun composant qui comprend deux entr ees et trois sorties (g. 4.44): lentr ee marqu ee Inuences re coit les inuences produites par les agents. Celles-ci sont combin ees avec l etat de lenvironnement (place P1 ) ` a laide de deux transitions qui repr esentent les r eactions de lenvironnement. T1 correspond ` a des r eactions en pr esence dinuences des agents et T2 ` a ce qui se passe lorsque lenvironnement est laiss e ` a lui-m eme. Les sorties Consommations et Perception correspondent
216
respectivement ` a ce qui est consomm e (prise dun objet ou absorption de nourriture par exemple) et per cu par les agents lors de leurs actions. Des entr ees/sorties de synchronisation (Sync. R eactions et Fin R eactions) servent, comme pour les automates cellulaires (cf section 4.6.1), ` a synchroniser le comportement des agents et les r eactions de lenvironnement. La place P2 sert uniquement de d elai temporel pour faire en sorte que les agents per coivent bien le nouvel etat de lenvironnement.
influences consommations perception T2 P2 P1 conditions supprimer P1 influences Sync Ractions consommations
T1
T1
vers P2 ajouter
(a)
Sync Ractions
Fin Ractions
(b)
Figure 4.44: Repr esentation dun environnement sous la forme dun composant Bric (a). La place P1 repr esente l etat de lenvironnement. Les inuences des agents sont compos ees et trait ees en fonction de l etat courant par les transitions (b) qui d ecrivent les r eactions avec (T1 ) et sans (T2 ) inuences. Les sorties Consommation et Perception repr esentent les el ements du monde que les agents peuvent percevoir ou consommer. Les lois de lunivers, cest-` a-dire la d enition des transitions T1 et T2 , d ecrivent les r eactions de lenvironnement avec et sans inuences. Notons que ces lois peuvent etre d enies ` a laide dun langage de description quelconque. Environnement sp ecialis e Il est possible, notamment, de repr esenter chaque loi sous la forme dune transition, et dassocier une borne ` a chaque type dinuence. Dans ce cas, il est possible de d ecrire enti` erement en Bric le comportement dun environnement, et on parle alors denvironnement sp ecialis e . Par exemple, supposons quun agent ne puisse que se d eplacer, prendre ou d eposer un objet dans lenvironnement. Cela revient ` a d ecrire trois bornes dinuences, une pour le d eplacement, une pour la prise et une pour le d ep ot dobjet, les bornes de consommation et de perception restant inchang ees, comme le montre la gure 4.45. Impl ementation dun environnement centralis e sp ecialis e Nous avons vu la repr esentation dun environnement sous la forme dun composant Bric, mais quen est-il de son impl ementation dans un langage de programmation? Il sut de reprendre les mod` eles que nous avons donn es pr ec edemment et de transformer chaque composant sous la forme dun module (pour une impl ementation dans un langage classique) ou dune classe (pour une impl ementation dans un langage objet).

AllerVers(a,p) Dposer(a,o) Prendre(a,o) consommations perception
217
T1 Agent(a,p) Agent(a,p) Agent(a,q) Chemin(q,p) Sync Ractions Pos(o,p) P1
Tient(a,o) P2
Fin Ractions
Figure 4.45: Mod elisation dun environnement sp ecialis e. Par soucis de clart e, on na pas fait gurer les m ecanismes de synchronisation. Dans lapproche centralis ee, lenvironnement est impl ement e sous la forme dune structure de donn ee globale partag ee par tous les agents et qui contient toutes les informations relatives au positionnement des agents et des autres objets dans lespace. Eventuellement, dautres propri et es pouvant modier la perception des agents, telles que la visibilit e des el ements de perception, peuvent y etre associ ees. La gure 4.46 pr esente la structure dun environnement centralis e, qui comporte deux parties: une partie comprend un dictionnaire qui contient la description et le positionnement de chacun des el ements de lenvironnement, cest-` a-dire la position des agents et des objets, et la seconde contient les proc edures ou m ethodes dacc` es a cet environnement. ` On retrouve directement les principes de mod elisation que nous avons utilis es pr ec edemment: le dictionnaire des el ements repr esente en fait l etat de lenvironnement, et les proc edures dacc` es correspondent, sur le plan de limpl ementation informatique, aux entr ees du mod` ele sp ecialis e, utilis e par les agents pour envoyer des inuences et modier lenvironnement. Cest donc ces proc edures qui se chargeront de limpl ementation des r eactions de lenvironnement.
Environnement Dictionnaire des agents et objets Agent1: <245,78> Agent2: <40,80> ... Objet1: <34,110> Arbre1: <35,100> ...
Procdures ou mthodes d'accs
Observer(a,r) AllerVers(a,p) Dposer(a,o) Prendrea,o)
....
Figure 4.46: Impl ementation dun environnement centralis e On retrouve les proc edures d enies pr ec edemment pour notre mod` ele sp ecia-
218
lis e de lenvironnement. Outre les proc edures allerVers, d eposer et prendre qui correspondent aux entr ees d ej` a examin ees, la proc edure dentr ee observer sert pour les agents ` a obtenir des informations sur les el ements qui leur sont voisins, dans un rayon r autour deux. Cette proc edure retourne la liste des objets et des agents ainsi que leurs positions ` a lagent ayant eectu e cette demande.
4.11.4
Mod elisation dun SMA situ e
Lenvironnement etant d ecrit, il est maintenant possible de donner une description dun syst` eme multi-agent purement situ e. Commen cons par les agents. De la m eme mani` ere que pour les environnements, il est possible de donner un mod` ele g en eralis e des agents ou bien de donner un mod` ele sp ecialis e. Un agent peut etre d ecrit comme un composant comprenant deux entr ees, les perceptions et les consommations. Un mod` ele dagent g en eral ne comprend quune sortie correspondant aux inuences produites (g. 4.47.a). Au contraire, dans une mod elisation sp ecialis ee, on repr esentera chaque type daction sous la forme dune borne de sortie, comme le montre la gure 4.47.b. Les perceptions sont ltr ees par la transition de perception qui ne consomme pas ses marques dentr ees (en eet, on consid` ere classiquement que percevoir ne modie pas le monde per cu). Un agent ne per coit le monde que lorsquil re coit une synchronisation de perception. La r eception de ces percepts d eclenchent un traitement et produit des inuences, lesquelles sont envoy ees vers lenvironnement. Lorsquil a termin e ce travail, lagent envoie un signal de n daction vers le synchronisateur global du SMA.
Sync Perception Fin Action Sync Perception Fin Action
Perception
Perception
Consommations Consommations Influences
dlibration (mmorisation et dcision) (a)
Prendre Dposer AllerVers
dlibration (mmorisation et dcision) (b)
Figure 4.47: Repr esentation dun agent situ e sous la forme dun composant Bric. La forme g en eralis ee (a) evite davoir ` a se prononcer sur lensemble des actions quun agent peut accomplir, ` a la di erence de sa forme sp ecialis ee (b). La borne repr esente les informations provenant de lenvironnement. On supposera que lagent per coit toujours quelque chose, au moins la marque de sa pr esence dans lenvironnement, et donc quil aura toujours quelque chose ` a faire. De ce fait, un agent nest jamais passif, puisquil traite toujours au moins un percept provenant de lenvironnement.

Fin Action Sync Raction
219
Fin Raction
Sync Perception
Figure 4.48: Le synchronisateur dun SMA situ e Le synchronisateur global se charge de synchroniser les perceptions et les actions (g. 4.48). Il est important de bien comprendre lint er et dun synchronisateur. Il sagit dune horloge qui evite que des actions eectu ees de mani` ere simultan ee soient interpr et ees comme etant totalement s epar ees dans le temps. Cette horloge ne donne pas lheure mais assure qu` a un moment donn e tous les agents agissent simultan ement et que lenvironnement ne r eagisse quensuite avant de redonner la main aux agents dans une boucle sans n. La gure 4.49 donne le diagramme des temps dun SMA comprenant deux agents, lenvironnement et le synchronisateur.
Agent1 Agent2 Environnement Synchr.
Perception
Dlibration
Fin Actions Fin Actions Raction de l'environnement Fin Ractions
Perception
Dlibration
Sync Perceptions
Sync Raction
Sync Perceptions
Figure 4.49: Diagramme de synchronisation pour deux agents et un environnement Lorsque le synchronisateur envoie un signal Sync Perceptions, les agents Agent1 et Agent2 eectuent leur perception. Chaque agent d elib` ere en traitant les perceptions quil re coit en fonction de son etat pr ec edent, puis envoie ses inuences ` a lenvironnement. Finalement, il envoie un signal de n dactions. Lorsquil a re cu tous les signaux de n dactions provenant des agents, le synchronisateur envoie un signal Sync R eaction qui d eclenche la r eaction de lenvironnement ` a la production des inuences. Une fois termin e, lenvironnement envoie un signal de n de r eaction au synchronisateur qui r eagit en envoyant un signal Sync Perceptions, et le cycle recommence. Le sch ema g en eral dun SMA situ e est pr esent e ` a la gure 4.50. Lenvironnement comme les agents sont donn es sous leur forme g en eralis ee. Il surait de remplacer la d enition centralis ee des agents et des environnements par des versions sp ecialis ees pour disposer dun mod` ele de SMA sp ecialis e.
220
Sync Perceptions Fin Actions
Agent1
Synchronisateur
Sync Ractions Fin Ractions perceptions
Environnement
consommations
Agent1
influences
Figure 4.50: Sch ema g en eral dun SMA situ e` a deux agents
4.11.5
Mod elisation dun SMA complet
La mod elisation dun syst` eme compos e dagents sachant ` a la fois communiquer et agir dans un environnement est relativement simple puisquil sut de superposer les sch emas dagents situ es et dagents communicants. Mais cette apparente simplicit e cache en fait un probl` eme plus complexe qui porte sur le probl` eme de la synchronisation des actions situ ees par rapport aux messages. Les communications ont et e mod elis ees de mani` ere asynchrone, notamment ` a cause du formalisme des r eseaux de Petri qui est naturellement asynchrone, cest-` a-dire que les messages sont envoy es dans nimporte quel ordre et que lon ne se soucie absolument pas de conna tre le temps mis par un agent pour r epondre ` a un message. Inversement, les agents situ es sont totalement synchronis es par lenvironnement, et ceci a n ecessit e lintroduction dun synchronisateur. Ce probl` eme de synchronisation peut etre r esolu de deux mani` eres. La premi` ere consiste ` a lignorer purement et simplement en consid erant que les communications poss` edent leur rythme propre qui na rien ` a voir avec les actions dans un environnement. Mais cela pose n eanmoins de grandes difcult es lorsque les agents doivent collaborer ` a une t ache commune dans laquelle le temps est un param` etre important (probl` emes de temps r eel par exemple). La seconde solution, qui est dapr` es moi la plus sage, consiste ` a synchroniser les messages avec les actions: les messages sont envoy es en m eme temps que les inuences, et re cus avec les perceptions. Dans ce cas, les messages ont un temps de propagation consid er e comme imm ediat par le mod` ele (on peut n eanmoins modier le syst` eme dacheminement des messages pour mod eliser un syst` eme de d elai de transmission si on le d esire). Le synchronisateur ne comprend quune borne en plus, Fin Message, qui indique que tous les messages ont et e envoy es et qui vient se combiner a lindicateur Fin R ` eactions (g. 4.51).

Sync Ractions /envoi des messages Rception message Fin Actions
221
Fin messages Sync Perceptions
Agent1
envoi des messages Unit d'acheminement des messages
Synchronisateur
Sync Ractions Fin Ractions perceptions
Environnement
consommations
Agent1
Rception message
influences
Figure 4.51: Mod` ele de syst` eme dagents communicants et situ es. Le synchronisateur synchronise les messages avec les actions.
4.11.6
Un exemple: les agents transporteurs
Nous allons maintenant montrer comment il est possible de construire un syst` eme multi-agent r eactif simple ` a partir du mod` ele daction fond e sur les inuences. Limpl ementation de lenvironnement de mani` ere globale est plus claire dans ce cas. Lexemple est celui de Clotaire (section 4.2.2). Clotaire doit aller dans la remise pour aller chercher un marteau et lapporter dans le hangar. On suppose que la remise et le hangar emettent des signaux qui se propagent sous la forme de vagues en contournant les obstacles. Lenvironnement est initialement d ecrit par lensemble des marques suivantes: {chemin(1,2),chemin(1,4),chemin(4,5),chemin,5,6), etc. sig(R,3,3),sig(R,5,1),sig(R,6,2),sig(R,0,Remise), sig(R,3,Hangar), etc. sig(H,0,Hangar),sig(H,5,2),sig(H,1,4),sig(H,1,6), sig(H,3,Remise), etc. agent(Clotaire,2),pince(Remise)} Le comportement de lagent se borne ` a aller vers la remise en suivant le gradient des signaux emis par cette pi` ece (signaux R), ` a prendre la pince, puis ` a aller dans le hangar pour ly d eposer en suivant les signaux H emis par le hangar. Il est possible de donner un mod` ele de comportement de cet agent sous la forme dun agent situ e, dont les seules actions sont daller vers une pi` ece adjacente, de prendre et de d eposer quelque chose (g. 4.52). Le module de perception se contente de ltrer les informations qui int eressent lagent et de construire les percepts obtenus ` a partir dune combinaison des indices agent(Clotaire,x) qui donne la position de lagent, pince(y) qui donne la position
222
Figure 4.52: Un mod` ele dagent r eactif se basant uniquement sur sa perception de la pince, et sig(s,x,l) lequel donne lintensit e x dun signal s en un lieu l (g. 4.53).
Figure 4.53: La structure interne des composants de perception et de d elib eration de lagent transporteur Le module de d elib eration se charge de la logique de lagent. Celui-ci suit dabord le gradient R qui le conduit vers la remise, puis, lorsquil se trouve dans la remise et si la pince sy trouve aussi, il la prend (d eclenchement de laction prendre, suivi de la consommation de lobjet), puis il se dirige vers le hangar en suivant les gradients des signaux H. Enn, lorsquil arrive dans le hangar, il d epose ce quil tient (la pince en loccurrence) et il sarr ete. Il sagit dun agent relativement simple, qui ne peut pas se rendre compte sil perd la pince quil porte, et qui simmobilise si la pince ne se trouve pas initialement dans la remise. Enn, lagent ne peut eectuer quune seule t ache extr emement sommaire (aller chercher une pince et la porter dune pi` ece a une autre), ce qui r ` eduit bien evidemment son int er et. N eanmoins, cet exemple montre quil est possible de d ecrire lint egralit e du comportement dun SMA dans le
223
formalisme Bric. Nous verrons aux chapitres suivants quil est possible de construire des agents beaucoup plus elabor es, dans lesquels ce formalisme prendra toute son importance.
224
Chapter 5 Lagent dans tous ses etats

5.1
5.1.1
Etats mentaux et intentionnalit e

Introduction
La psychologie ordinaire consiste ` a d ecrire et ` a expliquer le comportement des etres humains ` a partir de leurs etats mentaux, cest-` a-dire ` a partir de leurs croyances, d esirs, intentions et engagements. Par exemple, si lon dit que Paul a envie de faire un cadeau ` a Marie, et quil croit que Marie aime les eurs, on peut en d eduire que Paul va certainement orir des eurs ` a Marie. De m eme si Pierre demande a ` quelquun sil a lheure, on en conclut dune part quil lui manque linformation concernant lheure au moment o` u il fait cette demande, et dautre part quil d esire quon lui fournisse cette information. Ces raisonnements spontan es que nous eectuons quotidiennement et par lesquels nous expliquons le comportement des etres humains peuvent donner lieu ` a l elaboration de th eories. On suppose alors que ce qui se passe dans la t ete dun agent (quil sagisse dun agent articiel comme dans les syst` emes multi-agents ou dune personne humaine telle que peuvent lappr ehender les sciences cognitives) r esulte de linteraction dun certain nombre de composants cognitifs, appel es g en eralement etats mentaux ou attitudes propositionnelles. Par exemple, croire quil pleut ou que le chat est sur la chemin ee, cest etre dans une certaine disposition ` a propos de la pluie ou du chat. De m eme, en voulant aller au cin ema, je suis dans un certain etat desprit ` a propos du fait daller au cin ema. Les d esirs comme les croyances sont donc des etats mentaux qui se r ef` erent ` a quelque chose de concret comme dans les exemples pr ec edents, voire ` a un autre etat mental. Par exemple, si je crois que Paul d esire un pain au chocolat, ma croyance se rapporte au d esir de Paul, cest-` a-dire ` a un etat mental qui se r ef` ere lui-m eme ` a un pain au chocolat. Les etats mentaux ont donc cette particularit e d etre ` a propos de quelque chose, et cest pourquoi on parle du caract` ere intentionnel des etats mentaux. Les termes intentionnel et intentionnalit e ont et e forg es par les philosophes scolastiques du Moyen Age. Il proviennent du latin intendo qui signie diriger (ou tendre) vers. Ils ont ensuite et e repris par les philosophes dans un sens cognitif: la conscience sappliquant ` a quelque chose dautre quelle-m eme, elle est donc par
226
CHAPTER 5. LAGENT DANS TOUS SES ETATS
nature tendue vers ce quelque chose, et donc intentionnelle. En eet, si je vois un objet, la croyance que cet objet se trouve bien devant moi est un ph enom` ene mental qui se rapporte ` a cet objet. Cest dailleurs en cela que je peux dire que je vois cet objet. De m eme, si je d esire me rendre quelque part, ce d esir sapplique ` a lacte daller dans un certain lieu, et donc ` a quelque chose dautre qu` a ce d esir. Brentano et ` a sa suite Husserl (Husserl 1950) ont soutenu que lintentionnalit e repr esentait la distinction fondamentale permettant de d enir le mental et le physique; tous les ph enom` enes mentaux, et eux seuls, font preuve dintentionnalit e. Depuis, les philosophes anglo-saxons, dans le cadre de ce que lon appelle la philosophie de lesprit (philosophy of mind), se sont empar es de cette question pour analyser ce qui se passe dans nos esprits et essayer de fournir des mod` eles du rapport qui existe entre les croyances, les engagements et les intentions pour ne parler que de quelques-uns de ces etats mentaux. La probl ematique de lintentionnalit e est extr emement riche et on pourrait la formuler de la mani` ere suivante: Quest ce qui fait quun agent fait ce quil fait? Quels sont les el ements internes quil met en uvre pour nous donner lillusion dune autonomie et que son comportement suive une certaine coh erence dans les echanges quil entretient avec le monde et les autres agents. Malheureusement, en d epit de lattention que re coit actuellement ce concept, il existe un manque frappant de consensus ` a propos de lanalyse de lintentionnalit e. Le seul point daccord concerne la nature du probl` eme pos e et les solutions peuvent prendre des formes 1 eroyablement techniques . Cette dicult e sajoute ` a une autre: les termes dintention et dintentionnalit e peuvent prendre deux acceptions relativement distinctes. La premi` ere, utilis ee dans le domaine philosophique, correspond ` a la d enition que nous avons donn e pr ec edemment et se rapporte donc aux etats mentaux. Le second se r ef` ere au sens commun de la notion dintention: on dit que quelquun a lintention daccomplir un acte (par exemple: sortir, prendre un verre) sil d esire eectivement ex ecuter cet acte. Lintention est alors, comme le pr ecise Thomas dAquin, un acte de volont e pr ec ed e dun acte par lequel la raison ordonne quelque chose ` a sa n. Il est vrai que cette confusion est dautant plus forte que la seconde acception nest quun cas particulier de la premi` ere et ces deux signications sont souvent pr esentes dans un m eme ouvrage. La plupart du temps, on r eserve le terme dintentionnalit e` a la probl ematique g en erale des etats mentaux et celui dintention ` a la volont e dagir. Dans la suite de louvrage et an d eviter cette confusion, nous nutiliserons plus, sauf mention explicite du contraire, les termes intention, intentionnel, intentionnellement et intentionnalit e que dans le second sens, cest-` a-dire dans celui de ce qui am` ene un agent ` a agir, pr ef erant les expressions etats mentaux ou cognitons
1 Pour avoir une bonne introduction ` a la probl ematique de lintentionnalit e en IA on pourra se r ef erer ` a (Bachimont 1992) qui pr esente de mani` ere relativement simple la relation qui existe entre les th eories philosophiques de la connaissance et les solutions (partielles) apport ees par lIA. Dautre part, pour aborder la question de lintentionnalit e dans le d ebat cognitiviste actuel, on lira avec bonheur lexcellent ouvrage (Pacherie 1993) qui donne une vue tr` es synth etique des di erentes positions en pr esence. On pourra aussi lire (Searle 1985) et (Dennett 1987) qui d etaillent des points de vue importants dans ce d ebat.
5.1. ETATS MENTAUX ET INTENTIONNALITE pour d esigner le premier.
227
5.1.2
La notion de cogniton
Le terme d etat mental nest pas non plus tr` es heureux car il suppose une certaine id ee de traitement s equentiel dans le mode cognitif de fonctionnement dun agent. En eet, le mot etat exprime g en eralement une caract eristique globale dun syst` eme. Il donne lillusion quun agent se trouve ` a un moment donn e dans une conguration particuli` ere ais ement qualiable. On a limpression alors que si lon dit quun agent se trouve dans l etat de d esirer un objet, son esprit (mind) sera dans une conguration particuli` ere caract eristique dun d esir pour un objet. Or cette impression est totalement fausse. On dira simplement quun agent pr esente l etat de d esir, sil existe quelque part dans son syst` eme cognitif des structures informationnelles caract eristiques du d esir, et qui lam` ene ` a mettre en uvre des ressources de mani` ere ` a, si cela sav` ere possible, satisfaire son d esir. L etat mental de d esir (comme celui de croyance, dintention, dengagement) nest en fait pas un etat mais une structure calculatoire2 repr esentant un d esir pour quelque chose. Si par hasard un agent vient ` a d esirer et ` a craindre un m eme objet, on ne dira pas que lagent est dans un etat particulier de d esir ou de crainte, mais que les deux structures calculatoires de d esir et de crainte sont pr esentes en m eme temps et agissent de mani` ere conjointes (et oppos ees) pour la d enition des comportements des agents. De ce fait, je conserverai le terme d etat pour d ecrire toute conguration globale dun syst` eme (cest la notion d etat telle que nous lavions vue avec la notion dautomate ` a etats nis au chapitre 4), et jutiliserai ` a la place le n eologisme de cogniton3 pour d ecrire ces structures calculatoires qui sont ` a propos de quelque chose, et donc dou ee dintentionnalit e dans le premier sens du terme, cest-` a-dire celui des scolastiques et de Husserl. Un cogniton est donc une unit e cognitive el ementaire qui est reli ee ` a dautres cognitons pour former une conguration mentale dynamique qui evolue avec le temps. Des cognitons peuvent etre cr e es ou dispara tre comme cons equences de la cr eation ou de la disparition dautres cognitons dans lappareil cognitif dun agent. Par exemple, si je crois que le chat est sur la chemin ee et que je le per cois sur la table, alors je r eviserais mes croyances en consid erant que je dois privil egier dabord ce que je vois par rapport ` a ce que je crois. Le fait davoir une croyance ` a un moment donn e et ensuite de r eviser cette croyance ` a partir dune perception fait partie de lactivit e normale du module repr esentationnel, qui elabore des mod` eles du monde ` a partir des informations (percepts, messages informatifs) quil re coit et des connaissances dont il dispose au pr ealable. Dans le m eme ordre did ees, les intentions sont li ees ` a
2 De nombreux auteurs tels quE. Morin pr ef` erent le terme computationnel. Mais les informaticiens, qui savent bien que le calcul ne se r esume pas au traitement de nombres, pr ef` erent g en eralement le terme calculatoire comme correspondant de langlais computational. 3 Ce terme est construit ` a partir du vocable cognitif et de la terminaison on qui d esigne quelque chose dins ecable, une particule el ementaire, ` a la mani` ere de photon ou m eson. Il a et e elabor e par analogie avec infon, lunit e el ementaire dinformation d evelopp ee par K. Devlin dans le cadre de la s emantique situationnelle (Devlin 1991).
228
la fois aux buts qui les motivent, mais aussi aux normes et aux engagements qui les contraignent. Si lon propose un rendez-vous et que lon est d ej` a occup e, il faudra soit modier la date de ce rendez-vous, soit se d ecommander de ses engagements ant erieurs, ce qui entra nera une r evision de ses croyances et de ses intentions.
5.1.3
Une nomenclature des cognitons
Il existe evidemment un grand nombre de cognitons. Les trois principaux que lon retrouve dans la plupart des th eories sur les etats mentaux sont les croyances, les intentions et les engagements. Mais il en existe beaucoup dautres qui se rapportent aux di erents el ements permettant de comprendre le fonctionnement des agents cognitifs: par exemple les percepts, les buts, les d esirs, les pulsions, les hypoth` eses, etc. sont aussi essentiels ` a la d enition du comportement des agents que peuvent l etre les engagements ou les croyances. Il est possible de classer les cognitons en fonction du syst` eme organique auquel ils sont li es. N eanmoins, certains cognitons sont ` a cheval entre plusieurs sous-syst` emes cognitifs. Par exemple, lintention et lengagement font aussi bien partie du sous-syst` eme conatif, puisquil sagit d el ements qui permettent la d ecision, que du sous-syst` eme organisationnel, puisquils permettent la gestion de laction. Voici la liste, non exhaustive, des cognitons et des sous-syst` emes dans lesquels ils agissent. Lorsquun cogniton appara t dans plusieurs, la liste en est donn ee ` a la n de sa description. Les cognitons interactionnels Percept. Les percepts repr esentent linformation sensible obtenue par perception de lenvironnement. Cette information est g en eralement le r esultat dun travail d elaboration eectu e par des capteurs et des syst` emes de pr etraitements que nous n etudierons pas. Information. Une information est un cogniton qui repr esente une croyance v ehicul ee par un autre agent et transmise par message. Commande (ou d ecision). Les commandes sont des cognitons provenant du syst` eme conatif et d ecrivant les op erations qui doivent etre ex ecut ees par le syst` eme interactionnel, qui se traduiront par des actions de lagent sur son environnement. Requ ete. Les requ etes sont des actions eectu ees par un agent an quun autre agent accomplisse une action (faire quelque chose, r epondre ` a une question,...). Les requ etes sont ainsi des actions relationnelles puisquelles sappliquent entre agents. Nous verrons au chapitre 6 que la th eorie des actes de langage leur assure une base solide. Normes. Les normes sont des cognitons qui repr esentent en fait les demandes et les contraintes sociales impos ees par lorganisation sur un agent particulier. Les normes peuvent sexprimer ainsi de nombreuses mani` eres. La plus courante
5.1. ETATS MENTAUX ET INTENTIONNALITE
229
consiste ` a attribuer ` a un agent un ensemble de t aches ` a accomplir en relation avec la fonction (ou le r ole) quil occupe dans son organisation. Ces normes sont alors appel ees demandes sociales car elles jouent le m eme r ole que des demandes pour le d eclenchement de laction. La plupart des normes ne sont pas acquises par lagent mais install ees par le concepteur lors de la cr eation dun agent. Les cognitons repr esentationnels Croyance. Les croyances d ecrivent l etat du monde du point de vue dun agent, et donc la mani` ere dont il se repr esente son environnement, les autres agents ainsi que lui-m eme. En particulier il faut bien distinguer les croyances sur soi des croyances sur les autres, les premi` eres pouvant etre coh erentes avec l etat 4 dans lequel se trouve lagent , alors que les secondes ne sont que partielles et eventuellement erron ees. Hypoth` ese. Les hypoth` eses sont des repr esentations possibles du monde et des autres agents qui ne sont pas encore crues par lagent. Une hypoth` ese peut servir ` a d eclencher des actions ayant pour but de la transformer en croyance. Les cognitons conatifs Tendance/But. Les tendances ou buts (nous ne ferons pas de di erence ici) sont les r esultats essentiellement de pulsions et de demandes. Quils soient r ealisables ou non nintervient pas dans la d enition dun but. Par exemple, je peux avoir le but d etre milliardaire, m eme si je sais quil y a peu de chances que jatteigne ce but. Mais jessayerai n eanmoins de satisfaire ce but, en jouant au Loto par exemple, et si jamais je gagne le gros lot, alors ce but sera satisfait. Les buts sont donc toujours pr esents tant que ce qui a conduit ` a la construction du but est lui-m eme valide. Les buts (ou tendances) peuvent sexprimer aussi bien en termes dattirance que de r epulsion. Ils sont en fait le cur du syst` eme conatif. Pulsion. Les pulsions sont les sources internes de construction de buts. Elles correspondent ` a des demandes du syst` eme conservatif tel quassouvir sa faim, tenter de se reproduire et dune mani` ere g en erale tout ce qui permet la survie individuelle ou celle de lesp` ece (sous-syst` emes v eg etatif et conatif). Demande. Les demandes sont les sources externes des buts. Elles interviennent lorsquun agent eectue une requ ete vers un autre agent. Intention. Les intentions d ecrivent ce qui meut un agent, ce qui lui permet de passer ` a lacte. En suivant Cohen et Levesque (cf. section 5.8), nous verrons quil est possible de se passer du cogniton de lintention ` a condition davoir les
4 On peut supposer que dans les syst` emes articiels, les agents aient des croyances vraies sur eux-m emes et en particulier sur leurs comp etences, ce qui nest pas vrai pour des agents r eels tels que les etres humains qui se leurrent souvent sur eux-m emes ou se m esestiment.
230
CHAPTER 5. LAGENT DANS TOUS SES ETATS notions de buts et dengagement, ainsi que la capacit e d evaluer limportance des buts et leurs cons equences (sous-syst` emes conatif et organisationnel).
Engagement Les engagements caract erisent les d ependances (devoirs, contraintes...) qui lient les agents cognitifs par rapport ` a eux-m emes, mais surtout par rapport aux autres lorsquils d ecident daccomplir une action, de rendre un service et, dune mani` ere g en erale, lorsquils ont lintention de faire quelque chose (sous-syst` emes conatif et organisationnel). Les cognitons organisationnels Ces cognitons assurent le suivi des actions des agents. Lorsquun agent poss` ede un but, il evalue les di erentes m ethodes lui permettant de satisfaire ce but sil en dispose, ou bien il essaye de d ecomposer son but en sous-buts de mani` ere ` a trouver un plan qui lui permette daccomplir ses objectifs. Apr` es avoir pris sa d ecision, il se met au travail, cest-` a-dire quil ex ecute la t ache correspondant ` a la m ethode choisie, cette t ache etant plac ee dans un agenda des choses ` a faire et ` a surveiller. M ethode. Les m ethodes sont lensemble des techniques, r` egles, plans et programmes qui peuvent etre mis en uvre par un agent pour accomplir une t ache et satisfaire un but. Une m ethode d ecrit lensemble des etapes n ecessaires ` a la r esolution dun probl` eme ou ` a la r ealisation dun but. Par exemple, si lon doit r esoudre un probl` eme, on peut utiliser la m ethode que lon pourrait appeler de gros uvre et d etails (propose and revise) dans laquelle on construit dabord une solution partielle et peu d etaill ee que lon sapplique ensuite ` a d evelopper. Les m ethodes prennent souvent laspect de plans, cest-` a-dire de suites dactions ` a entreprendre, ` a di erents niveaux de d etails, pour accomplir un but, comme lorsque Clotaire doit d eterminer le moyen de satisfaire le but prendre la pince qui se trouve dans latelier. T ache. Les t aches se rencontrent ` a deux niveaux di erents. Au niveau conceptuel, une t ache est la description de ce quil faut faire pour accomplir un but. Par exemple, pour que le marteau soit dans le hangar et plus dans latelier, il faut successivement aller chercher le marteau, le prendre et le transporter dans le hangar. Il sagit uniquement des actions de haut niveau que lon doit accomplir. Rien nest dit sur leur mise en uvre: ce sont les m ethodes que lon appliquera qui indiqueront comment aller dans latelier, comment prendre le marteau et comment transporter le marteau dans le hangar. Au niveau organisationnel, les t aches sont aussi les unit es de travail en cours dex ecution, cest-` a-dire linstanciation du d eroulement dune m ethode. Parfois, surtout pour des agents r eactifs ou pour des agents cognitifs simples, les termes t aches et m ethodes sont confondus: sil nexiste quune seule m ethode pour une t ache d enie, alors il ny a plus dint er et ` a dissocier ces deux concepts, et lon emploiera alors lun pour lautre.
` 5.2. LE SYSTEME INTERACTIONNEL Autres cognitons
231
Il existe evidemment bien dautres cognitons caract eristiques d etats mentaux, tels que les craintes, les d esirs, les espoirs, les r eves, les aects (sentiments associ es ` a un autre agent), etc. Nous nen parlerons pas, estimant soit quils font plus ou moins partie des etats mentaux pr ec edents (par exemple, les d esirs sont li ees aux pulsions et aux buts), soit quils portent sur des caract eristiques qui ne nous int eressent pas pour des agents articiels: les peurs, comme les r eves, les aects et les espoirs ne font pas (encore) partie de la structure des agents articiels.
5.2
Le syst` eme interactionnel
Cest par la perception que lagent acquiert des informations sur le monde pour lui permettre d elaborer son action en poursuivant ses buts. Le syst` eme perceptif constitue ainsi une porte entre le monde et lagent qui lui donne acc` es ` a une certaine conception du monde dans laquelle ses raisonnements et ses actions sont signicatifs. En eet toute perception est individuelle et contribue ` a une repr esentation personnelle du monde (Uexk ull 1956). Pour la tique du chien, le monde se r eduit a ` trois stimuli: la chaleur diuse, lodeur dacide butyrique et la chaleur. Cela lui sut pour ses besoins, son comportement etant enti` erement d etermin e par ces impressions el ementaires. Elle s el` eve vers la lumi` ere jusqu` a ce quelle ne puisse plus aller plus haut, et d` es quelle per coit lodeur de lacide butyrique, provenant des mammif` eres, elle se laisse tomb ee. Si elle tombe sur de la chaleur, cela signie quelle a atteint son but. Elle trouve un endroit d epourvu de poils et elle perce la peau pour aspirer le sang. Puis le cycle recommence. Pour des etres plus complexes, leur syst` eme perceptif leur permet de reconna tre leurs proies et leurs pr edateurs, leur lieux de reproduction, les etres de la m eme esp` ece, etc. Le syst` eme perceptif dun agent est ainsi reli e ` a ses comp etences cognitives et comportementales. Un robot explorateur de minerai doit disposer de m ecanismes de d etection de minerai sil veut accomplir sa t ache. Il pourra de plus percevoir les obstacles qui se pr esentent sur sa route (rochers, crevasses, arbres, etc.) an de les eviter. Sil est capable de percevoir en plus la pr esence dautres robots, il pourra elaborer des strat egies dexploration lui permettant de mieux remplir sa fonction, en s eloignant des autres robots qui recherchent du minerai et en sapprochant au contraire de ceux qui viennent den trouver. La gamme des r eponses comportementales d epend donc de la richesse des perceptions et des capacit es de reconnaissance dun agent. Mimer le comportement dun autre agent, par exemple, n ecessite ` a la fois des capacit es cognitives assez pouss ees, mais surtout des m ecanismes de reconnaissance tr` es elabor es lui permettant de reconna tre la posture et les gestes dun autre agent an de pouvoir les imiter. Les philosophes, depuis Aristote, se sont toujours int eress es ` a la perception: pour ce dernier, qui avait une conception tr` es r ealiste, percevoir cest s eparer par abstraction la forme de la mati` ere, l etre se trouvant ainsi inform e par cette substance. Lobjet per cu agit ainsi directement sur le syst` eme perceptif, lagent se
232
contentant passivement de recevoir cette forme et de lint egrer ` a son syst` eme cognitif (` a son ame dirait Aristote). La perception est essentiellement une modication physique qui laisse des traces physiques, les phantasmes, dans le corps (si lon regarde un morceau de papier blanc, les yeux, ou une partie interne des yeux, deviennent blancs par une sorte de r eexe mim etique du percevant vis-` a-vis du per cu). Pendant longtemps, et en fait jusqu` a Kant, les philosophes ont adh er e` a une conception causale de la perception: les objets du monde agissent m ecaniquement sur les divers organes des sens de mani` ere ` a former des id ees de sensations, objets imm ediats de la perception. Les explications modernes sont plus techniques mais partent souvent de la m eme id ee: les sensations sont des donn ees imm ediates issues dexcitations provenant de capteurs externes ou internes qui transforment les stimuli physiques (vibration de lair, energie lumineuse, compos es chimiques, etc.) en signaux internes, lesquels sont ensuite trait es par lensemble des syst` emes de perception primaires qui eliminent le bruit, segmentent les signaux et fournissent aux syst` emes de traitement secondaires les donn ees brutes ` a partir desquelles ils pourront eectivement reconna tre des formes signiantes. Cest encore cette conception, que lon qualie de r ealiste qui pr evaut de mani` ere na ve dans notre activit e quotidienne: nous supposons que nous percevons directement des propri et es objectives des corps qui nous entourent et qui viennent sinscrire directement dans notre esprit par un proc ed e direct et imm ediat. De ce fait, le monde est pour nous bien tel que nous nous le repr esentons: la neige est bien blanche, la rose bien rouge, la table bien plate, etc. Cette notion purement passive de la perception est tellement ancr ee en nous que nous avons du mal ` a penser que nos facult es perceptives elles aussi sont le fruit dune elaboration et que nous ne percevons bien que ce que nous avons dune certaine mani` ere d ej` a per cu. Les perceptions sont les fruits de constructions qui d ependent de sch emas perceptifs ant erieurs, lesquels se sont construits progressivement par nos interactions avec lenvironnement et les autres agents qui ont confort e nos points de vues. Un corps est rouge parce que nous sommes sensibles ` a certaines fr equences de la lumi` ere, que des photons dans cette gamme de fr equence ont et e emis par une source de lumi` ere et nont pas et e retenus par ce corps, et surtout parce que nous avons d ej` a appris ` a distinguer par notre culture, cest-` a-dire par des interactions ant erieures avec dautres membres de notre esp` ece, certaines gammes de couleurs en di erenciant le rouge du rose et du violet par exemple (Bonnet et al. 1990). Les th eories logiques actuelles, comme la plupart des syst` emes de reconnaissance de formes avant les ann ees 90, reposent encore sur une conception de perception passive du monde. La s emantique situationnelle par exemple ne fait que reprendre les id ees aristot eliciennes en leur donnant une expression plus moderne: le monde est constitu e dobjets et de situations d ej` a donn ees, et lagent ne fait quenregistrer et classer les informations provenant de son environnement. Le sens des phrases quil prononce se r ef` erent ainsi directement (na vement) aux objets du monde, et non ` a des constructions mentales elabor ees ind ependamment (Barwise et Perry 1983). Au contraire, les r esultats de la neurophysiologie de la perception montrent que la perception est le r esultat dune conceptualisation ant erieure. Par exemple, dans les syst` emes visuels p eriph eriques, le nombre de voies nerveuses allant du cortex vers
` 5.3. LE SYSTEME REPRESENTATIONNEL
233
le corps genouill e lat eral (r egion du thalamus interm ediaire entre le nerf optique et le cortex visuel) est bien sup erieur ` a celles qui proviennent directement de lil (Maturana et Varela 1987). Lindividu voit plus ce quil re coit du cerveau que ce quil re coit de lil. Dautres m ecanismes, tels que celui de la perception du mouvement chez les animaux et lhomme, utilisent le principe dit de r ea erence qui lie le mouvement de lindividu et celui de la perception. Par r einjection de ce qui devrait etre vu lors dun de ses d eplacements, lindividu analyse comme une image xe un changement visuel provenant dun de ses mouvements, et comme une image mobile le mouvement dun objet. Dautres ph enom` enes du m eme ordre montrent que la perception r esulte dun processus actif, qui prend en compte les perceptions et conceptualisations pr ec edentes, et qui implique une exploration active de lenvironnement et de ce que lagent cherche ` a percevoir. La gure 5.1 montre les deux types de syst` eme. Dans les syst` emes de perception passive, les signaux suivent une approche purement ascendante. Les signaux el ementaires sont pr etrait es puis segment es pour obtenir des traits el ementaires conduisant ` a la reconnaissance dobjets, de sc` enes, de mots ou de phrases. Dans les syst` emes actifs au contraire, le syst` eme perceptif re coit ` a la fois les informations provenant des capteurs et les attentes et buts provenant du syst` eme cognitif. Il peut aussi contr oler ses capteurs de mani` ere ` a maintenir une repr esentation coh erente de son environnement. Lun des premiers syst` emes de perception combinant la g en eration dhypoth` eses et leur validation peut etre trouv e dans les travaux sur la reconnaissance de la parole par tableaux noirs (Erman et al. 1980). On pourra avoir une vision g en erale des probl` emes de vision pour lordinateur et la machine dans (Marr 1982; Levine 1985). On trouvera dans (Ghallab et al. 1992) les principaux probl` emes (et solutions) que pose la perception multi-sensorielle active, et dans (Lesser et Corkill 1983) et (Demazeau et al. 1994) lutilisation de syst` emes multi-agents pour la conception de syst` emes de perception active. Bien que nous soyons totalement en accord avec les th eories qui supposent que la perception est elle-m eme une construction active du sujet, nous nous en tiendrons ` a une conception passive lorsquil sagira dint egrer le syst` eme perceptif dans lensemble des composants dun agent cognitif pour des raisons ` a la fois de simplicit e et aussi parce que la plupart des syst` emes multi-agents supposent que leurs agents sont munis de syst` emes perceptifs passifs.
5.3
Le syst` eme repr esentationnel
Nous avons vu que les agents cognitifs disposaient de connaissances explicites quils pouvaient utiliser pour appr ehender le monde et les autres agents. Mais que signient repr esentations, croyances et connaissances et comment les expliciter?
5.3.1
Quest-ce que la connaissance?
La notion de connaissance, telle quelle sest d evelopp ee en intelligence articielle, peut- etre d enie comme lensemble des informations (savoir, savoir-faire, exp erience,
234
Capteurs

Systme perceptif passif (a) Description d'objets
Traits lmentaires Pr-traitements Analyse d'objets/scnes Signaux
Percepts
(b) Systme perceptif actif Commandes des capteurs Traits lmentaires Pr-traitements
Description d'objets
Signaux Capteurs
Percepts Analyse d'objets/scnes Attentes/ buts Hypothses/ Focalisations
Figure 5.1: Le syst` eme perceptif peut- etre soit passif (a) et, dans ce cas, lanalyse des informations seectue de mani` ere purement ascendante, soit actif (b) en combinant lapproche ascendante ` a une d emarche descendante tendant ` a la g en eration dhypoth` eses et ` a la focalisation des perceptions.
souvenirs, concepts, faits...) n ecessaires ` a un etre humain (ou ` a une machine) organis ees de mani` ere ` a ce quil puisse accomplir une t ache consid er ee comme complexe. Par exemple, diagnostiquer une maladie, r esoudre un probl` eme de math ematique, r eparer une machine, traiter un cas juridique, g erer un ensemble de comptes nanciers, faire une campagne de marketing ou traduire un texte sont des activit es, qui, lorsquelles sont r ealis ees par des etres humains, r eclament une grande quantit e de comp etences et dinformations organis ees dans un but pr ecis. De ce fait, au terme de connaissance est associ e une dimension pragmatique, cest-` a-dire de savoir sp ecialiste qui sapplique dans un domaine particulier pour eectuer une t ache pr ecise. Cependant, la connaissance dun agent ne se limite pas a celle des t ` aches quil accomplit: il faut aussi inclure les informations concernant le monde qui lentoure, cest-` a-dire son environnement et les autres agents avec lesquels il communique et interagit. La notion de connaissance pose un des probl` emes centraux en philosophie et en psychologie cognitive, qui peut sexprimer ainsi: Comment les concepts peuvent-ils etre organis es de mani` ere ` a permettre ` a un etre humain ou ` a un agent daccomplir des actes ou darmer des propositions ad equates? On distingue g en eralement entre savoir quoi et savoir comment. Le premier sint eresse ` a la compr ehension des etres que lon per coit et ` a celle des ph enom` enes que lon rencontre en permanence mais pour lesquels il est parfois dicile de donner une d enition pr ecise. Le second au contraire ne sint eresse pas ` a la d enition des objets, mais ` a lanalyse des relations qui existent entre les ph enom` enes, pour pouvoir mod eliser les lois de lunivers an den pr edire leur evolution. Par exemple, essayer de d enir ce quest le mouvement est un probl` eme philosophique complexe, qui
235
navait et e r esolu que partiellement par les philosophes grecs et m edi evaux5 . Il fallut attendre Galil ee dabord, puis Newton pour se rendre compte quen changeant de probl ematique et en ne cherchant plus ` a d enir ce quest le mouvement, il etait possible de comprendre comment evoluaient les corps en mouvement ` a partir de relations entre des grandeurs mesurables telles que la distance, la vitesse et le temps. Le savoir scientique, comme le savoir pragmatique, est un savoir du comment, limportant etant de pouvoir agir dans le monde, en anticipant les cons equences des etats actuels et des actions que nous pouvons entreprendre. Les grandes questions g en erales, telles que Quest-ce que la vie?, si elles sav` erent particuli` erement essentielles pour nous situer et pouvoir r epondre ` a nos interrogations existentielles, nont presque aucun int er et pour le savoir scientique. Celui-ci ne sint eresse pas a ces questions. Il lui sut, ` ` a partir de d enitions initiales relativement vagues, d elaborer un corpus de m ethodes lui permettant de comprendre les ph enom` enes qui ont lieu lors de la vie des etres vivants, et etre ainsi ` a m eme dexpliquer ce qui se passe. Il en est de m eme pour la connaissance. Il sav` ere pr ef erable, plut ot que dessayer de d enir pr ecis ement ce quest la connaissance, de proposer des concepts et des mod` eles permettant de comprendre les ph enom` enes d elaboration et dutilisation de ce qui permet ` a un agent daccomplir des t aches complexes. Conceptualisation et raisonnement Le probl` eme de la connaissance est etroitement reli e` a ceux de la conceptualisation, du raisonnement: quelles sont les cat egories conceptuelles a priori de la pens ee et du raisonnement dun agent, et quels sont, ` a partir de ces cat egories fondamentales, les di erents concepts construits ainsi que les m ecanismes pratiques quun agent emploie de fa con ` a pouvoir sorienter dans son environnement, surmonter des dicult es, etablir des jugements et r esoudre des probl` emes, prendre des d ecisions et parvenir a ses ns? ` On ne peut en eet parler de connaissance sans parler du pouvoir inf erentiel qui y est attach e: la connaissance nexiste pas sans les probl` emes et les insatisfactions qui lui procurent ses motivations, sans les actions qui la mettent en pratique, sans la raison qui lui donne sa dynamique interne. Inversement, si toute conceptualisation re` ete n ecessairement une intention dutilisation de cette connaissance6 , aucun raisonnement ne peut seectuer sans une base conceptuelle solide. De ce fait, raisonnement et conceptualisation sont les deux facettes de la connaissance et de son utilisation. Mais existe-t-il une bonne conceptualisation? lIntelligence Articielle sest souvent pos e ce probl` eme. La recherche de la base de connaissances universelle qui contienne tout le savoir de lhumanit e est lun des mythes fondateurs de lIA, o` u
5 On peut dailleurs toujours se demander ce quest eectivement le mouvement. La position aristot elicienne assimilant le mouvement ` a un passage de la puissance, ou potentialit e, ` a lacte, ou r ealisation de cette potentialit e, est toujours actuelle avec les notions de champs de potentiel et dattracteurs de la physique moderne (Thom 1988; Boutot 1993). 6 Sauf peut- etre dans le domaine des math ematiques pures.
236
lon retrouve laspiration toujours renouvel ee des encyclop edistes, le projet de pouvoir r eduire toutes les connaissances en un syst` eme conceptuel ni (Lenat et Guha 1990). Malheureusement, il nexiste pas de d enition simple et unique dun concept: tout repose sur lutilisation que lon d esire en faire, sur laspect qui nous int eresse. Par exemple le concept deau, bien quapparaissant pourtant comme lun des plus simple, nest pas si facile ` a d egager. Tout le monde peut parler deau, comprendre un raisonnement qui utilise ce concept, mais il est cependant bien dicile den donner une vision uni ee et claire. En eet parler de leau, cest mettre en pr esence un grand nombre de concepts: 1. Pour celui qui a soif, leau est un liquide que lon boit et qui permet d etancher sa soif. 2. Pour le plombier, leau est quelque chose qui coule le long des tuyaux, et qui peut s echapper des canalisations (les fuites). 3. Pour le chimiste, cest la mol ecule H2 O. 4. Pour le peintre, cest un solvant et un diluant. 5. Pour celui qui lave quelque chose, leau enl` eve la salet e et rince la lessive. Etc. Chacune de ces d enitions renvoie ` a un savoir-faire, ` a une utilisation du concept dans un contexte appropri e, qui lui m eme suppose toute une conceptualisation. Par exemple, leau, en tant quentit e chimique, renvoie ` a la notion de mol ecule, ` a leurs capacit es dagr egation et de s eparation, leur composition, les eets globaux qui peuvent en etre d eduits, etc. Ces renvois sont sans n, toute la connaissance etant li ee en une totalit e complexe constitu ee dune agr egation de points de vue particuliers. La connaissance nest cependant pas une aaire individuelle. Le sp ecialiste isol e nexiste pas. Bien que les perspectives des sciences cognitives de la psychologie cognitive et de la philosophie en particulier aient surtout mis laccent sur la connaissance que pouvait se former un individu pour comprendre le monde qui lentoure et r esoudre les probl` emes qui lenvironnent, la connaissance dun individu est largement le fruit dinteractions avec dautres etres humains. Comme le montre lexemple des enfants-loups, si un enfant est isol e depuis son plus jeune age et quil est priv e de ses interactions avec ses semblables, il ne pourra jamais disposer des facult es de son esp` ece et devenir un individu accompli. Le manque dinteraction, et donc des connaissances, des communications et de la possibilit e dimiter le comportement des autres dans son enfance prive lhumain de son intelligence. Mais m eme sans aller jusqu` a cette extr emit e, il faut bien reconna tre quun sp ecialiste nest jamais seul. Il est entour e dabord de tous ceux qui sont du m eme domaine que lui: lapprentissage dune sp ecialit e seectue au cours dun long d eveloppement pendant lequel il interagit avec ses ma tres, mais aussi avec ceux qui deviendront ses compagnons, ses coll` egues. Il est au centre ensuite dun ensemble dinteractions avec dautres sp ecialistes de domaines voisins. Le ma con travaille avec le plombier et le menuisier, le sp ecialiste des fuselages davion uvre avec le motoriste et la erodynamicien. La
237
connaissance s elabore dans le travail en commun, dans la confrontation des points de vues et des savoir-faire. De nombreux philosophes et sociologues des sciences et de lactivit e scientique, tels que Kuhn (Kuhn 1962), Latour (Latour 1989) ou Lestel (Lestel 1986), ont ainsi montr e limportance des relations sociales pour la stabilisation de concepts scientiques ainsi que lensemble des strat egies utilis ees par les chercheurs pour tirer parti du moindre alli e lors de la production de pr etendus faits scientiques. La connaissance dans linteraction Comment, en eet, imaginer un etre humain sans lensemble des communications quil entretient tout au long de sa vie? Comment penser lintelligence dun individu sans penser lintelligence de la famille, de la tribu ou de la soci et e dans laquelle cet individu sest d evelopp e? Le probl` eme de la connaissance ne se pose pas seulement dans les termes dune relation entre un agent et le monde, mais aussi dans les interactions qui ont lieu entre les agents, cest-` a-dire dans la d enition des cat egories conceptuelles el ementaires et des concepts communs dont les agents disposent pour communiquer et interagir. Les travaux de psychologie sociale cognitive montrent limportance des consid erations sociales lors de l elaboration de cat egories conceptuelles. Le fait, pour un individu, de se trouver en harmonie avec ses consid erations ant erieures et avec celles du groupe entra ne des modications de lunivers cognitif et en particulier des modications dans ses cat egorisations et ses jugements. De ce fait, la connaissance est avant tout le fruit dinteractions entre agents cognitifs qui, par un processus de confrontation, dobjections, de preuves et de r efutations (Lakatos 1976), elaborent des concepts, construisent des th eories et formulent des lois. Ce processus d edication par interactions a lieu jusque dans des domaines que lon pourrait croire peu enclins aux controverses et aux pol emiques comme les math ematiques. Il est dautant plus ` a luvre dans des sciences portants sur des domaines ` a la fois plus complexes et plus appliqu es comme peuvent l etre les sciences humaines, l economie, la psychologie et les sciences cognitives en g en eral. La k en etique peut donc faire sienne le slogan suivant: Il ny a pas de connaissance sans interaction o` u lon con coit par interaction aussi bien les confrontations avec le monde que les communications avec les autres agents, la connaissance etant alors d enie comme la r esultante des savoirs et des savoir-faire sp eciques que poss` edent les agents, ces savoirs et savoir-faire etant les fruits des confrontations de lindividu avec le monde et des interactions que lindividu peut entretenir avec dautres individus. Ces interactions sont non seulement in evitables mais aussi n ecessaires: un sp ecialiste, bien que disposant dun savoir approfondi dans un domaine sp ecique, ne peut tout conna tre: ses connaissances sont limit ees dune part par la dicult e mat erielle dappr ehender des savoirs sp ecialis es recouvrant plusieurs domaines, mais aussi par le fait que lensemble de ces connaissances ne forme pas n ecessairement un tout homog` ene et coh erent.
238
Carl Hewitt a ainsi d ecrit un type dorganisation, quil appelle Syst` emes Ouverts dInformation (Open Information Systems) (Hewitt 1985), dans lequel la connaissance nest pas la somme des connaissances de tous les agents, mais la r esultante de linteraction de plusieurs micro-th eories, cest-` a-dire de savoirs et savoir-faire associ es ` a des agents. Chaque micro-th eorie, bien que coh erente en elle-m eme, peut eventuellement entrer en conit, voire m eme etre en contradiction totale avec dautres micro-th eories issues de la m eme organisation. Lors daction conjointes, les agents porteurs de ces micro-th eories doivent alors n egocier pour d eterminer quelle est la meilleure action commune ` a entreprendre. Par exemple, dans une entreprise, le responsable du marketing pourra poss eder une expertise de la forme suivante: R1: augmenter la publicit e fera augmenter les ventes et donc apportera des b en efices ` a lentreprise. qui viendra en conit avec celle du responsable de la gestion: R2: pour augmenter les b en efices de lentreprise, il faut diminuer les d epenses. En eet, lapplication de la r` egle R2 condamne ` a lavance les frais suppl ementaires r eclam es par le marketing. Ces deux r` egles, issues de points de vue di erents, sont lexpression de deux conceptions divergentes, lune centr ee sur le march e, la seconde sur la gestion interne de lentreprise. Lorsquune d ecision doit etre prise, ces deux micro-th eories viennent ` a sopposer, et la d ecision proviendra dune r esolution de ce conit soit en choisissant d elib er ement pour lune ou lautre, soit en tentant une synth` ese locale qui pourrait par exemple sexprimer sous la forme: R3: si le march e est porteur et les co^ uts suppl ementaires dus ` a la publicit e peuvent ^ etre amortis par les ventes, alors on peut lancer une campagne de publicit e. Dans le m eme ordre de dicult e, il est int eressant de noter que cette notion de micro-th eorie, dont la combinaison ne conduit pas ` a une th eorie coh erente, a et e adopt ee dans le cadre du projet CYC pour la repr esentation dune grande masse de connaissances communes correspondant ` a peu pr` es ` a celles dun enfant de 6-10 ans. A lorigine du projet, les connaissances etaient consid er ees comme globales (Lenat et Guha 1990). Il sagissait alors de fusionner des th eories apparemment inconsistantes et, surtout, dont leet etait local. Devant les dicult es ` a rendre coh erentes de telles th eories, Lenat et Guha reprirent ` a leur compte les id ees de micro-th eories tir ees du travail de McCarthy (McCarthy 1980) et de Hewitt. Une micro-th eorie est alors une entit e particuli` ere dont la port ee est locale et lapplication relative ` a un contexte. Par exemple, la connaissance de physique na ve correspondant au fait que quelque chose qui nest pas support e tombe est repr esent ee ainsi: Th eorie: x, support e(x) tombe(x)
239
Evidemment, cette th eorie est locale: elle ne sapplique pas aux montgol` eres ni aux objets interstellaires et ne concerne que les objets que lon rencontre dans notre vie quotidienne. Il sagit donc dune micro-th eorie car sa port ee est limit ee, mais elle sav` ere susante pour le raisonnement commun dans la plupart des situations que nous rencontrons tous les jours. Toutes ces notions de micro-th eories sint` egrent tr` es bien dans une perspective multi-agent: de par leur caract` ere essentiellement limit e et relatif ` a un contexte, chaque micro-th eorie est repr esentative de la connaissance dun agent. Ou plus exactement, toute connaissance associ ee ` a un agent poss` ede la valeur et limportance dune micro-th eorie. Dans un syst` eme multi-agent aucun agent ne poss` ede une connaissance totale, ni donc un v erit e globale sur le monde. Tout savoir est par cons equent local et toute v erit e relative. La connaissance ne peut pas non plus se r eduire ` a un savoir. M eme si lintelligence articielle sest longtemps faite le champion de la connaissance d eclarative, du savoir d eni en soi ind ependamment de son usage, elle a depuis r ealis e, dans le cadre de lintelligence articielle distribu ee, que lon ne pouvait pas comprendre la connaissance v ecue, cest-` a-dire le sens, sans faire r ef erence au comportement dun agent situ e dans un environnement et en relation avec dautres agents. De ce fait, lattention sest port ee plus sur le savoir-faire, ce que lon appelle aussi la comp etence et ladresse dun agent, que sur les connaissances livresques dont il pourrait etre porteur. En eet, pour r eparer une conduite deau, le savoir th eorique portant sur la m ecanique des uides est de peu de secours. En revanche, avoir d ej` a eectu e de telles r eparations ou avoir vu quelquun ` a luvre dans une telle situation peut sav erer utile. En dautres termes, ce que lon demande ` a un sp ecialiste porte plus sur lensemble des exp eriences quil a pu accumuler dans des circonstances semblables que sur l etendue de son savoir eectif. Comme le signale Dreyfus (Dreyfus 1992), la tradition rationaliste suppose que comprendre un domaine et savoir agir avec comp etence dans ce domaine revient ` a poss eder une th eorie explicite sur celui-ci. Il montre que les experts, cest-` a-dire les personnes les plus comp etentes, sont celles qui ont le moins de savoir explicite, mais qui font le plus appel ` a des exp eriences compil ees sous la forme de capacit e` a reconna tre une situation caract eristique. Ainsi, plus une connaissance est consid er ee de haut niveau, plus elle est en fait sp ecique et int egr ee aux actions de lindividu qui ne se rend dailleurs plus compte quil en est le porteur, cette connaissance lui etant devenue totalement evidente. Dans ces conditions, quest-ce que la connaissance? Nous avons dans un premier temps distinguer la connaissance th eorique et la connaissance pratique, la premi` ere reposant sur un corpus explicite de r` egles, de mod` eles formels et de th eories, la seconde d ependant de la somme des situations semblables et des actions accomplies. Cependant, il est manifeste que dans les domaines techniques un tant soit peu compliqu es, cest-` a-dire ceux pour lesquels les mod` eles na fs comme celui de la chute des corps que nous avons vu pr ec edemment ne sont plus daucun support, il est n ecessaire de faire appel ` a des mod` eles th eoriques plus pouss es.
240
5.3.2
Repr esenter les connaissances et les croyances
Parler de connaissances pose le probl` eme epineux du mode de repr esentation de cette connaissance. Existe-t-il un niveau de repr esentation particulier ind ependant de toute repr esentation physique, ou bien doit-on prendre en compte le substrat mat eriel utilis e pour ces repr esentations? Pour le point de vue de lIA classique, la connaissance peut se repr esenter sous la forme dun ensemble de symboles exprimant des unit es de connaissance. Cette approche, qui repr esente ce que lon appelle le paradigme symbolico-cognitiviste, est d enie par les trois propositions suivantes (Andler 1992): 1. Les repr esentations sont ind ependantes du substrat physique sous-jacent. 2. Les etats mentaux sont repr esentationnels ou dou es dintentionnalit e (au sens philosophique), cest-` a-dire quils renvoient ` a quelque chose dext erieur aux agents. 3. Ces repr esentations sont constitu ees de symboles assembl es en phrases ou en structures informatiques quelconques et raisonner consiste ` a manipuler ces structures pour en tirer dautres structures. A cette ecole classique, il faut opposer le point de vue connexionniste qui suppose que la connaissance se trouve int egralement r epartie dans un r eseau dautomates cellulaires sous la forme de valeurs num eriques attach ees aux connexions. Raisonner consiste ` a propager des valeurs num eriques dans ce r eseau, cest-` a-dire a ` modier les connexions etablies entre les di erents el ements de ce r eseau. Nous avons vu au chapitre 3 que ces automates sont utilis es comme des neurones formels, cesta-dire comme de petites unit ` es qui se bornent ` a propager des valeurs num eriques. Lint er et de cette approche r eside essentiellement dans la r ealisation de syst` emes r eactifs capables dapprendre et davoir des comportements adaptatifs en reliant directement les perceptions aux actions, sans faire intervenir explicitement de cognitons. Les syst` emes qui en d ecoulent sont parfois capables de performances relativement evolu ees (analyse grammaticale, r esolution de probl` emes simples) mais leur domaine de pr edilection est la perception (reconnaissance dobjets, de visages, etc.) et larticulation entre perception et action (prise dobjets, evolution de petits robots mobiles, etc.). Les pr esuppos es sont tr` es di erents de ceux d evelopp es par l ecole symbolico-cognitiviste, puisquils reposent sur une conception subsymbolique (Smolensky 1992), lobjectif etant de repr esenter (ou de simuler) ce qui se passe dans le syst` eme nerveux dune cr eature vivante en utilisant les forces dassociation dautomates connect es par des liaisons pond er ees. Bien que peu d evelopp ee jusqu` a pr esent, il existe une troisi` eme voie, que nous pourrions appeler lhypoth` ese k en etique ou interactionniste, qui postule que la connaissance dun individu peut etre consid er ee comme un syst` eme multi-agent ` a part enti` ere, les concepts, notions et repr esentations etant alors des agents de nature particuli` ere qui vivent ` a lint erieur des agents. Le raisonnement dun agent peut alors etre vu comme la r esultante des interactions de ces agents no etiques (Morin 1991) ` a la mani` ere dont Minsky le sugg` ere dans sa Soci et e de lesprit (Minsky 1988).
241
Cette approche est aussi d enie par Dennett (Dennett 1991), qui tente d elaborer une th eorie de la conscience en prenant comme point de d epart lid ee que le syst` eme cognitif dun etre humain est fondamentalement constitu e dentit es ind ependantes qui entrent en comp etition et coop erent7 pour donner une signication au monde environnant. Comme dans le cas de l ecole symbolico-cognitiviste, les el ements cognitifs sont ind ependants du substrat physique, mais comme dans l ecole connexioniste, on ne suppose pas quil existe un sens associ e` a un ensemble de symboles, mais que ce dernier emerge des interactions entre le milieu ext erieur et int erieur de lagent, ce dernier etant lui-m eme compos e dentit es autonomes en interactions (Varela et al. 1993). Dans cet ouvrage, les agents cognitifs seront suppos es etre r ealis es ` a partir de mod` eles cognitivo-symboliques, car ce sont les plus d evelopp es en intelligence articielle distribu ee pour d ecrire des agents disposant d etats mentaux. M eme sil semble que la deuxi` eme ecole et surtout la troisi` eme pourraient apporter des r esultats int eressants et des perspectives nouvelles quant ` a la compr ehension de l elaboration de la connaissance dans les syst` emes multi-agents, ces mod` eles demeurent essentiellement appliqu es ` a des agents r eactifs pour lesquels le probl` eme des etats mentaux est r eduit ` a sa plus simple expression: la s election dactions pertinentes par rapport aux perceptions locales des agents. Lhypoth` ese symbolico-cognitiviste Lhypoth` ese symbolico-cognitiviste consid` ere donc que les repr esentations accessibles a un individu sexpriment sous la forme de symboles, lesquels se r ` ef` erent directement 8 a des entit ` es du monde dans lequel est plong e cet individu . Ces symboles sont articul es ` a laide dun langage interne, une sorte de mentalais, d eni par une grammaire formelle et par les op erations quil est possible de leur appliquer. La syntaxe de ces langages formels (g en eralement d eriv es de la logique des pr edicats du premier ordre ` a laquelle on ajoute des op erateurs modaux) d ecrit lensemble des r` egles grammaticales par lesquelles les unit es peuvent sagr eger pour former des assemblage symboliques en combinant des expressions ou des structures (graphes). Raisonner consiste alors ` a manipuler ces assemblages de symboles pour former dautres assemblages lors dun processus dinf erence. Les op erations permettant de d enir de telles inf erences doivent etre valides: elles doivent respecter des contraintes s emantiques et faire en sorte que les inf erences produites engendrent bien elles-m emes des assemblages valides, cest-` a-dire en correspondance avec leurs interpr etations s emantiques. Ce mode de raisonnement, qui est ` a la base de la conception classique de la repr esentation des connaissances, est fond e sur les cinq conditions
7 Le terme de coop eration vient de nous. Bien que Dennett ne parle pas beaucoup des m ecanismes sous-jacents permettant ` a ces entit es dinteragir, il est possible de lire son ouvrage avec un il de k en eticien et de le consid erer comme un alli e dans lid ee que la connaissance peut etre consid er ee comme un syst` eme multi-agent ` a part enti` ere. 8 On peut supposer quil existe des entit es interm ediaires entre les symboles et les entit es du monde, comme dans les s emantiques fond ees sur la notion de mondes possibles (cf. section 5.3.3) ou les logiques intensionnelles comme celle de Montague (Montague 1974), mais, ` a une indirection pr` es, le sch ema de pens ee est le m eme.
242 suivantes:
1. Lexistence dun ensemble de symboles. 2. Lexistence de r` egles grammaticales de composition de symboles pour former des propositions ou des structures symboliques. 3. Lexistence dun monde de r ef erence compos e dentit es bien s epar ees auxquelles les symboles peuvent se r ef erer. 4. Lexistence dune fonction dinterpr etation qui donne un sens au symbole, cest-` a-dire qui attribue ` a chaque symbole un r ef erent (ou une classe de r ef erents). 5. Lexistence dun syst` eme dinf erence permettant de produire de nouveaux assemblages (propositions ou structures). Les symboles Mais quest-ce quun symbole? Pour le courant symbolico-cognitiviste, un symbole9 est un el ement particulier qui renvoie ` a quelque chose dautre, ce quil repr esente justement et que lon appelle son r ef erent. Par exemple, les mots sont des symboles qui renvoient ` a des contenus. Le mot Jean renvoie au vrai Jean10 que je connais, le symbole 2 renvoie au deuxi` eme el ement des nombres naturels, cest-` a-dire au successeur du successeur de z ero, etc. Les relations n-aires de la forme p(a1,..,an) renvoient ` a des contenus repr esent es sous la forme densembles de n-uplets. Par exemple, dire que Jean est une personne, ce que lon ecrirait formellement en logique personne(Jean) revient ` a dire que Jean fait partie de lensemble personne compos e de la mani` ere suivante: personne = {Jean, Marie, Paul, Pierre, Marc,...} De m eme dire que Jean aime Marie, ce qui s ecrit aime(Jean,Marie) consiste a armer que le couple < Jean, M arie > appartient ` ` a lensemble quiAimeQui compos e des couples < a, b > dans lesquels lindividu a aime lindividu b: quiAimeQui = {<Jean,Marie>, <Marie, Pierre>,... } Dans lhypoth` ese symbolico-cognitiviste, lintellect dun agent cognitif est compos e de ces symboles. Supposons que Jean ait certaines connaissances sur les chats. Il conna t par exemple Minou, Tom et Sylvestre, et il sait (ou il croit, nous reviendrons sur cette distinction plus bas) que les chats qui ronronnent sont heureux. Cela suppose donc que sa base de connaissance est constitu ee des expressions symboliques suivantes:
9 On utilisera ici le mot symbole dans son acception cognitiviste, cest-` a-dire comme el ement signiant renvoyant ` a un contenu, ce qui le rend synonyme de signe en linguistique. Il ne faut pas le confondre avec la notion de symbole comme m ecanisme et support daccession ` a des signications spirituelles et subconscientes. 10 Il est important de pouvoir distinguer le symbole de son r ef erent. Nous utiliserons des formes typographiques di erentes pour ces deux notions: les symboles (ainsi que les entit es informatiques) seront inscrit en caract` eres courier alors que les r ef erents seront ecrits en italique.
` 5.3. LE SYSTEME REPRESENTATIONNEL chat(Minou), chat(Tom), chat(Sylvestre) x.[chat(x) (ronronne(x) heureux(x))] S emantique et r ef erence
243
Tant que lon na pas d ecrit ce que ces symboles d esignent, il ne sagit que de simples agr egats syntaxiquement corrects. Pour les faire acc eder au rang de symboles, il faut leur adjoindre une s emantique, cest-` a-dire la capacit e dinterpr eter ces expressions par rapport ` a ce que lon appelle un mod` ele. Par exemple, il est impossible de dire si lexpression x y P(x,y) est vraie ou fausse tant que lon ne sait pas ` a quoi se rattachent les symboles , , P, x et y et o` u ces symboles prennent leur valeur. En revanche, si lon dit que le domaine de r ef erence des variables est lensemble des entiers naturels, que P signie inf erieur ou egal, alors il est possible de se d eclarer sur la v erit e ou la fausset e de la formule pr ec edente en consid erant quen eet on peut associer ` a tout entier x au moins un autre entier dont il est inf erieur ou egal. Cette association entre les symboles et les choses dun domaine D est d enie par une fonction dinterpr etation. Dans notre cas, la fonction dinterpr etation I pourrait etre la suivante: I (Minou) = M inou I (Tom) = T om I (Sylvestre) = Sylvestre I (ronronne) = M inou I (heureux) = M inou, Sylvestre, Jean I (chat) = M inou, T om, Sylvestre I (personne) = Jean, M arie, P aul, P ierre, M arc, ... I (aime) = < Jean, M arie >, < M arie, P ierre >, ... I (Jean) = Jean Savoir si une proposition est vraie pour une interpr etation I, ce que lon note |=I consiste ` a v erier, pour les formules atomiques, que les constantes apparaissant dans un pr edicat (ou la liste des constantes) appartiennent bien au domaine dinterpr etation du pr edicat: |=I P(a) ssi I (a) I (P) |=I R(a1, .., an) ssi I (<a1,...,an>) I (R) Il est possible de combiner les formules ` a laide dop erateurs tels que (non), (et), (ou), (implique), etc. et, dans ce cas, on v erie la satisabilit e dune formule en analysant ses di erents composants ` a partir des r` egles suivantes: |=I |=I |=I |=I ssi |=I ssi |=I et |=I ssi |=I ou |=I ssi |=I ou |=I
244
CHAPTER 5. LAGENT DANS TOUS SES ETATS |=I x. ssi Ix/d () pour tout d D |=I x. ssi il existe Ix/d () pour au moins un d D
o` u Ix/d () repr esente linterpr etation de la formule dans laquelle on a remplac e la variable x par l el ement d du domaine dinterpr etation D.
Ronronne(Minou)
RRRR
Figure 5.2: En logique, les symboles se r ef` erent ` a des objets et ` a des situations du monde. Par exemple, lexpression chat(x) heureux(x) est vraie si eectivement linterpr etation de x appartient ` a la fois ` a lensemble des chats et ` a celui des heureux. De ce fait, la formule chat(Minou) heureux(Minou) est vraie puisque M inou appartient ` a la fois ` a chat et ` a heureux. De m eme la formule, x.[chat(x) ronronne(x) heureux(x)]) est vraie puisque soit heureux(x) est vrai (x heureux), soit chat(x) ronronne(x) est faux, cest-` a-dire que x nappartient pas ` a lintersection de chat et ronronne. La formalisation de la logique a permis davoir des propri et es g en erales sur des syst` emes logiques ind ependamment des interpr etations que lon peut avoir sur les symboles. En particulier, il est possible de montrer que, quelle que soit linterpr etation I adopt ee, la formule |= x.P(x) P(x) est vraie, ce que lon note en supprimant toute mention ` a une interpr etation dans le signe |=. On dit alors quune telle formule est valide. Syst` eme formel et inf erence Le raisonnement logique sappuie sur la notion dinf erence et de syst` eme formel. La notion dinf erence est tr` es ancienne (Aristote est g en eralement consid er e comme linventeur de la logique) puisquelle a toujours et e consid er ee comme une r eexion g en erale sur le raisonnement. Avec lapparition des logiques modernes issues des travaux initiaux de Boole, Frege et Russell, le processus inf erentiel est devenu
245
purement m ecanique et formel, ` a partir de la notion de syst` eme formel qui d etermine les lois de traitement syntaxique permettant dassembler et de produire de mani` ere coh erente des expressions ` a partir dexpressions plus el ementaires et consid er ees comme vraies. Un syst` eme formel est compos e de: 1. Un ensemble de symboles dont le sens est purement arbitraire et qui nont par eux-m emes a priori aucun lien avec ce quils repr esentent. 2. Un ensemble de r` egles grammaticales permettant de construire des formules bien form ees par assemblages de formules plus el ementaires. 3. Un ensemble de formules de d epart, appel ees axiomes. 4. Un m ecanisme d eductif permettant de produire de nouvelles formules, appel ees th eor` emes, ` a partir des axiomes de d epart et des th eor` emes d ej` a produits. Le processus d eductif suit un m ecanisme it eratif, cest-` a-dire que les conclusions sont obtenues apr` es un certain nombre de pas de d eduction. Chaque pas de ce processus doit suivre une r` egle dinf erence qui stipule la mani` ere de produire de nouvelles formules. Une r` egle dinf erence s ecrit: 1 , ..., n n + 1
ce qui signie qu` a partir des formules 1 , ..., n , il est possible de produire la formule n + 1. La plus c el` ebre et la plus utilis ee des r` egles dinf erence sappelle le modus ponens et s ecrit ainsi: , Elle stipule que, sil existe une formule de la forme et une de la forme , alors il est possible den inf erer la formule . Par exemple, de il pleut et de il pleut la chauss ee est mouill ee il est possible de d eduire la chauss ee est mouill ee en une seule etape. Lun des syst` emes logiques les plus connus en IA, que nous avons utilis e pour pr esenter la notion de syst` eme logique, est celui de la logique des pr edicats du premier ordre. Con cue initialement pour lanalyse des fondements des math ematiques, cette logique permet de repr esenter de mani` ere tr` es el egante des connaissances certaines, universelles et intemporelles, cest-` a-dire qui expriment des v erit es ind ependantes de toute situation r eelle d enonciation. Comme nous lavons vu, ce type de connaissance soppose ` a la notion de micro-th eorie consid er ee pr ec edemment. Du fait de son caract` ere trop simpliste et de son incapacit e ` a traiter de notions aussi communes que le temps, les croyances, les actions, les doutes, etc., de nombreux autres syst` emes logiques ont et e elabor es. Cependant, elle reste tr` es utilis ee, en particulier par le fait quelle se trouve souvent ` a la base des autres logiques consid er ees ainsi comme des extensions de la logique des pr edicats. En particulier, la logique modale des croyances qui est pr esent ee plus bas sappuie int egralement sur la logique des pr edicats du premier ordre. G en eralement, les syst` emes formels elabor es ` a partir de cette conception sont compositionnels et r educteurs. Ces deux termes, bien que g en eralement utilis es
246
ensembles, ne sont pas equivalents. On dit quune s emantique est compositionnelle si le sens dune expression complexe est fonction du sens de ses constituants. Elle est r eductrice sil existe des primitives s emantiques, cest-` a-dire des symboles dont le sens nest pas d eni par composition du sens de ses constituants mais par un m ecanisme de renvoi direct entre le symbole et la chose r ef erenc ee. Les formalismes logiques, et en particulier la logique des pr edicats du premier ordre et ses extensions modales, sont compositionnels (avec certaines restrictions pour les logiques modales comme nous le verrons plus loin) et r educteurs. Il existe dautres formalismes de repr esentation des connaissances. Lalternative la plus c el` ebre repose sur la notion de r eseau s emantique, de frames ou dobjets, ces trois notions etant relativement imbriqu ees. Un r eseau s emantique est un graphe etiquet e constitu e de nuds qui repr esentent des concepts et darcs qui relient ces concepts entre eux. Ce type de repr esentation des connaissances est tr` es utilis e dans le domaine de la compr ehension du langage naturel o` u des r eseaux s emantiques rendent compte de la structure profonde des phrases. Lun des mod` eles les plus en vigueur actuellement est celui des graphes conceptuels de J. Sowa (Sowa 1984). Dautres langages de repr esentations des connaissances fond es sur la notion dobjets ou de frames sont couramment utilis es dans des applications dintelligence articielle. Un objet est une structure informatique d ecrite par un aspect statique qui qualie son etat et les liens quelle peut entretenir avec dautres objets, et un aspect dynamique constitu e de lensemble des op erations qui lui sont applicables. On pourra se reporter ` a (Ferber 1990) pour une introduction ` a la programmation et a la conception par objets, et ` ` a (Masini et al. 1989) pour une vue g en erale sur les langages ` a objets et les syst` emes de frames.
5.3.3
Logiques des savoirs et des croyances
Croire quelque chose, cest admettre comme v eritable une proposition, un fait, une histoire, sans que lon sache eectivement son degr e de v erit e. Dans la langue quotidienne, on utilise souvent le terme penser que pour exprimer une croyance. Par exemple, si lon dit je pense que le facteur a distribu e le courrier aujourdhui, cela signie que lon a souscrit ` a larmation le facteur a distribu e le courrier aujourdhui sans pour autant en etre absolument s ur. Pour sen assurer, il faut soit pouvoir conrmer ce fait par observation en allant voir la bo te au lettres soit croire les personnes ou les choses qui ont arm e cette proposition. Par exemple, si vous etes en vacances, et quau t el ephone on vous dise le facteur na pas distribu e le courrier aujourdhui, vous navez aucun moyen daller le v erier par vous-m eme et vous devez vous en remettre aux dires de cette personne. Mais il ny a pas que les personnes que lon doit croire dans la vie courante. Les objets inanim es aussi arment des enonc es que lon doit croire et que lon ne peut pas (ou lon ne veut pas) toujours v erier. Par exemple, si la jauge dessence de votre voiture est sur plein, cela ne signie pas eectivement que le r eservoir est rempli dessence. Si la jauge ne fonctionne pas, le r eservoir est peut- etre vide... Cependant, cette croyance peut avoir des cons equences sur vos actions futures. Si vous croyez que le r eservoir est plein, vous pouvez envisager une longue conduite sans reprendre
247
dessence, alors que si vous croyez quil est vide vous chercherez ` a faire le plein le plus rapidement possible. Si vous croyez que la jauge est cass ee, vous utiliserez dautres mani` eres pour evaluer la quantit e dessence qui vous reste, peut- etre en estimant votre consommation ` a partir de croyances sur la distance parcourue, en faisant conance ` a dautres instruments tels que le compteur kilom etrique de votre voiture, ou les distances port ees sur les cartes, etc. Mais vous n echapperez pas aux croyances en certaines propositions et aux conances que vous pouvez avoir quant aux choses. Ces consid erations pr ec edentes nont quun seul but, montrer dune part que tout notre raisonnement repose sur des croyances et dautre part que la v erication de ces croyances ne peut- etre eectu ee que par des m ethodes dinteraction avec dautres entit es (la personne au t el ephone, la jauge dessence) dont la abilit e est elle-m eme luvre dautres croyances. En dautre termes, il nexiste pas de faits en tant que tels: seulement des croyances qui nont pas et e encore r efut ees. Dune mani` ere plus philosophique, tout savoir est une croyance: il sagit toujours dune information rapport ee par quelque chose ou quelquun dautre, et cette information peut- etre sujette ` a erreur. Ce que lon voit nest quune illusion donn ee par nos sens, comme lont bien compris les empiristes Hume et Berkeley: les sens ltrent et traduisent la r ealit e, nous pr esentant les choses au travers dune transformation parfois d eformante. Linformation est, elle aussi, lobjet dune croyance. Ce que lon apprend par les journaux est peut- etre faux (en particulier si le journal est dat e du 1er avril) ou tout simplement d ej` a plus vrai du fait de la p eriodicit e du journal. De m eme, les lois et les r esultats scientiques, images m eme de la certitude doivent etre consid er ees comme des croyances ad equates reposant sur des propositions scientiques, cest-` a-dire r efutables, qui pourront etre remises en question le moment venu (Popper 1963). A la notion de croyance est associ ee celle de r evision: toute information qui fait lobjet dune croyance peut- etre remise en question. Cette capacit e de pouvoir remettre en question un fait, une d eduction, une loi ou un jugement est ` a la base de notre capacit e dadaptation cognitive, cest-` a-dire la facult e que nous avons, etres humains, daccommoder notre syst` eme cognitif ` a un monde en perp etuelle evolution, cette evolution etant le fruit des actions des di erents agents intervenants dans notre univers. Il en est de m eme pour les agents intervenant dans le cadre de lIAD, qui doivent etre capable de remettre en question leurs informations et de r eviser leur jugements. Par exemple, dans le probl` eme de la poursuite (chap. 1), les pr edateurs doivent r eviser leurs croyances concernant la position de la proie et d ecider de laction ` a entreprendre en fonction de cette croyance. Si le temps de r eaction et de propagation des communications nest pas n egligeable, les pr edateurs disposeront parfois dinformations erron ees, la situation de la proie ayant chang e entre-temps. Enn, les croyances ne sont pas universelles: elles sont relatives ` a un individu, un groupe, une soci et e. Ce que croit Jean est di erent de ce que croit Pierre: un pr edateur peut disposer dinformations plus fra ches quun autre ou un agent peut disposer de comp etences plus sp ecialis ees lui permettant de mieux appr ecier la validit e dun enonc e. Et comme nous lavons vu plus haut dans le cadre des connaissances, rien nindique que toutes ces croyances soient coh erentes. De ce fait,
248
la relativit e des croyances aux individus prend une importance majeure dans le cadre de syst` emes multi-agents, car elles mettent en valeur la localisation n ecessaire des informations et la n ecessit e de communiquer pour pouvoir transmettre et confronter des croyances. Formaliser les croyances L etude des croyances en philosophie puis en logique est le fruit dune longue tradition qui remonte aux Grecs, quoique lid ee de pouvoir formaliser et donner une forme calculable aux croyances date du d ebut des ann ees 60, avec luvre fondamentale de Hintikka (Hintikka 1962). Ces ann ees virent un d eveloppement consid erable de th eories formelles concernant les croyances et les savoirs. Mais lav` enement des syst` emes multi-agents et, en particulier, de lessor des syst` emes cognitifs coop eratifs, a entra n e un regain dint er et pour toutes ces th eories en tenant compte des limites impos ees par leur mise en uvre eective dans des environnements informatiques. Le principe g en eral de ces logiques est de d enir un ensemble daxiomes portant sur les croyances, puis ensuite de tenter de leur donner une s emantique en les faisant r ef erer ` a des el ements dune structure d enie math ematiquement. Mais a-t-on besoin dune logique particuli` ere pour les croyances? Pourquoi ne pas utiliser la logique des pr edicats du premier ordre? En eet, une solution pratique serait dutiliser une formule atomique sp ecique telle que croire(A,P) pour indiquer que lagent A croit la proposition P. Cependant, cette formulation se heurte ` a lune des propri et es essentielles de la logique des pr edicats qui est de pouvoir substituer les expressions identiques dans toutes les formules o` u elles apparaissent. Par exemple si Jean croit que lauteur de La L egende des si` ecles est lauteur de Notre-Dame et quil sav` ere que Victor Hugo est bien lauteur de la l egende des si` ecles, ce que lon peut ecrire ainsi: croire(Jean, auteur(auteurDe("L egende des si` ecles"), "Notre-Dame") VictorHugo = auteurDe("L egende des si` ecles") alors il sensuit logiquement que Jean croit que Victor Hugo est bien lauteur de Notre-Dame, ce qui nest peut- etre pas une croyance de Jean. Ainsi, la propri et e de substitution des identiques entra ne des d eductions fausses en ce qui concerne les croyances. Lerreur vient du fait que la base de connaissances de Jean, dans laquelle se trouvent toutes ses croyances, constitue un contexte opaque ` a la r ef erenciation. De ce fait, si lon veut pouvoir traiter la notion de croyance, il est n ecessaire de pouvoir saranchir des limites de la logique des pr edicats du premier ordre et dutiliser une autre logique capable dopacier les contextes de croyances. Ces logiques epist emiques qui traitent des savoirs et des croyances utilisent des formulations plus esot eriques que lemploi dun simple pr edicat croire ou savoir et etendent la logique des pr edicats du premier ordre pour prendre en compte toutes les subtilit es des croyances et des savoirs. Croyances et savoirs ont de nombreux points communs. Traditionnellement, on les distingue en consid erant que les savoir
249
sont des croyances vraies, cest-` a-dire des enonc es qui sont connus de lagent et qui sont en conformit e avec le monde. La notion de savoir peut donc se d enir ainsi: savoir(A, P) = croire(A, P) vrai(P) signie que si un agent sait P, alors P est naturellement vrai, ce que lon peut formuler: savoir(A, P) P Nous traiterons donc ensemble savoirs et croyances et ne distinguerons ces deux types de relation au monde que si cela sav` ere n ecessaire. Les mondes possibles La formulation classique dune logique epist emique repose sur la notion de logique modale et leur analyse s emantique sur le mod` ele des mondes possibles. Ce dernier, initialement d u` a Kripke (Kripke 1991) pour les logiques du possible et du n ecessaire (les logiques ontiques), a et e repris par Hintikka pour la formalisation des savoirs et des croyances. Lid ee intuitive est de consid erer que chaque agent peut envisager un certain nombre de mondes quil imagine envisageables. On dit alors quun agent croit une proposition si elle est vraie dans tous les mondes quil imagine. Par exemple, si Jean croit que le r eservoir dessence de sa voiture est plein, cela signie quil peut envisager plusieurs mondes possibles dans certains Napol eon est mort ` a SainteH el` ene, dans dautres il est mort ` a l le dElbe, dans dautres encore Napol eon est mort aux Tuileries, Jean na pas de croyances sur la mort de Napol eon mais que dans tous ces mondes le r eservoir dessence de sa voiture est plein. Pour exprimer cette id ee, il est n ecessaire davoir un langage de repr esentation des connaissances. De mani` ere classique, nous utiliserons un langage modal, cest-` adire un langage correspondant ` a celui de la logique propositionnelle ou ` a celui de la logique des pr edicats, auquel on ajoutera un op erateur de croyance ou de savoir, ce que lon appelle des modalit es. Par la suite nous noterons croire(A,P) pour indiquer que lagent A croit la proposition P, cest-` a-dire que lop erateur modal croire est appliqu e` a la proposition P et index e par lagent A. Par exemple, la phrase Jean croit que le r eservoir de Titine est plein sexprime ainsi: croire(Jean,plein(r eservoir(Titine))) o` u Titine est la voiture de Jean. En terme de s emantique des mondes possibles, cela signie quil existe un ensemble de mondes, appel e W , tels que, ` a partir du monde W0 consid er e comme le monde r eel, Jean ne voit (ou nimagine) que des mondes dans lesquels le r eservoir de sa voiture est plein. La gure 5.3 repr esente cette situation (on suppose de plus quil existe une r` egle de la forme x.vide(x) plein(x)). Dans certains des mondes que Jean imagine Titine est neuve, dans dautres elle ne lest plus. Parfois, Napol eon est mort ` a Sainte-H el ene, mais dans tous les cas
250

Je crois que le rservoir de Titine est plein
(a)
Vide(Rservoir(Titine)) Plein(Rservoir(Titine)) Mort(Napolon,St Hlne) Neuve(Titine)

W0
(b)
Jean
Plein(Rservoir(Titine)) Neuve(Titine) Mort(Napolon,St Hlne) W2
Jean
Plein(Rservoir(Titine)) Neuve(Titine) Mort(Napolon,Ile d'Elbe) W1
Figure 5.3: Un mod` ele de mondes possibles (b) correspondant aux croyances de Jean (a) il nimagine que des mondes dans lesquels le r eservoir de Titine est plein, et cest pour cela que lon peut dire que Jean croit eectivement cette proposition. De plus, Jean croit quelque chose de faux. En eet, il est dit dans le monde originel W0 que le r eservoir nest pas plein (il est m eme vide), mais cela Jean ne le voit pas. Plus formellement, on appelle interpr etation en termes de mondes possibles, un mod` ele de Kripke M d eni comme un n-uplet M =< W, I, R1 , ..., Rn > o` u W est un ensemble de mondes possibles (ou d etats possibles du monde si lon pr ef` ere), o` u Ri est une relation daccessibilit e associ ee ` a lagent i, et o` u I est une fonction de valuation qui associe une valeur de v erit e ` a une proposition et ` a un monde, cest-` a-dire une fonction de type I : P roposition W {V rai, F aux} Linterpr etation dune proposition contenant une croyance peut alors etre donn ee par une relation de cons equence s emantique not ee |= o` u M, w |= signie que/phi est vrai dans le monde w du mod` ele M . Cette relation est d enie r ecursivement ainsi dans le cadre dune logique modale propositionnelle11 :
11 Nous ne d enirons ici que la relation s emantique pour une logique modale dont les enonc es sont des propositions. Lextension de ce type de s emantique aux logiques modales pr edicatives est imm ediate. En particulier on pourra se r ef erer au livre (Genesereth et Nilsson 1987) pour une pr esentation de cette extension.
` 5.3. LE SYSTEME REPRESENTATIONNEL M, w M, w M, w M, w M, w M, w |= si est une proposition primitive et I (, w) = V rai |=I ssi M, w |=I |=I ssi M, w |=I et M, w |=I |=I ssi |=I ou |=I |=I ssi M, w |=I ou M, w |=I |=I croire(a, ) ssi pour tout monde wi tel que w Ra wi , M, wi |=I
251
Il ne sut pas de donner une s emantique ` a un op erateur modal. Encore faut-il etre capable de caract eriser les di erentes propri et es que lon attache ` a ces formes de connaissances. Celles-ci peuvent etre d enies par un ensemble daxiomes qui caract erisent les aspects inf erentiels des croyances. Le premier de ces axiomes, laxiome de distribution, porte sur le fait que les croyances ou les savoirs dun agent suivent le principe du modus ponens: si un agent croit une implication entre deux termes, alors sil croit le premier, il croit aussi le second. Cet axiome, qui est souvent consid er e comme l el ement principal des logiques des savoirs et des croyances, peut avoir plusieurs expressions equivalentes: croire(A, (P Q)) croire(A, P Croire(A, Q)) croire(A, P) croire(A, (P Q)) croire(A, Q) Laxiome de non contradiction caract erise les facult es logiques dun agent. Sil croit quelque chose, alors il ne croit pas son contraire, ce que lon note: croire(A, P) croire(A, P)) (D) (K )
par exemple, si Jean croit que son r eservoir dessence est plein, alors il ne croit pas que son r eservoir est vide. Les agents cognitifs peuvent etre consid er es comme des agents conscients de leur propres croyances. Cela indique que si un agent croit quelque chose, alors il croit quil le croit. Cette propri et e est mat erialis ee par les axiomes dintrospection positive et n egative: croire(A, P) croire(A, croire(A, P)) (4) croire(A, P) croire(A, croire(A, P) (5)
Laxiome de savoir consid` ere que tout ce que croit un agent est vrai, et est not e ainsi: croire(A, P) P (T ) Cet axiome nest pas adapt e aux croyances: il est en eet possible davoir des croyances fausses, et cest dailleurs ce que nous avions reconnu comme etant lune des caract eristiques fondamentales des croyances. Lorsque Jean croit que son r eservoir est plein, il se peut quil soit vide. En revanche, la notion de savoir, telle quelle est utilis ee en logique, suppose que tout savoir est vrai, cest-` a-dire quun agent ne peut savoir quelque chose de faux. De ce fait, laxiome de connaissance, qui est lun des pivots des logiques des savoirs, ne sera pas utilis e pour la repr esentation des croyances.
252
Il est possible de panacher ces propri et es et de ne conserver que les axiomes que lon d esire. Dans ce cas on obtiendra ` a chaque fois un syst` eme logique di erent, dans lequel certaines d eductions pourront etre faites et pas dautres. La gure 5.4 (Konolige 1986) repr esente lensemble des syst` emes modaux correspondant ` a ces axiomes ainsi que leurs liens de d ependance.
K K4 K5 KD KDT (T)
K45
KD5
KD4
KDT4 (S4)
KD45
KDT45 (S5)
Figure 5.4: Les di erentes logiques modales d enissables ` a partir des axiomes K,D,T, 4 et 5. Une ` eche X Y indique que tous les th eor` emes de X se retrouvent int egralement dans Y. Les noms entre () correspondent ` a leur d enomination usuelle. Lint er et de la s emantique des mondes possibles est de pouvoir relier les axiomes de ces syst` emes logiques modaux aux propri et es des relations daccessibilit e. Laxiome K est indispensable parce quil permet dinterpr eter les propositions modales en termes de mondes possibles. Laxiome T est caract eristique dune relation daccessibilit e r eexive. Lorsquelle est en plus transitive on obtient le syst` eme S4. Lorsquil sagit de relations d equivalence, cest-` a-dire si laccessibilit e est r eexive, sym etrique et transitive, le syst` eme daxiome correspondant est S5. Les logiques des savoirs utilisent g en eralement les logiques S4 ou S5. En revanche les logiques des croyances, qui ne peuvent accepter laxiome T, utilisent g en eralement KD45, la plus forte des logiques des croyances. Lautre int er et de la s emantique des mondes possibles pour les syst` emes multiagents est de pouvoir repr esenter facilement les croyances mutuelles que les agents peuvent avoir les uns envers les autres et de prendre en compte un ensemble dassertions telles que: croire(Jean,plein(r eservoir(Titine))) croire(Marie,vide(r eservoir(Titine))) croire(Marie,croire(Jean,vide(r eservoir(Titine)))) dans laquelle Marie croit non seulement que le r eservoir de Titine est vide, mais aussi que Jean croit que le r eservoir est vide, alors que ce dernier croit que le r eservoir est plein. Cela signie dabord simplement que dans tous les mondes accessibles initialement par Jean (cest-` a-dire accessible depuis W0 ) le r eservoir de Titine est plein et que dans tous les mondes accessibles initialement par Marie, le r eservoir est vide. La croyance mutuelle est pr ecis ee en disant que dans tous les mondes accessibles par Marie, la proposition
` 5.3. LE SYSTEME REPRESENTATIONNEL croire(Jean,vide(r eservoir(Titine)))
253
est vraie, cest-` a-dire que dans tous les mondes accessibles par Jean ` a partir des mondes initialement accessibles par Marie, la proposition vide(r eservoir(Titine)) est v eri ee, comme le montre la gure 5.5.
Plein(Rservoir(Titine)) Neuve(Titine)
Jean
Vide(Rservoir(Titine)) Plein(Rservoir(Titine)) W0
W1
Jean
Plein(Rservoir(Titine)) Neuve(Titine) W2
Vide(Rservoir(Titine))
Marie Marie
Vide(Rservoir(Titine)) Croire(Jean,Vide(Rservoir(Titine)))
W3
Jean
W5
Jean
Vide(Rservoir(Titine)) W6
Vide(Rservoir(Titine)) Croire(Jean,Vide(Rservoir(Titine)))
W4
Jean
Vide(Rservoir(Titine)) W7
Figure 5.5: Un mod` ele de mondes possibles indiquant les croyances respectives de Jean et de Marie. Celle-ci croit que Jean croit que le r eservoir est vide alors quil croit en fait quil est plein.
Limites de la s emantique des mondes possibles Bien que tr` es utilis ee en IAD pour d ecrire les croyances et les savoirs des agents, la s emantique des mondes possibles et les logiques modales qui y sont associ ees sont tr` es controvers ees. La premi` ere de ces controverses concerne lomniscience logique des agents ainsi d enis. La s emantique des mondes possibles r eclame absolument une r` egle, appel ee r` egle de n ecessit e qui indique que toute formule valide (cest-` a-dire universellement vraie quel que soit le mod` ele) fait n ecessairement partie des croyances de lagent, ce que lon exprime de la mani` ere suivante: pour tout agent a, croire(a, )
Linconv enient, cest que cette r` egle, lorsquelle est associ ee ` a laxiome K, impose ` a lagent d etre capable de d eduire toutes les cons equences logiques de ses croyances et en particulier celles qui proviennent des cons equences universellement valides. Par exemple si Jean croit que le r eservoir de sa voiture est plein, et quil soit vrai que sa voiture puisse rouler 200 kilom` etres sans avoir besoin de reprendre de lessence, alors, dapr` es la s emantique des mondes possibles, Jean doit n ecessairement croire quil pourra rouler 200 kilom` etres. Mais cela nest peut- etre pas une croyance de
254
Jean, sil croit que sa voiture peut rouler pendant 300 km sans faire le plein. Dans ce syst` eme, on ne peut donc pas croire quelque chose qui soit en contradiction avec un fait universellement vrai. Les croyances fausses sont donc interdites, ce qui est pourtant le propre des croyances. De plus cette s emantique ne prend pas en compte le fait que les agents disposent de m emoire et de processeurs limit es. On ne peut donc se sortir de ces dicult es quen supposant que cette s emantique d enit des agents dont les performances de d eduction sont id eales. On fera aussi attention ` a limiter au maximum le nombre de formules universellement valides de telle mani` ere que des d eductions non voulues ne puissent pas etre engendr ees par le syst` eme. Logiques op erationnelles Le probl` eme de lomniscience logique ne constitue pas la seule dicult e que doivent aronter les logiques modales. Il existe aussi des probl` emes m etaphysiques concernant lexistence de ces mondes possibles et de leur construction. Cest pourquoi dautres mod` eles de raisonnement sur les croyances et les savoirs ont et e propos es, ces mod` eles ne reposant plus sur lexistence de ces mondes, mais sur les capacit es m ecaniques dun agent de produire de nouvelles assertions. On parle alors de logique op erationnelle ou de s emantique phrasistique (sentential semantics) pour indiquer que la s emantique dune expression est donn ee en termes de manipulation formelles d enonc e et non par r ef erence ` a un mod` ele de monde, que ce mod` ele traite de mondes r eels ou de mondes possibles. A chaque agent a on associe une base de connaissance a compos ee de formules de logique ordinaire (logique propositionnelle classique ou logique des pr edicats du premier ordre) et dun ensemble de r` egles dinf erence not e a . Combin ees, formules et r` egles dinf erence permettent de d enir lensemble a qui comprend lensemble des formules initiales plus celles qui peuvent etre d eriv ees en utilisant les r` egles dinf erences de a et que lon appelle la th eorie de lagent a. On note a a le fait que la proposition soit vraie dans la th eorie a , cest-` a-dire que soit un th eor` eme d eduit ` a partir de la base de connaissance de lagent a. Dans ce cadre, exprimer quun agent croit une proposition revient ` a dire que appartient ` a a , cest-` a-dire que lon rattache une croyance ` a une possibilit e d eductive dun agent. En particulier, etablir quun agent croit que revient ` a essayer de prouver que a dans le cadre des connaissances et des capacit es dinf erence de lagent a. Cette conception des croyances a lavantage de beaucoup mieux rendre compte des m ecanismes calculatoires qui sous-tendent les raisonnements des agents. Elles ne posent pas les probl` emes rencontr es avec les s emantiques des mondes possibles et, en particulier, les probl` emes de lomniscience, puisquil est possible de d enir des r` egles dinf erence limit ees (par exemple en limitant le nombre de pas de d eductions quun agent peut ex ecuter ou le type de d eduction quil peut faire). Le sens est plus vu alors comme un usage (Wittgenstein 1951), cest-` a-dire comme lensemble des occurrences de cette expression dans le contexte de lensemble des preuves r ealis ees a loccasion de linterpr ` etation de cette expression (Enjalbert 1989). Le mod` ele nest alors plus donn e a priori mais elabor e localement ` a partir dinterpr etations partielles
255
locales ` a chacun des agents interagissant. Cest en utilisant cette approche que C. Lef` evre a propos e un mod` ele de croyances et de savoirs ` a partir dun mod` ele logique issu du lambda calcul typ e (Lef` evre 1995). Ce mod` ele r esout les probl` emes pos es par la s emantique des mondes possibles tout en donnant une base formelle solide a des mani` ` eres di erentes de croire. Il est ainsi possible de distinguer la croyance comme preuve de la croyance comme argument et ainsi dorir au concepteur de SMA di erentes mani` eres dappr ehender le probl` eme de la croyance.
5.3.4
Ad equation et r evision des croyances
La premi` ere qualit e dun mod` ele est d etre ad equat, cest-` a-dire d etre dans un rapport de correspondance avec la r ealit e. Formellement lad equation revient ` a dire quil existe un morphisme entre la structure du mod` ele est celle du monde r eel. Lorsque ce morphisme nexiste pas, le mod` ele est inad equat: par exemple, une carte de France nest daucune aide lorsquon se trouve aux Etats-Unis parce que les structures des deux pays sont trop di erentes. De m eme, une carte routi` ere nest pas tr` es utile lorsquon se trouve en bateau car les angles et les distances ny sont pas respect es: les op erations daddition vectorielles qui sont essentielles pour la navigation marine ne servent ` a rien pour se rep erer sur un r eseau de routes, dont la structure est essentiellement celle dun graphe. Linad equation des mod` eles est parfois responsable des dicult es que lon eprouve a agir. Par exemple, beaucoup croyaient dur comme fer ` ` a la n du si` ecle pr ec edent quil n etait pas possible pour un plus lourd que lair de voler. Le mod` ele que lon avait alors et qui reposait sur la notion de poids sans faire intervenir de conception a erodynamique n etait pas ad equat, et lon ne cherchait pas ` a faire des avions. Le fait m eme dessayer de faire un a eroplane avec un moteur susamment puissant pour que la vitesse du vent produise une force portante ne venait pas ` a lesprit de la plupart des gens, et seuls quelques pionniers croyaient aux plus lourds que lair (Ferber 1906). Un mod` ele est constitu e de croyances, cest-` a-dire dinformations dont la validit e peut- etre remise en question si de nouvelles informations sont disponibles. Croire, cest donc etre capable de r eviser son jugement si une information nouvelle vient inrmer ce que lon pense. Lorsque le robot Clotaire se d eplace, il doit en permanence remettre ` a jour lensemble des d eductions quil peut faire sur le monde: la position des objets peut etre modi ee et toutes les cons equences li ees ` a ces objets doivent etre mises ` a jour. Logique des d efauts Par exemple, supposons que Clotaire, qui poss` ede une pince pr ehensile, doive raisonner sur le fait que sa pince soit vide ou non pour savoir sil peut prendre un objet imm ediatement. La connaissance g en erale, valable pour tous les robots disposant de pinces, peut se formuler ainsi: pinceVide(x) peutPrendreObjet(x)
256
Cependant, cet enonc e pose probl` eme. Supposons quinitialement Clotaire ait la pince vide et quil poss` ede donc le fait: pinceVide(Clotaire) dans sa base de connaissance. Il peut donc d eduire le fait quil peut prendre un objet, cest-` a-dire que la formule peutPrendreObjet(Clotaire) est vraie. Mais d` es quil prend un objet, cet enonc e ne lest plus puisque sa pince nest plus vide. Dautres ph enom` enes, par exemple si Clotaire a cass e sa pince, peuvent contredire la relation qui existe entre l etat de la pince et sa capacit e` a prendre des objets. Larmation que la pince est vide est relative ` a un etat du monde et na donc aucune validit e universelle. Or la logique standard, telle que la logique des pr edicats du premier ordre, ne peut pas prendre en compte ce type de situation. D` es quune proposition est arm ee, elle ne peut etre remise en cause. On dit que ces logiques sont monotones parce que les raisonnements ne font quajouter des faits ` a la base de connaissances dont la valeur de v erit e ne peut etre modi ee sous peine de rendre incoh erente toute la base. Pour raisonner sur un monde qui evolue ou qui ne poss` ede que des connaissances partielles, il est n ecessaire de disposer de logiques di erentes capable de traiter des connaissances r evisables et ainsi de pouvoir remettre en cause des faits d eduits au pr ealable et qui ne sav` erent plus pertinents. R eviser une base de connaissance, cest corriger les expressions produites lorsque certains faits sont modi es, cest-` a-dire d enir la mani` ere, progressive et incr ementale dont les croyances dun agent changent lorsque des faits sont ajout es ou retir es de sa base de connaissance et qui permettent de rendre compte du traitement dinformations incompl` etes, incertaines et evolutives. Le d eveloppement de lanalyse du raisonnement r evisable sest eectu e selon deux axes: sur le plan th eorique dune part en produisant des th eories formelles capables de rendre compte des op erations de r evisions, et sur le plan des m ecanismes permettant de g erer les justications des cons equences avec lessor des syst` emes de maintien de coh erence. Les traitements logiques du raisonnement r evisable sont fond es sur la d enition de logiques dites non monotones, consid er ees comme des extensions des logiques classiques. Ces logiques nont pas et e cr e ees initialement pour caract eriser le raisonnement r evisable d u` a un univers evolutif, mais pour formaliser certains aspects du raisonnement de sens commun et en particulier celui qui a trait au traitement des connaissances typiques et qui peut se paraphraser par g en eralement tous les A sont B (Somb e 1988). Pour reprendre lexemple c el` ebre qui a donn e ses lettres de noblesses aux recherches dans ce domaine, typiquement les oiseaux volent. Donc, en labsence dinformations contradictoires, il est possible den inf erer que Titi qui est un oiseau, vole eectivement. Evidemment cette armation, qui est g en eralement correcte, nest pas valide si Titi sest cass e une aile ou sil sagit dune autruche. Les approches maintenant les plus d evelopp ees dans ce domaine sont la logique des d efauts, la logique auto epist emique de Moore (Moore 1988), et la circonscription
257
de McCarthy (McCarthy 1980). La logique des d efauts, introduite par Reiter (Reiter 1980) pr esente lavantage d etre ` a la fois simple ` a comprendre et ` a mettre en uvre dans ses versions les plus el ementaires et davoir et e bien etudi ee. Les formules de la logique des d efauts sont les m emes que celle de la logique classique. Les informations par d efaut, cest-` a-dire de nature typiques, sont donn ees par des r` egles dinf erences sp eciques appel ees r` egles de d efaut, qui s ecrivent ainsi: : M et qui signient que si est une croyance et que la formule nest pas incoh erente avec les autres, alors peut etre cru. Tr` es souvent les formules et sont les m emes et on parle alors de d efauts normaux. La r` egle des d efauts portant sur les oiseaux et leur propri et e de voler sexprime ainsi: oiseau(x) : M vole(x) vole(x) (RD1)
Il est possible dutiliser la logique des d efauts pour repr esenter le raisonnement r evisable dun agent. Par exemple, si lon veut caract eriser le fait que normalement un robot qui poss` ede une pince vide peut prendre un objet sera formul e ainsi: pinceVide(x) : M peutPrendre(x) peutPrendre(x) (RD2)
Cette r` egle exprime tr` es pr ecis ement que si la pince du robot est vide et quil nest pas incoh erent de penser quil peut prendre un objet, alors il peut le faire. De m eme la relation qui lie la jauge du r eservoir de Titine (cf. section 5.3.3) au niveau dessence peut sexprimer ainsi: jauge(x, pleine) : M r eservoirPlein(x) r eservoirPlein(x) (RD3)
Lint er et dune r` egle de d efaut est de pouvoir d enir des liens plus l aches entre les pr emisses et les conclusions dune r` egle quen logique des pr edicats. Il sut quil existe une contradiction entre la conclusion et dautres faits de la base pour que la r` egle ne soit plus applicable et donc que linf erence soit stopp ee. Par exemple, si la pince de Clotaire est cass ee et sil existe une r` egle de la forme pinceCass ee(x) peutPrendreObjet(x) et le fait pinceCass ee(Clotaire) alors le syst` eme en d eduira peutPrendreObjet(x) La r` egle RD2 ne pourra pas sappliquer et on ne pourra pas en d eduire que Clotaire peut prendre un objet m eme si sa pince est vide.
258
Les r` egles de d efaut telles que RD2 ou RD3 indiquent toutes quun certain raisonnement peut etre eectu e en labsence de contradictions consid er ees comme anormales. Par exemple, la r` egle RD3 pourrait etre r e ecrite ainsi: jauge(x, pleine) anormal1(x) r eservoirPlein(x) (RD3 )
o` u anormal1 repr esente une caract eristique danormalit e qui viendrait se mettre en travers de la relation existant entre la jauge et le r eservoir. Si lon consid` ere quen labsence dinformations suppl ementaires, le pr edicat anormal1 est faux, ce que lon obtient en appliquant lhypoth` ese du monde clos o` u tout ce qui nest pas connu comme vrai est faux, alors la formule pr ec edente repr esente bien directement la r` egle de d efaut RD3. La th eorie de la circonscription de McCarthy est une g en eralisation de cette gestion de lanormalit e` a nimporte quelle r` egle. Justications et TMS Lint er et de la logique des d efauts et de la circonscription est de pouvoir etre relativement facilement impl ement ee ` a laide de syst` emes de maintien de la coh erence plus connus sous le nom de TMS (Truth Maintenance Systems). Les TMS sont des syst` emes informatiques permettant de g erer les justications des croyances. Lorsque Jean arme que le r eservoir de Titine est plein, cest parce quil peut lire le niveau de la jauge dessence qui agit comme une justication de sa croyance. Evidemment cette croyance peut sav erer fausse si le lien de d ependance qui existe entre le niveau dessence et la jauge sav erait coup e. La justication est ` a la base des croyances et des mod` eles que lon peut avoir sur le monde. Les TMS sont des m ecanismes informatiques tr` es simples, invent es initialement par Doyle (Doyle 1979), qui g` erent les d ependances entre faits et indiquent si oui ou non un fait peut etre cru, en fonction des justications positives ou n egatives qui peuvent lui etre associ ees. Un TMS est un r eseau de d ependances entre informations, les nuds du r eseau repr esentant les informations qui peuvent etre vraies ou fausses, et les ` eches caract erisant les d ependances entre les informations. Ces ` eches sont soit positives soit n egatives. Dans le premier cas, elles repr esentent des justications positives entre les informations (ce que lon appelle des ` eches IN dans le jargon TMS), et dans le second des justications n egatives (des ` eches OUT). Un nud est dit valide, si tous les nuds dont il d epend positivement sont valides, et tous les nuds dont il d epend n egativement sont invalides. Par exemple, le fait que Clotaire puisse prendre un objet sil se trouve ` a c ot e de lobjet, que sa pince est vide et que lobjet ne soit pas trop lourd et que sa pince ne soit pas cass ee peut sexprimer sous la forme dun sch ema comme le montre la gure 5.6. Cette gure illustre le caract` ere eminemment r ecursif du maintien de la coh erence. Les informations sont soit des primitives, soit d ependent dautres informations. A chaque fait non primitif est associ e un petit processeur qui calcule les validit es des faits dont il d epend. Par exemple, le fait que la pince soit vide d epend de lindication de son capteur et de l etat de sant e de ce dernier. De m eme, une pince est cass ee si elle ne peut plus eectuer de mouvements verticaux, horizontaux ou rotationnels.

Clotaire prs de X
259
Capteur de pression inactif

Capteur de pression cass
+ Pince Clotaire vide + Poids de X suprieur au poids limite Pince Clotaire casse
Clotaire peut prendre un objet X
Lgende
Noeud de justification Justification ngative (ou inhibition) Justification positive
Mouvement vertical OK
Mouvement horizontal OK Mouvement rotation OK
Figure 5.6: Une repr esentation sch ematique dun ensemble de justications. Une armation non primitive est vraie si toutes les justications positives sont vraies et toutes les justications n egatives fausses. Les nuds qui ne d ependent daucun autre nud sont soit des pr emisses soit des hypoth` eses. Les pr emisses sont des nuds dont les informations sont toujours valides, alors que les hypoth` eses sont des nuds dont les informations sont suppos ees valides. Cest au cours du fonctionnement du TMS que lon d eterminera si ces nuds sont eectivement valides ou non. Dans le cas id eal, o` u le r eseau de d ependances est sans cycle, un simple algorithme de propagation sut ` a g erer les justications. D` es quun fait devient invalide, il invalide tous les faits qui d ependent de lui par un lien de justication positive, et il peut rendre valide un fait qui d epend de lui par un lien de justication n egative, si tous les autres justications n egatives sont invalides elles aussi. Lorsquune contradiction est soulev ee, un syst` eme de gestion des contradiction se met en uvre en recherchant parmi lensemble des hypoth` eses celles quil faudrait remettre en cause pour lever la contradiction. On trouvera dans (Haton et al. 1991) une bonne introduction au raisonnement r evisable et dans (Thibault 1993) une application des syst` emes de maintien de coh erence ` a un syst` eme distribu e de perception. Pr evisions et ad equation Si un mod` ele doit etre ad equat, il doit aussi permettre daider ` a la pr evision de ce qui va se passer en anticipant sur un etat futur du monde. A partir de repr esentations sur les lois de ce monde et de connaissances psychologiques sur le comportement des autres agents, un agent cognitif peut eventuellement d eterminer les faits et les ev enements qui peuvent arriver. Cela consiste ` a pouvoir d eterminer des cognitons interactionnels dentr ee (percepts et informations) avant quils ne soient disponibles. Par exemple, si Jean sait que Titine consomme 10 litres dessence au 100 km, quil vient faire le plein et que son r eservoir contient 30 L, il peut en d eduire quil pourra faire 300 km avant de tomber en panne dessence et quau bout denviron 250 km la jauge dessence indiquera que le r eservoir est vide. Autrement dit, Jean et Clotaire peuvent anticiper sur ce quils percevront dans le futur. La gure 5.7 donne le sch ema dun syst` eme pr evisionnel.
260
Modle d'action M(Op)

Lois du Croyances monde factuelles Percept/information attendu P' t+ t
Percept/information actuelle Systme Pt de prvision
Figure 5.7: Un syst` eme de pr evision produit des percepts attendus, que des perceptions ou des informations ult erieures viendront normalement corroborer. A partir des perceptions ou des informations portant sur l etat actuel du monde, a partir des mod` ` eles des actions que lagent peut accomplir et ` a partir des lois du monde auxquelles il croit et des croyances factuelles suppl ementaires, le syst` eme pr evisionnel fournit des attentes, cest-` a-dire des percepts ou informations qui devront normalement etre corrobor ees par les percepts et informations provenant du syst` eme perceptif. Formellement, on peut d ecrire le processus de pr evision de la mani` ere suivante. Soit P1 un ensemble de percepts (ou dinformations) d ecrivant une partie de l etat s1 actuel, soit M (Op) le mod` ele de laction que lagent a est sur le point daccomplir, soit L et C des ensembles de lois de lunivers et de croyances factuelles, alors on a: P1 = P ercepta (1 ) P2 = P r e visiona (P 1, M (Op), L, C ) esente un ensemble de percepts (ou dinformations) attendues qui doivent o` u P2 repr etre per cus ou obtenus lors de l etat 2 . Dun autre c ot e, lagent accomplit des actions et le monde evolue. De ce fait, en reprenant le mod` ele de laction comme production dinuences pr esent e au chapitre 4, on obtient un etat 2 qui d ecoule de lex ecution de laction Op et des inuences autres issues dautres actions (provenant dautres agents): 2 = React(1 , Exec(Op, 1 )||autres ) Cet etat peut etre per cu par lagent A (ou donner lieu ` a des informations que A re coit) sous la forme dun ensemble de percepts (ou dinformations) P2 : P2 = P ercepta (2 ) Si P2 est en accord avec P2 , pas de probl` emes. On dira simplement que lagent A a bien anticip e l etat 2 et que toutes ses lois du monde, ses croyances, ses m ecanismes perceptifs ou informationnels ainsi que ses mod` eles dactions sont ad equats. En revanche, si P2 et P2 sont susamment di erents pour etre consid er es comme incoh erents (par exemple sil existe des contradictions entre ces deux ensembles de cognitons), alors il faudra peut- etre r eviser les el ements repr esentationnels ayant entra n e cette fausse pr evision. La gure 5.8 montre de mani` ere diagrammatique ce processus de pr evision. On peut constater quen eet si la pr evision est ad equate, etre nul. alors l ecart entre P2 et P2 doit

Comparaison Prvision <P 1 ,M(Op),L,C> < P' > 2 P, 2 Reprsentation
Op Perception Excution <<1 , > || autre >
261
Perception Raction
Figure 5.8: Diagramme de pr evision. Lorsque est nul, les pr evisions sont corrobor ees. Le diagramme commute et on peut dire que les repr esentations M(Op), L, C ainsi que les syst` emes perceptuels et informationnels sont ad equats. Si l ecart nest pas nul, cela signie quil faut r eviser certaines croyances. Il faut alors mettre en place des strat egies de r evision et essayer de d eterminer quels sont les fauteurs eventuels du trouble. Le probl` eme consiste ` a choisir les el ements dont on doute le plus, cest-` a-dire les cognitons pour lesquels nous attribuons le moins de vraisemblance. Voici quelques solutions possibles: 1. Les capteurs sont en mauvais etat. On sassurera de leur bon fonctionnement en v eriant que dans des situations connues on obtient bien les percepts attendus. Par exemple, si Jean trouve que sa voiture consomme trop, il pourra dabord sassurer de sa jauge en remettant de lessence et en v eriant que sa jauge fonctionne bien. Dans certains cas, un agent peut demander ` a un autre agent si ses perceptions sont bien les m emes que les siennes en lui posant la question: Est-ce que tu vois ce que je vois? La probabilit e que les capteurs de plusieurs agents soient tomb es en panne est tellement minime quune simple question de ce genre permet d eliminer tr` es rapidement ce facteur (lillusion collective est tr` es rare chez les agents articiels). 2. Les informations fournies par les autres agents ne sont plus bonnes ou insusantes. Dans ce cas, on tentera de sassurer de leur qualit e en redemandant ces informations si cela est possible, ou bien en essayant de se procurer des compl ements dinformation. Si dans lexemple de la poursuite, lun des pr edateurs utilise des informations fournies par un autre pr edateur pour conna tre la position dune proie et quil ne la d ecouvre pas au bon endroit, il pourra eventuellement demander conrmation de cette position ` a un autre pr edateur pour savoir si cest une information erron ee (et ses croyances ne reposaient sur rien) ou p erim ee, la proie s etant enfuie (et il faut simplement que lagent mette ` a jour ses croyances en fonction des nouvelles informations). 3. Les croyances factuelles dont lagent dispose sont erron ees ou insusantes. Cela nest pas toujours facile ` a r eviser. Ces croyances d ependent souvent dun grand nombre de percepts, dinformations et de lois du monde. Si lon d esire v erier la qualit e de ces croyances, il faudra v erier tous ces el ements, ce
262
CHAPTER 5. LAGENT DANS TOUS SES ETATS qui peut sav erer fastidieux et peut- etre inutile. En g en eral on remettra plus facilement en cause les croyances dont les origines sont les plus douteuses, se r eservant de ne r eviser les croyances quasi certaines quen dernier ressort. N eanmoins, les autres agents peuvent etre ici aussi dun grand secours, en permettant ` a lagent de confronter ses croyances ` a celle des autres an de mieux localiser les causes de lerreur de pr evision.
4. Laction ne correspond pas ` a son mod` ele. Deux cas peuvent se pr esenter. Cela peut provenir dun d efaut de mod elisation de laction: il faut alors essayer de r eviser ce mod` ele en testant laction dans dautres circonstances. Mais il peut aussi etre tout simplement question dun manque de comp etence. Si je tire une ` eche vers une cible et que je rate cette derni` ere, ce nest pas tant le mod` ele de mon action qui est mauvais que mon manque de comp etence dans le tir ` a larc. Il ne sagit donc plus de r evision de mod` ele, mais de pratique dun exercice. 5. Les lois de lunivers ou les mod` eles psychologiques des autres agents ne sont pas ad equats ou sav` erent insusants. Une mani` ere de sen assurer consiste a tester ces lois et ces mod` ` eles, cest-` a-dire ` a mettre en place des exp eriences (m eme tr` es el ementaires) pour v erier la validit e de nos lois. Par exemple, si Jean a une th eorie qui lui fait croire que tous les morceaux de bois ottent, il pourra etre tr` es perplexe devant un rondin de certains bois exotiques, tels que l eb` ene, qui coule. Il pourra mettre ` a jour sa th eorie, en y ajoutant des exceptions, ou mieux essayer de comprendre que derri` ere ce ph enom` ene il existe des principes cach es qui sous-tendent cette th eorie et qui portent sur la densit e des corps et la loi dArchim` ede. Cest le domaine de lapprentissage par ordinateur que dessayer ` a la fois de constituer des r` egles g en erales ` a partir de cas particuliers et de faire evoluer ces r` egles lorsque de nouveaux contre-exemples se pr esentent. Ce travail peut dailleurs aussi etre lobjet dinteractions entre ma tres et el` eves et dune mani` ere g en erale de dialogues entre agents. Il ne faut pas croire cependant quil soit tr` es facile de mettre ` a jour des croyances portant sur des lois du monde ou des mod` eles psychologiques. On peut bien au contraire constater que dans nombre de domaines o` u les croyances sont en fait des marques de cr edulit e, la mise ` a l epreuve des mod` eles et des conceptions du monde associ ees ne seectue pas delle-m eme. Lhistoire des id ees montre toutes les dicult es quont encourues les scientiques par rapport aux id eologies religieuses et magiques lorsque leurs m ethodes et leurs r eponses remettaient en cause des conceptions bien ancr ees et n ecessitaient une profonde remise en cause des mod` eles. Et pourtant elle tourne disait Galil ee. Sa condamnation repr esente de mani` ere embl ematique tout le travail quil faut faire pour que des conceptions erron ees disparaissent. 6. Enn, il existe un dernier cas dans lequel aucun cogniton nest en cause: ni les connaissances sur le monde, ni les croyances factuelles, ni les informations ni les percepts ne sont faux. Mais les motifs des erreurs de pr evision r esident tout simplement dans la complexit e de la situation, la trop grande quantit e de param` etres et la dynamique quasi impr evisible du syst` eme. Les
5.4. QUE CROIRE? LES CONTENUS DES REPRESENTATIONS
263
m et eorologistes, qui ont aaire ` a des ph enom` enes chaotiques, le savent bien: au-del` a dune certain laps de temps, toute pr evision devient n ecessairement fausse. Seules les boules de cristal peuvent pr edire lavenir lointain... Beaucoup de travail reste encore ` a faire dans ce domaine an de donner une description g en erale des strat egies de r evision des croyances qui peuvent etre mis en uvre ind ependamment des m ecanismes particulier que lon peut utiliser pour mettre a ` jour ses connaissances.
5.4
Que croire? Les contenus des repr esentations
Mais ` a quels contenus doivent se r ef erer ces croyances? Sur quoi portent les connaissances et les croyances dun agent et de quelles informations a-t-il besoin pour agir et accomplir ses t aches? Les croyances, qui peuvent etre formalis ees par des propositions, comme nous lavons vu ` a la section pr ec edente, repr esentent le monde, cesta-dire peuvent ` etre interpr et ees en r ef erant ces propositions ` a des mod` eles. La puissance dun agent cognitif r eside essentiellement dans sa facult e repr esentationnelle, cest-` a-dire dans sa capacit e` a elaborer des mod` eles du monde (de lenvironnement et des autres agents) dans lequel il se trouve plong e permettant de comprendre, dexpliquer et de pr evoir les ev enements et l evolution des ph enom` enes. Il existe donc un grand nombre de mod` eles. Certains sont plus scientiques, car il abordent lad equation du mod` ele de mani` ere m ethodique en cherchant ` a v erier le mod` ele, ou plus exactement ` a montrer quil est ` a la fois r efutable mais r esistant aux di erentes epreuves que lon peut lui faire subir. Dautres sont plus intuitifs et ne r esistent pas ` a la moindre inquisition m ethodique. Newton, Bohr, Einstein, Freud, Marx, Piaget, Darwin, Watson et Crick sont c el` ebres pour avoir d evelopp e des mod` eles permettant daller un peu plus loin dans la compr ehension des ph enom` enes physiques, biologiques, psychologiques et sociaux. Ces mod` eles nous ont et e transmis par la culture et nous croyons maintenant eectivement que les corps physiques se d eplacent dans lespace en suivant certaines trajectoires, que notre psychisme contient un certain nombre d el ements inconscients dont les r eves sont r ev elateurs, que notre d eveloppement cognitif seectue par constructions successives, que nous descendons danc etres communs aux singes, que nos caract` eres organiques individuels d ependent dun cordon dADN. Tous ces mod` eles ont et e elabor es lors de processus historiques mettant en pr esence un grand nombre de personnes dont certaines sont devenues c el` ebres en pla cant la pierre dangle de ces edices conceptuels. On utilise des mod` eles dans la vie de tous les jours: une carte, par exemple, est un mod` ele du territoire qui nous permet de nous rep erer et de d eterminer notre chemin. De m eme un plan de maison est un mod` ele de la maison qui permet a ` des entrepreneurs et ` a des ouvriers de di erents corps de coordonner leurs actions pour construire la maison. En dautre termes, la puissance cognitive dun etre r eside essentiellement dans la capacit e` a construire des mod` eles (th eoriques ou pratiques) ad equats par rapport au monde, lui permettant dagir et danticiper (dans une certaine mesure) sur le futur.
264
Ces mod` eles peuvent etre class es en deux cat egories: les mod` eles factuels et les mod` eles pr evisionnels. Les premiers concernent les croyances quun agent poss` ede sur l etat pr esent du monde et sur les caract eristiques des agents (y compris sur lui-m eme), et les seconds concernent les lois et th eories permettant danticiper sur les etats futurs du monde et sur le comportement des agents (et sur lui-m eme). Ces deux cat egories de mod` eles peuvent ensuite se d ecliner dans les dimensions danalyse dun agent. On distinguera ainsi les croyances factuelles portant sur la soci et e, lenvironnement, les autres et soi-m eme, et les th eories et lois portant sur la soci et e, lenvironnement (ce que nous avons appel e les lois de lunivers au chapitre 4), les autres et soi-m eme, ces deux derni` eres cat egories introduisant de v eritables mod` eles psychologiques, cest-` a-dire des repr esentations des modes de comportement que les agents peuvent sattribuer les uns aux autres. Les croyances portent sur la structure, l etat et les lois d evolution du monde, sur l etat et le comportement dagents. Dapr` es la d enition des dimensions fonctionnelles donn ee au chapitre 3, ces croyances peuvent sanalyser selon les quatre dimensions environnementale (), sociale ( ), relationnelle () et personnelle ( ) (la dimension physique () portant sur limpl ementation des autres dimensions). Les croyances factuelles dun agent sont form ees ` a partir de cognitons issus de son syst` eme perceptif et de ses croyances pr ec edentes. Les perceptions et les informations sont les principales sources de construction de croyances factuelles: les premi` eres servent ` a mettre ` a jour les croyances portant sur des caract eristiques physiques des objets et du monde, et les secondes permettent davoir une repr esentation du monde et des autres agents sans avoir besoin de les percevoir et d etre donc ` a proximit e. Ces croyances sont ensuite combin ees pour en produire de nouvelles ` a partir des concepts et des th eories dont dispose un agent et de ses m ecanismes de raisonnements. Les mod` eles pr evisionnels sont donn es par le concepteur ou issus de processus dapprentissage.
5.4.1
Croyances environnementales ()
Le long de la dimension environnementale, les croyances portent sur l etat de lenvironnement, les caract eristiques des objets et des agents (consid er es alors comme des objets, cest-` a-dire quon ne sint eresse qu` a leurs caract eristiques externes telles que leur position, leur forme ou leur couleur), et dune mani` ere g en erale sur lensemble des caract eristiques qui pourraient etre observ ees. Dans lexemple de la poursuite (cf. chap. 1), les pr edateurs peuvent avoir une croyance sur la position des proies quils poursuivent et sur celle des autres pr edateurs. Ces croyances leur permettent de se diriger dans la bonne direction m eme sils ne per coivent pas les proies ni ne re coivent dinformations les concernant. Dans lexemple des robots explorateurs con cu avec des agents cognitifs, ces croyances factuelles portent sur les positions du minerai, de la base et des robots foreurs et transporteurs ainsi que, dune mani` ere g en erale, sur l etat du monde. Les croyances de Clotaire, le robot transporteur dobjets, sont relatives ` a lendroit o` u sont entrepos es les outils et eventuellement ` a la topologie des lieux dans lesquels il doit se d eplacer. Dans un syst` eme de contr ole distribu e de processus, les croyances
265
portent sur l etat du processus et la valeur des param` etres de commande. Evidemment, ces croyances, par leur nature, peuvent etre erron ees et donc conduire ` a des interpr etations fausses et ` a des d ecisions absurdes. De ce fait, il est fondamental dy associer des m ecanismes de r evision des croyances qui puissent prendre en compte l evolution naturelle de ces informations. Cest le long de cette dimension que les lois de lunivers dans lequel est plong e lagent sont eventuellement repr esent ees. Si cest le cas, lagent dispose alors de v eritables mod` eles pr evisionnels, puisquil peut tenter de se projeter en avant dans le temps et danticiper l etat futur du monde. Par exemple, pour intercepter une balle, il faut anticiper sur sa position prochaine ` a partir de sa position actuelle et dun mod` ele int erioris e de son mouvement.
5.4.2
Croyances sociales ( )
La dimension sociale porte sur le r ole et les fonctions qui doivent etre assur ees ` a lint erieur dune soci et e et, dune mani` ere g en erale, sur lorganisation et la structure du groupe de lagent. Il sagit donc dune connaissance g en erale, ` a limage des connaissances environnementales. Mais ` a la di erence de ces derni` eres, elles ne sont pas tourn ees vers le monde et lenvironnement de lagent, mais en direction de la soci et e dans lequel lagent appartient. Comme nous lavons vu pr ealablement, cette dimension a et e encore peu explor ee. Cest sur ce plan que se situent aussi toutes les normes, contraintes et lois sociales applicables ` a tous les membres dune organisation. Par exemple le code de la route est une loi sociale qui indique ce que doit faire un conducteur lorsquil se trouve dans certaines situations. Si je suis ` a un croisement, et que le feu est au vert pour moi, jen d eduis quil est au rouge pour les autres voies et que je peux passer sans dommage, en supposant que les autres conducteurs respectent cette consigne.
5.4.3
Croyances relationnelles ()
La dimension relationnelle concerne la repr esentation des autres. Ce sont donc des croyances sur les comp etences, les intentions, les engagements, les plans, les m ethodes, les activit es, les r oles et le mod` ele comportemental des autres agents. Ces repr esentations doivent etre consid er ees comme des sortes de m emoires caches qui contiennent des informations sur les autres agents en permettant ainsi ` a un agent A davoir des informations sur des agents B ou C sans avoir ` a leur demander et ainsi de pouvoir elaborer des plans partiels et danticiper sur l etat futur du syst` eme. On peut aussi consid erer que ces croyances sont des moyens dattribuer ` a dautres agents des caract eristiques cognitives et intentionnelles quils nont peut- etre pas, et ainsi faire cohabiter des agents h et erog` enes disposant de caract eristiques structurales, cognitives et comportementales di erentes.
266 Comp etences
La comp etence est certainement la croyance relationnelle qui pr esente le plus dint er et dans un syst` eme multi-agent compos e dagents communiquants. Elle permet de r epondre ` a la question: qui peut faire quoi? et donc, dindiquer ce quun agent peut faire. Cette information est utilis ee pour pouvoir d el eguer du travail sans devoir recourir syst ematiquement ` a un appel dore. En eet, comme nous le verrons au chapitre 7, la r epartition du travail entre les agents, qui constitue lune des activit es fondamentales des organisations, fait un grand usage de ce type dinformation. Par exemple, la r` egle suivante: Si un agent A doit faire une t^ ache T et sil ne sait pas faire T, mais sil conna^ t un agent B qui a la comp etence de r ealiser T, alors A pourra demander ` a B de faire T. permet de d el eguer des t aches en fonction des connaissances de comp etences sur les autres agents, et donc de faire en sorte que le syst` eme ne se plante pas si un agent doit faire une t ache quil ne sait pas, ou ne peux pas, traiter lui-m eme. Il est possible de repr esenter les comp etences de mani` ere multiple, mais les deux repr esentations les plus classiques sont: les mots-cl es, les pr edicats et les objets. La repr esentation par mots-cl es suppose quil existe un vocabulaire de comp etence, et que lon associe ` a chaque agent les mots-cl es correspondant ` a leur comp etence. Par exemple, dans le cas de robots sur Mars, la sp ecialit e des agents pourra etre repr esent ee par des mots-cl es tels que transport, extraction, prospection, relaisEnerg etique, etc. Mais ce mode de repr esentation nest pas susant si lon d esire d ecrire plus nement des comp etences. Nombre de syst` emes utilisent alors, comme le syst` eme Mace (Gasser et al. 1987), des pr edicats comportant eventuellement des arguments. Ainsi, pour dire quun agent est capable dins erer un composant dans un dispositif, on utilisera le pr edicat: capableIns erer(agent, composant, dispositif) et pour exprimer le fait quun agent est sp ecialiste en int egration symbolique dune expression alg ebrique, on utilisera la description suivante: capableInt egrerSymbolique(agent, expression) Cependant, ce type de repr esentation est relativement limit e, car il ne permet pas de d ecrire les liens qui existent entre les di erentes comp etences. Par exemple, lint egration symbolique est une forme de calcul symbolique, qui en poss` ede donc les caract eristiques g en erales et en particulier la facult e de manipuler des expressions symboliques comme arguments et comme r esultats, ` a la di erence des syst` emes num eriques qui fournissent des r esultats uniquement num eriques. Pour pouvoir d ecrire ce type dinformation, on utilise des repr esentations par objets, en consid erant que les comp etences peuvent etre d ecrites par des graphes symboliques
267
structur es, tels que des r eseaux s emantiques (Lehmann 1992) ou les syst` emes de Frames (Masini et al. 1989). Par exemple, la comp etence relative ` a lint egration symbolique peut sexprimer sous la forme de la hi erarchie suivante: CapableAction ... CapableCalculer CapableCalculerNum erique ... CapableCalculerSymbolique CapableD eriverSymboliqu CapableInt egrerSymboliqu CapableSimplifier CapableFactoriser CapableR esoudreEquation CapableR esoudreEquationLin eaire CapableR esoudreEquationTrigo ... On suppose alors que si un agent poss` ede la comp etence de r esoudre des equations lin eaires, il poss` ede aussi celle de r esoudre des equations et donc de faire du calcul formel. Cela ne signie pas quil sache r esoudre des equations trigonom etriques, mais quil dispose a priori de qualit es g en erales lui permettant deectuer certains calculs et donc quil semble comp etent pour r esoudre des equations au sens large, des equations lin eaires tr` es particuli` erement, et eventuellement dautres sortes d equations. Toutes ces informations pourront etre utilis ees pour d el eguer du travail aux autres agents et diminuer le nombre de messages lors de la phase dallocation de t aches (cf. chap. 7). Intentions et engagements Les intentions et les buts indiquent ce quun agent a choisi daccomplir. Cela permet de r epondre ` a la question qui va faire quoi. Comme nous le verrons par la suite, les intentions conduisent, pour un agent, ` a la production dengagements envers luim eme. De ce fait, il sut de conna tre les engagements que les agents ont contract es envers eux-m emes et envers les autres pour avoir une bonne id ee de leurs possibilit es daction. Par exemple, si lon d esire prendre un rendez-vous avec quelquun et que lon connaisse les deux emplois du temps, il est plus facile de trouver une date qui convienne aux deux parties. Plans/M ethodes Cette information permet de r epondre ` a la question Quels sont les plans dun autre agent? Si un agent A conna t le plan dun agent B, il pourra en tenir compte pour elaborer ses propres plans. On retrouvera cette notion dans le cadre de la planication distribu ee que nous verrons au chapitre 8.
268 Activit es
Cette information permet de r epondre ` a la question qui fait quoi? Elle permet aux agents davoir une id ee de la charge de travail de leurs accointances et donc den tenir compte lorsquils cherchent ` a d el eguer du travail. R oles Cette indication renvoie ` a lensemble des activit es quun agent est suppos e savoir accomplir dans une organisation consid er ee. Comme nous lavons vu au chapitre 3, les structures organisationnelles sont notamment d enies par des r oles qui traduisent les di erentes fonctions que les agents doivent savoir traiter au sein dune organisation concr` ete. La connaissance des r oles pour soi et pour les autres permet ` a un agent de savoir ` a qui sadresser sil doit r epondre ` a un probl` eme. Mod` ele comportemental Les mod` eles comportementaux permettent de pr edire l etat mental et les comportements futurs des autres agents, ` a partir dune sorte de psychologie na ve (folk psychology) des autres agents. Ces th eories sont fond ees sur ce que lon appelle lattribution dintentionnalit e. On peut par exemple interpr eter le comportement dun agent situ e comme sil sagissait dun agent cognitif intentionnel et donc lui attribuer des etats mentaux quil n eprouve pas n ecessairement (Dennett 1987). Ce probl` eme renvoie ` a celui de lintentionnalit e tel que nous lavons pr esent e plus haut.
5.4.4
Croyances personnelles ( )
Les croyances factuelles personnelles sont des sortes de croyances relationnelles que lagent poss` ede sur lui-m eme et comprennent donc tous les types vus ci-dessus. La di erence essentielle r eside dans le fait que ces croyances peuvent etre rendues toujours vraies et se comportent donc comme des savoirs (au sens de la th eorie des croyances et des savoirs). En eet, il sut de faire en sorte que ces croyances soient en prise directe avec les autres syst` emes internes et soient automatiquement mises a jour lorsque les comp ` etences, les intentions, les engagements, les croyances, etc. sont modi es. On peut donc dire que lagent se repr esente comme sil etait un autre: il sobjective. Ainsi, toutes les repr esentations d enies dans la dimension relationnelle pour les autres agents peuvent etre explicit ees au sein de lagent m eme et combin ees avec les autres croyances pour conduire un raisonnement.
5.5
Le syst` eme conatif
Comment un agent d ecide-t-il dagir comme il le fait? Quest-ce qui lui fait accomplir certaines actions et pas dautres? Quelles sont les causes de son action? Quels sont les dynamismes de lactivit e mentale qui poussent ` a laction? Quels sont les moteurs, les m ecanismes et les freins du comportement?
` 5.5. LE SYSTEME CONATIF
269
Toutes ces questions ont et e d evelopp ees dans de nombreux domaines: quil sagisse de la philosophie, de la psychologie du comportement, de la sociopsychologie, de la psychanalyse ou de l ethologie, le probl` eme des causes internes et externes de laction a et e d ebattu et rebattu et lensemble des th eories avanc ees t emoigne ` a la fois de la complexit e du sujet et de l etendue de notre ignorance quant aux m ecanismes eectifs qui font quun animal et surtout un etre humain se comportent comme ils le font. De ce fait, si les propositions sont nombreuses, aucune ne permet de rendre compte de l etendue du probl` eme. La r ealisation dagents articiels repose encore une fois cette question plusieurs fois mill enaires. Il nest pas de lobjet de ce livre de r ecapituler toutes les th eories qui ont pu etre emises sur ce sujet, ni m eme den fournir un aper cu tant les propositions sont nombreuses lorsquon ajoute les th eories du comportement animal ` a celle de la psychologie humaine. On tentera au contraire de donner un mod` ele g en eral du syst` eme conatif, cesta-dire de lensemble des structures et des processus permettant ` ` a un agent, tant r eactif que cognitif, dagir. Ce mod` ele se veut g en eral en ce sens quil a pour ambition dint egrer tous les facteurs psychiques permettant de concevoir des entit es articielles capables dagir de mani` ere autonome. Evidemment le syst` eme conatif dun agent r eactif sera plus frustre que celui dun agent cognitif, mais ils seront con cus selon un m eme sch ema g en eral. Mais avant de pr esenter ce mod` ele en d etail, il sav` ere n ecessaire de comprendre dans quel cadre ce mod` ele peut s elaborer et, en particulier, comment il sarticule par rapport aux concepts de comportement rationnel et dautonomie.
5.5.1
Rationalit e et survie
La plupart des th eories en intelligence articielle supposent lexistence dun agent rationnel, cest-` a-dire un agent dont les actions sont toujours le fruit dune d elib eration raisonn ee et qui servent directement ` a la satisfaction des buts de lagent. Comme lindique Newell, le principe de rationalit e consiste ` a faire en sorte que si un agent sait que lune de ses actions lui permet datteindre ses buts, alors il s electionnera cette action (Newell 1982). Cette th eorie de la rationalit e doit etre particuli` erement circonstanci ee dans le cadre de syst` emes multi-agents. En eet, si la rationalit e se r esume simplement ` a une coh erence interne des m ecanismes mis en uvre par un agent pour quil atteigne ses objectifs, ce qui revient ` a armer que un agent qui dispose de buts se comporte de mani` ere ` a satisfaire ses buts, tout informaticien ne peut quadh erer ` a ces principes puisque cela suppose simplement que les concepteurs de ces agents ne sont pas totalement fous en d eveloppant des m ecanismes qui tendent ` a r epondre ` a des besoins. Mais dans ce cas, tous les agents, quils soient cognitifs ou r eactifs, sont rationnels, et lint er et de ce concept tombe alors du fait de sa n ecessaire universalit e. Mais si on postule en plus que la rationalit e suppose une elaboration et une d elib eration toutes deux raisonn ees des buts que lagent se propose consciemment datteindre, ce qui lui permet notamment dexpliquer et de justier ses actions ` a qui lui demande, alors on aboutit ` a une conception beaucoup plus forte de la rationalit e. On peut dire quun agent est rationnel sil ajuste ses moyens aux ns quil se propose
270
de satisfaire, ce que lon peut r esumer en disant quun agent qui a lintention de faire P le fera sil en a la comp etence:
intention(A,P) et peutFaire(A,P) plusTard(Execute(A,P))
Nous verrons (cf. section 5.8) que Cohen et Levesque ont d evelopp e tout un attirail th eorique pr ecis ement pour comprendre et formaliser ce principe de rationalit e li e` a la notion dintention et de passage ` a lacte. Si la rationalit e sous-tend le travail dune large communaut e de chercheurs tant en IAD quen sciences cognitives, l ecole r eactive et, tout particuli` erement, l ecole r eactive europ eenne et sud-am ericaine (je devrais dire franco-chilienne) ce que lon appelle parfois la seconde cybern etique (Dupuy 1994) pr ef` ere, ` a la suite des travaux de von Foerster, expliquer le comportement dun agent ` a partir des notions dautonomie et de viabilit e. Etymologiquement, un syst` eme est dit autonome (auto-nomos) sil est r egi par les lois quil a lui-m eme edict ees. Pour H. Maturana et F. Varela, lautonomie a un sens pr ecis: un syst` eme est autonome sil est autopo etique, cest-` a-dire sil est constitu e dun ensemble de composants dont les transformations et les interactions ne cessent de reproduire lorganisation dont ils sont les composants (Maturana et Varela 1980; Varela 1989). Dans ce cas, le syst` eme d enit une cl oture op erationnelle entre lui et son environnement, entre ce qui reste invariant dans cette permanente op eration de r eg en eration (le syst` eme) et ce qui se transforme (lenvironnement). Bien que cette d enition nous s eduise totalement et sadapte id ealement au monde des organismes vivants, elle peut etre trop restrictive dans le cas de syst` emes multiagents dans lesquels les agents sont con cus articiellement et dont lindividualit e est donn ee par le concepteur. Par exemple, des robots mobiles peuvent etre autonomes, du fait de leur ind ependance en mati` ere d energie et de prise de d ecision, sans etre pour autant autopo etiques. Pour contourner cette dicult e, il est pr ef erable, comme lon fait F. Varela et P. Bourgine (Varela et Bourgine 1992), de consid erer lautonomie ` a partir du concept de viabilit e. Est viable un syst` eme dont la dynamique du syst` eme reste ` a lint erieur dun domaine de tol erances. Le comportement dun agent viable consiste donc ` a d eterminer une trajectoire dans lespace des congurations qui permettent ` a lagent de demeurer dans sa zone de viabilit e. Sil d epasse cette zone, si par exemple il ne r ecup` ere pas de l energie avant que son niveau minimum soit atteint, alors il perd ses capacit es autopo etiques: il meurt. Un agent doit donc tenter de rester dans cette zone de viabilit e en se nourrissant, en fuyant (ou en attaquant) les pr edateurs, en evitant les accidents et en accomplissant eventuellement les t aches fonctionnelles pour lesquelles il a et e con cu, et tout cela dans un environnement inconnu et impr evisible. Nous verrons ci-dessous que toutes les strat egies comportementales qui sont mises en uvre pour les agents r eactifs tendent vers cet objectif de viabilit e, ind ependamment donc de toute hypoth` ese de rationalit e.
` 5.5. LE SYSTEME CONATIF
271
5.5.2
Un mod` ele du syst` eme conatif
Le syst` eme conatif d etermine laction que lagent doit entreprendre en fonction des informations et des connaissance dont il dispose pour assurer une fonction tout en conservant son int egrit e structurelle et en faisant en sorte que lorganisation dont il fait partie conserve elle aussi son int egrit e structurelle. Ce probl` eme est parfois appel e dans la litt erature de lIA le probl` eme du contr ole (Bachimont 1992; HayesRoth et Collinot 1993) ou celui de la s election daction (Tyrrell 1993b). Les concepts cl es de notre mod` ele du syst` eme conatif sont les tendances, les motivations et les commandes, chacun ayant un cogniton associ e. En 1936, Albert Burloud (Burloud 1936) d eveloppe une th eorie du comportement psychologique qui prend la tendance comme point de d epart. Pour lui la tendance est une forme dynamique qui d etermine un acte, soit quelle le conduise et sinscrive en lui, soit quelle linspire et le nalise. En la distinguant de sa r ealisation physique et biologique, il pose la notion de tendance comme centrale pour la psychologie et lappr ehende comme un objet scientique. Pour notre mod` ele, nous reprendrons lid ee centrale de Burloud que tout comportement est le fruit dune combinaison et dune interaction de tendances, lesquelles sont les moteurs de lactivit e psychique et du passage ` a lacte. De plus, en tant que moteur de lactivit e, toute tendance est lexpression dun manque que lagent cherche ` a r eduire, ou comme le disent les philosophes comme une orientation psychique spontan ee dun individu vers une n. Par exemple, la faim est un manque de nourriture, le d esir de lautre sexprime comme un manque de lautre, r eel ou fantasm e, la peur est lanticipation dun manque d etre, etc. Ces manques ne sont pas seulement individuels, mais aussi interindividuels et sociaux. Lorsquun agent ne peut pas accomplir une t ache quil sest donn ee ` a faire et quil demande ` a un autre de laccomplir, alors il transmet par sa demande un manque que lautre tentera de r esoudre. Un agent satisfait, cest-` a-dire un agent sans manque, est un agent inactif, m eme si cette inaction sexprime parfois par le mouvement. Par exemple dans le syst` eme Manta (cf. chap. 7), les fourmis sont sensibles ` a des stimuli propag es par dautres agents en manque. En particulier, les larves lorsquelles ont faim propagent des stimuli qui sont consid er es comme des demandes par les ouvri` eres qui tentent de r eduire la faim de ces larves. Ces demandes se combinent ` a dautres motivations internes et externes des ouvri` eres pour constituer des tendances ` a agir, lesquelles entra neront, apr` es d elib eration, un comportement eectif des fourmis tendant ` a r eduire ces insatisfactions. Mais une fourmi qui ne re coit aucune demande et qui ne dispose daucune motivation interne pour agir accomplit un comportement el ementaire qui, dans le cas du syst` eme Manta, consiste ` a ce que la fourmi d eambule au hasard. Plus g en eralement la satisfaction se traduit par limmobilit e et linsatisfaction conduit au mouvement dirig e vers un but, des d es equilibres dans lhom eostasie du milieu ou dans la physiologie interne de lagent etant les moteurs internes des actions des agents. La source de laction r eside donc dans linsatisfaction des agents et dune mani` ere g en erale trouve son origine dans des d es equilibres individuels ou sociaux12 .
12 Cette th eorie ne doit pas etre g en eralis ee, outre mesure, ` a des agents naturels (animaux, humains, etc.). Elle permet simplement davoir une perspective g en erale sur les origines de laction
272
Outre les tendances qui poussent un agent ` a agir, il existe aussi dautres tendances qui tendent au contraire ` a limiter laction dun agent. Par exemple, les tabous et les normes sociales tendent ` a limiter le r epertoire des actions consid er ees comme convenables. Lorsquun policier indique ` a une voiture d ej` a stopp ee de rester immobile, son chaueur reconna t ce signe comme une invite ` a ne pas agir, et il elabore donc une tendance ` a rester en place qui viendra sopposer ` a la tendance de vouloir red emarrer. Mais cette tendance, quoique limitante peut elle aussi etre consid er ee comme r esultante dun manque ou de lanticipation dun manque: si le chaueur d emarre, il risque d etre arr et e par le policier et donc de recevoir une amende, ce qui lui procurera un manque de libert e. Dans ce cas, la tendance ` a ne pas red emarrer est obtenue par combinaison dun percept (le signe du policier) et dune norme sociale (linterpr etation du signe). D enition: On appellera tendances les cognitons qui poussent ou contraignent un agent ` a agir ou qui lemp echent dagir. Les tendances elles-m emes sont issues de combinaisons de motivations, cesta-dire de cognitons plus ` el ementaires (percepts, pulsions, normes, engagements, demandes sociales et interindividuelles) elabor ees dans le sous-syst` eme motivationnel du syst` eme conatif. Les tendances deviennent ainsi des pivots du syst` eme conatif et du passage ` a lacte. Par exemple, si un agent a faim et quil se trouve de la nourriture ` a proximit e, il va d evelopper la tendance de sapproprier cette nourriture. Cest donc la combinaison dune pulsion interne, la faim, et dune perception, la vue de la nourriture, qui provoquent son d esir et produisent sa tendance ` a agir. La forme de cette tendance r esultante d epend alors de son organisation interne. Sil sagit dun agent r eactif, cette tendance sexprimera comme un couple <faim, valeur> o` u la valeur indique lintensit e de la tendance de type faim et donc la propension ` a d eclencher la ou les actions associ ees ` a la qu ete de nourriture. Sil sagit dun agent cognitif, ce but pourra sexprimer sous la forme dune formule logique telle que Rassasi e(a) o` u a est lagent qui a faim. Dans ce cas, cette tendance sexprime comme un but initial, ou objectif, cest-` a-dire comme le point de d epart et le crit` ere de satisabilit e des plans que lagent a pourra elaborer pour satisfaire cet objectif. En fonction des croyances, des engagements, des plans et des contraintes dont il dispose, le sous-syst` eme d ecisionnel du syst` eme conatif evalue ces tendances, choisit les plus prioritaires et d etermine les moyens ` a mettre en uvre pour les satisfaire. Cette prise de d ecision d epend de la personnalit e des agents, comme nous le verrons ci-dessous, et conduit ` a d enir des priorit es dynamiques entre tendances. Le r esultat de cette d elib eration prend la forme dun ensemble de d ecisions qui sont ensuite transmises au syst` eme organisationnel pour quil ex ecute ces d ecisions et accomplissent les actions et les t aches correspondantes. Pour un agent cognitif, dans lequel les tendances sexpriment comme des buts, la prise de d ecision peut donner lieu ` a l elaboration de plans et ` a une d ecomposition de ces buts en sous-buts.
aussi bien pour des agents cognitifs que r eactifs. Les exemples qui sont donn es ici sont destin es ` a illustrer mon propos. Ils ne constituent en aucune mani` ere une th eorie psychologique humaine ou animale.
5.6. LES MOTIVATIONS: LES SOURCES DE LACTION

Normes Motivations (percepts interprts demandes inter-individuelles et sociales, engagements, pulsions) Buts a priori (fonction de l'agent) Systme Dcisionnel Tendances Dcisions et passage l'acte Dcisions
273
Systme motivationnel Elaboration des tendances
Vers les systmes reprsentationnels et organisationnels (engagements, plans, normes, hypothses, etc...)
Figure 5.9: Le syst` eme conatif est compos e de deux sous-syst` emes: le syst` eme motivationnel qui elabore les tendances ` a partir de motivations et le syst` eme d ecisionnel qui prend les d ecisions et engage les actions ` a accomplir. La gure 5.9 montre la structure g en erale du syst` eme conatif et sa d ecomposition en deux sous-syst` emes motivationnel et d ecisionnel. On voit que les tendances constituent le point dunion de ces deux sous-syst` emes.
5.6
Les motivations: les sources de laction
Les raisons qui poussent un agent ` a laction constituent ce que nous appellerons des motivations, lesquelles servent de mat eriau de base ` a la constitution des tendances. La faim qui pousse un agent ` a trouver de nouvelles ressources energ etiques ou une requ ete envoy ee par un autre agent pour lui demander de laider sont des exemples de motivations. Ces motivations existent en grand nombre et il serait difcile den donner une liste exhaustive. Mais en reprenant les quatre dimensions conceptuelles13 dun agent (personnelle, environnementale, sociale et relationnelle) d ecrites au chapitre 3, il est possible de les classer en quatre cat egories: les motivations personnelles, qui ont pour objet lagent et qui tendent ` a la satisfaction de ses besoins ou ` a lex ecution des engagements quil sest donn e` a lui-m eme, les motivations environnementales, produites par ce que per coit lagent, les motivations sociales ou d eontiques, qui ont trait aux demandes exprim ees par lorganisation de niveau sup erieur et par le concepteur, et enn les motivations relationnelles, qui d ependent des tendances des autres agents. Une source motivationnelle particuli` erement active se trouve dans les engagements. En promettant daccomplir une action pour autrui ou pour soi-m eme, lagent sengage ` a acquitter ses promesses, lesquelles deviennent des sources de motivation. Les engagements constituent ainsi des el ements de base pour la constitution des tendances au m eme titre que la faim ou le d esir sexuel. Ces engagements sont envoy es
13 Par d enition, la dimension physique nest pas conceptuelle et nest pas directement source de motivations. En revanche, cest le long de cette dimension que sont r ealis ees ces motivations.
274
par le syst` eme organisationnel et elabor es par le sous-syst` eme motivationnel sous forme de tendances ` a agir. Lagent est ainsi libre de suivre ou non ses engagements, puisque ceux-ci sexpriment comme des tendances sur lesquelles il est capable de d elib erer. On appellera lensemble des motivations li ees ` a des engagements, motivations contractuelles, et on les retrouvera dans les dimensions personnelles, sociales et relationnelles. Toutes ces motivations sont li ees et elles viennent se renforcer mutuellement. En vertu des principes h edonistes, si une action ne permet pas dapporter une plus grande satisfaction ou d eviter des d esagr ements, elle ne sera pas faite. De mani` ere r eciproque, une action ne sera accomplie que si elle se trouve en accord avec les normes de la soci et e dans laquelle se trouve lagent. On voit donc que les buts r esultent dun ensemble de motivations qui doivent trouver un compromis entre le principe de plaisir et celui de devoir, entre ce qui apporte du plaisir individuel et ce qui sert ` a lorganisation ` a laquelle il appartient. Le rapport entre pulsion et tendance est dautant plus complexe que lagent est complexe. Pour un agent r eactif simple, les tendances sont le r esultat dune combinaison de stimuli internes (que lon appelle potentiels daction sp ecique en ethologie) et de stimuli externes, les percepts. Pour des agents cognitifs plus elabor es, des m ecanismes de traitements peuvent intervenir pour combiner lensemble des motivations et produire des tendances de haut niveau.
5.6.1
Les motivations personnelles: plaisir et contraintes
Les motivations personnelles regroupent ` a la fois celles qui tendent ` a procurer ` a lagent un certain plaisir, et que lon appelle motivations h edonistes, et les motivations contractuelles personnelles qui rappellent ` a lagent les engagements quil a contract es avec lui-m eme et qui permettent la persistance des objectifs quil sest assign es. Les motivations h edonistes se trouvent ` a la base de tous les organismes vivants: la recherche de satisfaction, dun plaisir ou tout simplement dun certain bien- etre est ` a la base du comportement. Par exemple, rechercher de la nourriture, faire des v etements et des habitations, ou tenter de se reproduire sont des comportements li es a des besoins primaires qui sexpriment sous la forme de pulsions: faim, sensations ` de froid et dinconfort ou d esir sexuel. On appelle pulsion tout stimulus interne produit par le syst` eme v eg etatif et dont lagent ne peut se soustraire. De plus, linsatisfaction de ces pulsions peut avoir des cons equences f acheuses pour lagent et ses descendants. Par exemple, si les pulsions de faim ne sont pas satisfaites, lagent d ep erira et mourra, si les pulsions dinconfort et de s ecurit e ne sont pas assur ees, lagent risque de d ecliner et de dispara tre ` a cause des intemp eries et de ses pr edateurs, si les d esir sexuels ne sont pas assouvis, sa descendance ne sera pas assur ee. Les pulsions sont donc associ ees ` a des besoins el ementaires et sont les repr esentants psychiques des excitations issues du syst` eme conservatif et dune mani` ere g en erale des besoins physiques de lagent. Elles se transforment en tendances (et en objectifs pour les agents cognitifs) ` a partir des perceptions et des informations que lagent
275
re coit et des croyances dont il dispose. Les pulsions sont ` a la base de laction individuelle mais elles entrent en conit non seulement avec les motivations contractuelles, cest-` a-dire avec les engagements de lagent, mais aussi entre elles, du fait que les tendances et les buts quelles engendrent sont souvent contradictoires. Par exemple, pour quelquun qui fait attention ` a son apparence, vouloir etre mince est un but produit par la tendance ` a vouloir etre d esirable et ` a s eduire dautres personnes, lesquelles sont le r esultat de pulsions sexuelles. Mais ces buts sont en contradiction avec la tendance ` a consommer un bon plat ` a lancienne (et hypercalorique), lequel est produit par des pulsions de plaisir gustatif imm ediat. Le fait de satisfaire de pr ef erence des tendances ` a plus ou moins long termes constitue ce que lon pourrait appeler la personnalit e de lagent, et fait lobjet du sous-syst` eme d ecisionnel. Par exemple, un agent tr` es volontaire aura plus tendance ` a privil egier les tendances permettant dobtenir des satisfactions ` a long terme, alors quun agent plus veule satisfera plus volontiers les tendances permettant dassouvir ` a court terme ses pulsions, m eme si le r esultat global sav` ere moins satisfaisant dans le second cas que dans le premier. Les pulsions, en etant ` a la base du comportement des agents, rejoint certaines r eexions sur lagir humain en psychologie et en anthropologie. Par exemple, les tenants du fonctionnalisme en anthropologie et sociologie, proposent de comprendre la structure des soci et es ` a partir des besoins el ementaires qui doivent etre satisfaits (Malinowski 1944). Pour eux, le syst` eme de parent e ou la construction dabris sont des r eponses culturelles ` a des besoins el ementaires comme la reproduction ou le bien- etre corporel. Cette th eorie appara t parfois un peu simpliste, mais nul doute quune analyse k en etique un peu plus ne permettrait d elaborer une th eorie plus circonstanci ee et montrerait comment les actions des agents modient les r eponses a ces besoins ` el ementaires, et produisent des structures emergentes qui modient enti` erement le rapport entre ces besoins et les structures sociales qui en r esultent.
5.6.2
Les motivations environnementales: le d esir de lobjet
Les percepts sont dabord les motivations essentielles des actions r eexes: par d enition, un r eexe est une r eaction imm ediate ` a un stimulus externe. Ainsi, les actions situ ees que nous avons vu au chapitre 4 sont essentiellement des mises en uvre de relations entre perceptions et actions sans faire intervenir de tendances explicites interm ediaires. Dans ce cas, le syst` eme conatif se r eduit ` a une simple mise en correspondance de percepts et dactions pr e-programm ees, comme le montre la gure 5.10, et les tendances sont confondues avec les percepts. Le sous-syst` eme d ecisionnel se borne alors ` a ltrer les percepts et ` a d eclencher les actions associ ees. Mais limportance des percepts ne peut se r eduire aux r eexes. Ils viennent en g en eral pr eter main fortes aux autres motivations et, en particulier, aux motivations h edonistes, en renfor cant leur intensit e. Par exemple, m eme si je nai pas tr` es faim, la pr esence de nourriture peut n eanmoins d eclencher mon app etit et mon d esir de labsorber. Cest la pr esence des signes visuels et olfactifs de la nourriture qui d eclenche en fait le d esir dabsorption. Il y a donc renforcement entre les motivations internes de lindividu, ses pulsions, et les stimuli externes quil re coit,
276

Filtres Action1 Percepts Action2
Figure 5.10: Un syst` eme conatif compos e uniquement de r eexes se contente de relier les percepts aux actions. Les ltres s electionnent les percepts qui les concernent et d eclenchent les actions associ ees. les percepts. En ethologie, on parle depuis Lorenz de potentiel daction sp ecique pour d esigner la tendance ` a accomplir une action. Ce potentiel daction sp ecique doit etre consid er e comme une sorte de niveau qui tend ` a d eclencher une cha ne daction (xed action pattern). Cette derni` ere, que nous avons appel ee une t ache, est ampli ee ` a la fois par les pulsions (les excitations endog` enes sp eciques dans la terminologie des ethologues) et les stimuli environnementaux d eclencheurs, les percepts. La gure 5.11 repr esente le mod` ele dactivation de Lorenz (Lorenz 1984) tel quil la d eni lui-m eme et tel quon peut le red enir ` a laide de notations modernes. Lintensit e dune tendance, cest-` a-dire la propension ` a accomplir une action, est une fonction (croissante) de la force des stimuli externes (percepts) et de celle des stimuli internes (pulsions). Plus les stimuli externes sont forts, moins la pulsion interne a besoin d etre importante, et vice versa. La fonction de combinaison est additive chez Lorenz, mais beaucoup de mod` eles consid` erent quelle est multiplicative. Ce syst` eme motivationnel est ` a la base de la plupart des syst` emes conatifs des agents r eactifs, comme nous le verrons plus loin.
...
Actionk
5.6.3
Les motivation sociales: le poids de la soci et e
Dans les motivations d eontiques, qui sexpriment le long de la dimension sociale sous la forme de normes, on peut distinguer les demandes fonctionnelles des r` egles d eontiques. Les demandes fonctionnelles se trouvent etre les moteurs de la plupart des actions que lon eectue dans le cadre dun travail. Pourquoi le commercial prospecte-t-il des clients? Pourquoi le juge prononce-t-il sa sentence? Pourquoi le biblioth ecaire va-t-il ranger des livres? Pourquoi le boulanger p etrit-il sa p ate? Pourquoi la sage-femme aide-t-elle ` a mettre au monde des enfants? Pourquoi lociant c el` ebret-il les myst` eres de sa religion? Tout simplement pour assurer leur fonction au sein de la soci et e, compte tenu de leur position sociale, et donc jouer au mieux leur r ole (professionnel ou autre) et accomplir lensemble des t aches qui y sont associ ees. Ces motivations sont li ees, dans le cadre des soci et es humaines, ` a des raisons h edonistes, que les avantages (ou les d esagr ements) soient imm ediats ou lointains. Si on ne fait pas son travail, ou si on le fait mal, les d esagr ements suivront: diminution des prots, perte dun emploi et de moyens de subsistance, d econsid eration par

"Motivation Interne" Mcanisme Inn de Dclenchement (MID) Seuil de dclenchement
f Percepts Pulsions (a) (b)
(tir de [Drogoul 93])
277
Tendances
Stimulus Externe
Figure 5.11: Le mod` ele dactivation de Lorenz dans sa version originale (a) (dessin extrait de (Drogoul 93)) et red eni ` a laide de diagrammes syst emiques (b). Lintensit e de la tendance est fonction de la force des stimuli externes (les percepts) et de celle des stimuli internes (les pulsions). les autres, etc. Cependant ces motivations fonctionnelles ne peuvent se ramener totalement ` a des caract` eres h edonistes, car elles prennent en compte les besoins de la soci et ea ` laquelle lagent se trouve. Par exemple, bien que les t aches de classement de courrier dans une entreprise ne remplissent pas de bonheur celui qui les accomplit, elles sav` erent n ecessaires au bon fonctionnement de la soci et e et, indirectement, assurent ` a celui qui y travaille des moyens de subsistance. Dans un syst` eme multi-agent, les motivations individuelles sont parfois plus limit ees. Par exemple, une base de donn ee ne prend pas de plaisir ` a donner des informations: elle eectue ce travail uniquement par motivation fonctionnelle, parce quon la construite express ement pour accomplir ce type de t ache, la nalit e de son comportement se trouvant dans la t ete du concepteur. Comme le montre cet exemple, le mode fonctionnel travaille uniquement ` a partir de buts pr e etablis par le concepteur du syst` eme ou par la fonction que doit remplir lagent ` a lint erieur dune organisation. Si les motivations fonctionnelles proc` edent essentiellement en accomplissant des demandes provenant de lorganisation (ou du concepteur), les r` egles d eontiques sont li ees au devoir, cest-` a-dire aux interdits et aux id eaux quune soci et e impose ` a ses membres. Elles prennent souvent laspect de lois ou de r` eglements qui pr ecisent ce qui doit etre fait ou interdit et agissent comme des contraintes qui sopposent aux motivations h edonistes de lagent, en inhibant des actions avant quelles ne soient d ebut ees (ne pas voler) ou en cours de dex ecution (sarr eter ` a un feu rouge). Les raisons d eontiques pour un agent peuvent etre consid er ees comme des motivations h edonistes pour la soci et e` a laquelle il appartient. Par exemple, le fait de sarr eter au feu rouge est une contrainte au niveau de lindividu qui trouve sa justication dans lavantage social qui en r esulte, telle que la diminution daccidents. Ces normes peuvent comprendre la notion de peine, cest-` a-dire le fait quaccomplir une action interdite puisse comporter des cons equences d esagr eables. Dans ce cas, ces
278
normes sont alors renforcer par des raisons h edonistes qui incitent lagent ` a eviter les actions qui pourraient entra ner une p enalit e. Nous avons class e les raisons d eontiques et fonctionnelles dans la m eme classe de motivation parce quelles sont intrins` equement li ees: toutes les deux sont issues de la pression sociale qui agit soit en demandant, soit en interdisant daccomplir certaines actions. Le devoir sexprime comme un chemin vers un objectif provenant de la soci et e mais aussi comme une limite ` a lensemble des actions possibles. Mieux, il constitue un mod` ele qui transcende laction individuelle: la raison dun sacrie eectu e par devoir ne peut se trouver dans la satisfaction de lagent, mais bien par lensemble des comportements id ealis es qui sont la marque de valeurs morales elabor ees caract eristiques dune soci et e (ou dun groupe dindividus) (Durkheim 1897).
5.6.4
Les motivations relationnelles: la raison cest les autres
On appelle motivations relationnelles les motivations pour lesquelles le moteur de laction nest pas dans lagent mais dans les demandes et les inuences provenant des autres agents. Par exemple, si un agent A demande ` a un agent B de faire une action P, le but pour B de r ealiser P est une cons equence de la demande de A. B peut laccomplir pour diverses raisons: parce quil ne peut pas faire autrement (il ne sait pas dire non), parce quil existe une notion dautorit e et que A lui est hi erarchiquement sup erieur, parce que B a envie de faire plaisir ` a A, etc. Il sagit certainement de la motivation la plus importante des syst` emes multi-agents communicants, dans lesquels les agents coop` erent en senvoyant des messages. Comme nous le verrons plus loin dans la section qui traite des intentions (cf. section 5.8) et au chapitre 6 portant sur les communications, communiquer cest agir: la communication est assimil ee ` a une extension de laction individuelle, et demander ` a autrui de faire quelque chose nest pas vraiment di erent de se prier ` a soi-m eme de faire quelque chose. La di erence repose essentiellement sur le caract` ere dynamique des liens qui existent entre les agents et sur les relations existantes entre lagent demandeur et lagent sollicit e, ce dernier pouvant refuser de r epondre aux demandes du premier, m eme sil poss` ede toutes les qualit es requises pour les ex ecuter. Le probl` eme de lintentionnalit e, lorsquil y a interaction, repose alors sur la relation qui existe entre les intentions individuelles du demandeur, les intentions individuelles des r epondeurs, et les rapports qui les lient. Inversement, recevoir une demande pour accomplir un service tend ` a provoquer une insatisfaction interne et donc une tendance ` a agir. Cette action consistera ` a accepter ou ` a refuser la demande (voire eventuellement ` a fuir), mais dans tous les cas ` a r epondre ` a la demande originale. Les motivations relationnelles ne sont donc pas etrang` eres aux relations d eontiques: si lagent A est subordonn e` a lagent B, il sera oblig e deectuer ce que demande B du fait des normes et contraintes sociales impliqu ees par la relation de subordination entre A et B.
279
5.6.5
Les engagements: des motivations et contraintes relationnelles et sociales
Lengagement (committment) se pr esente comme lun des concepts cl es de laction collective dans le cas de syst` emes multi-agents cognitifs. En sengageant, un agent se lie par une promesse ou un contrat ` a eectuer une action dans le futur et donc a contraindre lensemble de ses comportements ` ` a venir. Par exemple, en prenant un rendez-vous, on promet dune part de se rendre au lieu dit ` a lheure indiqu ee par ce rendez-vous, mais on contraint aussi son emploi du temps en evitant de mettre un autre rendez-vous dans cette m eme plage horaire. Lorsquon sengage, laction promise est donc programm ee, et tout se passe comme si rien ne pouvait plus changer le comportement des agents. Dune mani` ere plus g en erale, lengagement est un syst` eme de d enition de liens sociaux par lesquels un groupe stabilise ses relations, pour favoriser lorganisation des actions. Tous les syst` emes sociaux humains sont fond es sur des structures dengagement relativement complexes. Quil sagisse de contrats, de conventions, de serments ou de promesses, que lon appelle cela responsabilit e, d elit e ou devoir, quils sexercent aupr` es de sa famille, des amis, des relations professionnelles ou m eme de lEtat tout entier, les engagements sont le fondement de laction collective. Ils construisent, par tout un r eseau de d ependances t enues, une certaine organisation sociale, dont m eme les soci et es apparemment les plus chaotiques et les plus violentes ne peuvent saranchir. Lengagement est en eet ce qui permet de r eduire limpr evisible de laction dautrui, ce qui permet danticiper sur le futur et donc de planier ses propres actions. Pour un commercial dune entreprise par exemple, cest parce quil sait que son coll` egue soccupera dun client quil pourra traiter une autre aaire. Caract eristiques des engagements Le concept dengagement pour les syst` emes multi-agents a et e initialement analys e en d etail par Alan Bond dans (Bond 1989) puis par Thierry Bouron dans (Bouron 1992). Tous deux d enissent les caract eristiques communes aux engagements. Nous reprendrons leurs r esultats danalyse que nous int egrerons ` a notre d enition pentadimensionnelle dun agent. Les formes dengagements Lobjet des engagements est variable car ils sappliquent ` a tous les aspects de la vie sociale des agents. On peut n eanmoins distinguer plusieurs cas de gure selon que les engagements portent sur la r ealisation dune action (je mengage ` a vous payer), sur larmation dune croyance (je vous assure que cest vrai), sur la r ealisation dun but (jai bien lintention daller en Colombie cet hiver), sur des conventions sociales (je mengage ` a accepter les r` eglements int erieurs de cette association) ou sur un r ole social (je mengage ` a faire tout ce qui est en mon pouvoir en tant que premier ministre). Ces di erentes sortes dengagement peuvent etre class ees selon lobjet de
280
leur engagement et la dimension syst emique dans laquelle seectue la relation entre agents. Engagements relationnels. Il sagit du type dengagement le plus fr equemment etudi es dans les syst` emes multi-agents. Un agent sengage envers autrui soit ` a accomplir une action (ou essayer de satisfaire un but sachant quun but peut etre d eni comme la condition daccomplissement dune action), soit sur la validit e dune information. Lengagement daccomplir une action X par un agent A aupr` es dun agent B sexprime comme une relation du couple < A, X > vers B, ce que lon peut exprimer par engagerFaire(X,A,B) De m eme lorsquun agent A donne une information ` a un autre agent et si lon suppose quil est sinc` ere, lagent A sengage aupr` es de B sur la validit e de cette information. De mani` ere semblable ` a la pr ec edente, on notera engagerInfo(P,A,B) lengagement de lagent A aupr` es de B quant ` a la validit e de linformation P, ce qui suppose que A croit ` a P et dautre part quil a comme but le fait que B croit lui aussi ` a P. Tout ce que nous dirons par la suite sur les engagements portant sur des t aches pourra etre transpos e mutas mutandis aux engagements portant sur des transferts dinformation. Engagements environnementaux. Il sagit de lengagement envers les ressources. Par exemple, la prise de conscience ecologique est une forme dengagement environnemental, puisquil sagit daccomplir des actions qui ne nous lient plus directement aux autres, mais ` a notre milieu naturel. Engagements envers le groupe social. Il existe deux formes dengagement li ees au groupe social. La premi` ere consiste ` a promettre daccomplir une t ache pour le groupe. Ce type dengagement est semblable ` a lengagement relationnel, ` a la di erence pr` es que lengagement se rapporte alors ` a un groupe et non plus a un agent. On notera par ` engagerFaireGr(X,A,G) le fait que lagent A sengage ` a accomplir laction X aupr` es du groupe (ou de lorganisation) G. La deuxi` eme forme porte sur lengagement envers des conventions sociales et sur lacceptation des contraintes associ ees a ` un r ole dans une organisation. Prendre une charge dans une association, ou obtenir un poste dans une entreprise, cest sengager envers le groupe social (lassociation, lentreprise) pour accomplir toutes les t aches associ ees ` a cette charge ou ` a ce poste. Soit R un r ole et G un groupe, lengagement ` a un r ole se d enit formellement ainsi: engagerR^ ole(A,R) =def x T^ aches(R), engagerFaireGr(X,A,G) Engagement des organisations envers ses membres. Bien que lon ne puisse parler que de mani` ere m etaphorique de lengagement dun agent envers ses composants physiques, il nen est pas de m eme pour les organisations qui
281
sengagent ` a satisfaire les besoins des agents qui en sont membres: une entreprise, par exemple, sengage eectivement ` a payer ses salari es. Il sagit donc dun type dengagement inverse du type pr ec edent puisque cest le groupe qui sengage envers ses membres, ce que lon peut noter formellement de la mani` ere suivante: membreDe(A,G) =def x obligations(G), engagerFaireOrg(X,G,A) o` u engagerFaireOrg(X,G,A) indique quune organisation G sengage aupr` es de lagent A ` a faire la t ache X. Engagements envers soi-m eme. De m eme quil est possible de sengager envers autrui, un agent peut sengager envers soi-m eme ` a accomplir une action. Par exemple, on sengage individuellement ` a apporter ` a son corps la nourriture dont il a besoin. De m eme une bonne r esolution que lon prend en d ebut dann ee correspond ` a un engagement envers soi-m eme. On notera par engagerFaire(X,A,A) lengagement que prend lagent A envers soi-m eme ` a accomplir laction X. Lengagement comme structuration de laction collective Il sagit peut- etre de la caract eristique principale de cette notion: les engagements ne sont pas isol es mais forment une structure de d ependance qui peut sexprimer ainsi: si A sest engag e aupr` es de B pour eectuer laction X, B sest peut- etre aussi engag e aupr` es de C pour laction Y, en sachant que Y d epend de X. Cest ce qui arrive quotidiennement dans le monde industriel: la r ealisation dune voiture par exemple d epend du bon approvisionnement des pi` eces d etach ees et donc dactions eectu ees par les sous-traitants et les transporteurs. Les sous-traitants eux-m emes ont des fournisseurs qui se sont engag es aupr` es deux pour leur livrer ` a temps la mati` ere premi` ere dont ils ont besoin. Certaines t aches de B d ependent de lengagement de A. Si lon note < B , Y > < A, X > pour indiquer quil existe une t ache Y de B qui d epend de la r ealisation de X par A, cette relation forme un graphe de d ependance comme le montre la gure 5.12.
<A, X1> <B, Y1> <A, X2> <D, S1> <B, Y2> <C, Z2> <C, Z1>
Figure 5.12: Graphe de d ependance entre t aches Cette gure montre les di erentes formes de d ependances entre t aches. Certaines t aches (par exemple < A, X2 >) sont d ependantes dautres t aches r ealis ees par le
282
m eme agent (par exemple < A, X1 >). Une t ache peut d ependre directement de plusieurs autres, et on parle alors de d ependance multiple. Par exemple la t ache Y1 de B d epend de la r ealisation de la t ache X2 de A et de S1 de D. On voit aussi sur la gure quil existe des m ecanismes de d ependance complexes. Par exemple la r ealisation de la t ache Y2 de B d epend directement de Z2 de C et donc indirectement de Y1 de B. Cette structure est int eressante car elle montre quun agent peut prendre des engagements envers soi-m eme. Lorsque A d esire accomplir X2 il prend lengagement de faire X1, ce qui impose ` a A davoir lintention de faire X1. De la m eme mani` ere, il est possible dintroduire les engagements concernant les informations sur ce graphe de d ependances, certaines t aches d ependant de la validit e dinformations et, inversement, des informations d ependant de laccomplissement de certaines t aches. Par exemple, comme nous lavons vu pour les croyances, le fait daller faire du ski d epend de la validit e de linformation le niveau de neige est susant pour skier. Un autre exemple est donn e par les t aches de calcul caract eris ees par les informations quelles produisent comme r esultats ` a partir des informations qui leur sont fournies en entr ee. Souvent ces informations en sortie sont lentr ees dautres t aches qui d ependent des premi` eres. Par exemple, pour un gestionnaire, la prise de d ecision consistant ` a savoir sil doit ou non investir d epend dun ensemble de param` etres et en particulier de l etat de ses comptes obtenus comme r esultat dune t ache de calcul de son comptable. Les graphes de d ependances peuvent contenir des cycles, mais dans ce cas, ils ne peuvent etre ex ecut es: les t aches d ependant les unes des autres sont bloqu ees par une etreinte fatale (deadlock), probl` eme bien connu en informatique des processus concurrents. Seuls les graphes corrects, cest-` a-dire les graphes de d ependance sans cycle, sont donc ex ecutables sans blocage. Ce probl` eme des etreintes fatales a et e tr` es etudi e pour la r ealisation de syst` emes distribu es. Lengagement comme moteur de laction Lengagement est ` a la source dun grand nombre de cons equences pour un agent. Sengager ` a faire quelque chose, cest ` a la fois faire la promesse ` a autrui que lon va eectuer une t ache, mais cest aussi sengager envers soi-m eme ` a la faire, cesta-dire, si lon est sinc` ` ere, ` a avoir r eellement lintention de laccomplir. On pourra noter cette d ependance entre engagement et intention de la mani` ere suivante: engagerFaire(X,A,B) engagerFaire(X,A,A) intention(A,X) De la m eme mani` ere les engagements entre un agent et une organisation lient eectivement les intentions de lagent. engagerFaireGr(X,A,B) engagerFaire(X,A,A) intention(A,X) Cela signie donc qu` a tout engagement envers autrui correspond un engagement envers soi-m eme.
5.6. LES MOTIVATIONS: LES SOURCES DE LACTION Contraintes sur les ressources et coh erence des engagements
283
Les engagements imposent des contraintes non seulement sur lintention des agents mais aussi sur les ressources utilis ees pour accomplir leurs t aches. Si un agent sengage ` a eectuer une t ache X qui consomme des ressources, il limite en m eme temps la possibilit e pour les autres agents et pour lui-m eme deectuer des t aches utilisant les m eme ressources au m eme moment. Du fait de ces contraintes, certains engagements sont contradictoires. Par exemple, il est contradictoire de prendre lengagement daller chez le dentiste ` a une date et une heure donn ee et en m eme temps de prendre un rendez-vous daaire avec un client. Lun des int er ets des engagements etant de pouvoir pr evoir et dordonner les t aches ` a eectuer, il est parfois possible de d etecter ` a lavance ces contradictions locales avant que la situation se produise (cf. chap. 8). Dans les syst` emes multi-agents, on suppose que les agents cognitifs sont coh erents localement en ne prenant pas dengagements contradictoires. Cela ne signie pas pour autant que les engagements soient irr evocables. Il est tout ` a fait naturel quun agent puisse revenir sur sa d ecision ` a condition quil en informe les agents aupr` es desquels il sest engag e. Par exemple, si lon estime que le fait daller chez le dentiste est prioritaire devant le rendez-vous daaire, on cherchera ` a remettre celui-ci en informant le client de cette modication de laccord, ce qui revient ` a rompre le premier engagement pour en prendre un second. Validit e et persistance des engagements Les engagements sont persistants, cest-` a-dire quils perdurent jusqu` a ce quune des deux conditions suivantes soit remplie: 1. Lobjet de la promesse a et e accomplie. 2. Lagent rompt laccord portant sur lengagement. La seconde gure intervient si lagent ne peut plus remplir son engagement, soit parce quil nen a plus les possibilit es lui-m eme, soit parce quil d epend dautres engagements et que les agents dont il d epend lui ont fait d efaut. La possibilit e quun engagement soit rompu fait partie de la notion dengagement. De ce fait, sengager a faire quelque chose cest aussi sengager ` ` a pr evenir lautre lorsque lengagement nest plus possible. engager(<A,X>,B) [finalt(peutFaire(A,X) informer(A,B,peutFaire(A,X))] De la m eme mani` ere, lorsquun agent A sengage en donnant une information valide P` a un autre agent, il promet en m eme temps de lui indiquer lorsque linformation P ne sera plus valide. On peut d ecrire formellement cette caract eristique de la mani` ere suivante: engagerFait(<A,P>,B) =def croire(A,P) but(A,[croire(B,P) finalt(croire(A,P) informer(A, B,P))])
284
Les ruptures dengagements peuvent avoir un eet boule de neige et entra ner dautres r esiliation. La constitution dune autre structure d equilibre pose un probl` eme complexe de d etermination dun consensus dans un syst` eme de contraintes distribu ees. Importance des engagements Il faut retenir que les engagements sont des structures absolument indispensables pour le travail collectif dans le cas dagents cognitifs capables danticiper sur lavenir. Ils assurent une certaine stabilit e au monde, en apportant aux agents une certaine conance sur le comportement des autres agents et une repr esentation stable du monde. En eet, si les agents ne prenaient pas dengagement, il leur serait impossible davoir une repr esentation ad equate dun etat futur du monde et donc de planier leurs propres actions en anticipant sur lavenir. Sans engagement, les agents cognitifs se retrouveraient dans le cas dagents r eactifs qui ne peuvent prendre en compte que la situation pr esente. La notion dengagement est donc le corr elat indispensable ` a la possibilit e davoir des agents cognitifs disposant ` a la fois de capacit es danticipation et dun certain libre arbitre dans leur facult e de d ecisions. Les engagements donnent souvent lieu a l ` etablissement de contrats entre deux agents, cest-` a-dire de d enition claire et pr ecise pour chacune des deux parties des engagements auxquels elles se soumettent. Ces contrats r esultent souvent dun m ecanisme dallocation de t ache comme nous le verrons au chapitre 7.
5.7
Le passage ` a lacte r eactif
La deuxi` eme partie dun acte individuel r eside dans la d ecision et le passage ` a lacte. Cette phase de laction, qui seectue dans ce que nous avons appel e le sous-syst` eme d ecisionnel, consiste ` a d eterminer dans lensemble des tendances, lesquelles vont passer de la puissance ` a lacte et donner lieu ` a la commande eective dune action. De nombreux syst` emes peuvent etre imagin es. On peut distinguer ceux qui ne prennent en compte que l etat pr esent, en agissant ` a partir dinformations dont ils disposent dans lici et le maintenant, de ceux qui d ecident de laction en se projetant dans le futur et en evaluant les cons equences possibles de laction, quitte ` a r eorganiser les buts. On appellera les premiers des passages ` a lacte r eactifs, et les seconds des passages ` a lacte intentionnels (ou cognitifs). Nous etudierons ces derniers dans la section 5.8, nous consacrant pour linstant ` a l etude du passage ` a lacte r eactif. La notion de passage ` a lacte r eactif se confond parfois avec celle de comportement r eactif, les notions de motivations et de d ecision etant intrins` equement li ees pour ces agents. N eanmoins, le probl` eme du passage ` a lacte et de lorganisation des actions dans des syst` emes r eactifs est susamment importante pour que de nombreux chercheurs se soient pench es sur la question. On le rencontre souvent dans la litt erature sous le terme de probl` eme de la s election daction (action selection problem). Le probl` eme est le suivant: ayant d eni un r epertoire dactions, comment mettre en uvre ces actions dans un ordre pertinent, compte tenu de lensemble
` LACTE REACTIF 5.7. LE PASSAGE A
285
des stimuli externes et internes auxquels sont soumis les agents? Nous avons vu dans la section portant sur les motivations environnementales comment ces deux sortes de stimuli se renforcent mutuellement pour constituer des tendances ` a agir. Le probl` eme de la s election daction se situe juste ensuite: comment utiliser ces tendances pour organiser le comportement de lagent? La litt erature sur ce sujet propose un grand nombre de mod` eles qui ne sont pas sans rapport avec les mod` eles pr esent es par des ethologues. Dans ce domaine dailleurs les collaborations entre informaticiens/roboticiens et ethologues/physiologistes, qui sont des plus f econdes, ne font que sintensier. Il sut de lire les articles publi es lors des conf erences sur la Simulation of Adaptive Behavior: From Animals to Animats (Meyer et Guillot 1989; Meyer et al. 1993; Meyer et Wilson 1991) pour sen persuader.
5.7.1
Actes consommatoires et comportements app etitifs
Toutes les actions nont pas exactement le m eme impact sur un agent r eactif. On distingue g en eralement les actions de consommation des comportements app etitifs. Les premi` eres visent ` a d echarger une tendance alors que les seconds sappliquent a la phase active dun comportement de recherche dun but. Par exemple, dans ` le cas de la prise de nourriture, si lacte consommatoire est manger, le comportement app etitif sera chercher de la nourriture. On constate de ce fait, que g en eralement lacte consommatoire vient nir un comportement app etitif, et cest pourquoi on lappelle souvent action nale. Lint er et de cette distinction vient de ce que la phase dapp etence peut se produire en labsence de stimuli environnementaux alors que les actes consommatoires d ependent enti` erement de la pr esence des stimuli correspondant dans lenvironnement qui agissent comme des sortes de pr econditions. En eet, on ne peut pas manger sil ny a pas de nourriture, alors quon peut aller chercher de la nourriture en son absence. Les comportements app etitifs ne sont donc dirig es que par des motivations internes (des pulsions dans notre terminologie). A la limite des comportements app etitifs et des actes consommatoires se situent les taxies, cest-` a-dire les comportements qui orientent et d eplacent un animal pour quil se dirige vers (ou fuit) une source de stimulation. Les taxies, lorsquil sagit de se rapprocher dun but, constituent souvent le cha non entre le comportement app etitif et lacte consommatoire nal. Par exemple, si, dans sa phase dapp etence, lagent per coit de la nourriture, il se dirigera vers elle par un comportement de taxie avant de nalement la consommer. Les taxies utilisent souvent des m ecanismes de suivi de gradient pour atteindre leur but (cf. section 4.5). La gure 5.13 repr esente un comportement type dun agent r eactif ayant pour but la d echarge dune pulsion interne. Chaque phase comportementale est conditionn ee par un crit` ere de d eclenchement: pour que le comportement app etitif ait lieu, il faut que lagent ait un niveau pulsionnel elev e. La taxie doit eectivement percevoir la nourriture et lacte consommatoire pour etre ` a m eme de prendre cette nourriture. Le r esultat dune telle cha ne comportementale conduit ` a la diminution de la motivation qui la engendr ee. Ce type de comportement nest pas seulement lapanage des animaux ou des agents simulant des animaux (les animats de Meyer et Wilson (Meyer et Guillot
286
Comportement apptitif ex: chercher nourriture Condition: motivation (faim) leve

Taxie ex: aller vers nourriture (suivre gradient) Condition: percevoir nourriture Acte consommatoire ex: manger Condition: tre porte de nourriture Rsultat: motivation (faim) faible
Figure 5.13: Une t ache ou cha ne comportementale type ayant pour but de d echarger une motivation interne (par exemple la faim) chez un agent r eactif. 1989). Ils sont la base m eme du comportement des agents r eactifs. Par exemple, les robots explorateurs suivent un tel sch ema: dabord une phase exploratoire pour chercher le minerai, puis une phase dapproche conduisant au minerai et enn la phase consommatoire qui conduit lagent ` a prendre le minerai et a retourner ` ` a la base.
5.7.2
Modes de s election et de contr ole des actions
Le probl` eme de la prise de d ecision pour un agent r eactif, cest-` a-dire celui de laction a s ` electionner, se pose de plusieurs mani` eres: 1. Que faire lorsque plusieurs cha nes comportementales comme celle que nous venons de voir sont en comp etition? Par exemple, si lagent doit choisir entre manger, boire ou copuler. 2. Que faire lorsque lagent ressent plusieurs pulsions di erentes et quil re coit tout un ensemble de stimuli? En particulier, que faire si, alors quil recherche de la nourriture, il per coit un cong en` ere agr eable avec lequel il pourrait saccoupler? 3. Enn, comment prendre en compte des conditions environnementales nouvelles qui sont susceptibles de mettre en cause lint egrit e de lagent ou qui lemp echent de satisfaire son but, telles que la pr esence dun pr edateur ou dun obstacle? An de r epondre ` a ces questions, T. Tyrrell (Tyrrell 1993b) et G. Werner (Werner 1994) ont d eni un certain nombre de crit` eres quun bon mod` ele de s election daction doit pouvoir garantir, dont voici les principaux. Un bon mod` ele doit: 1. Etre susamment g en eral pour r epondre de la m eme mani` ere ` a tous les probl` emes pos es, et donc eviter les mod` eles ad hoc. 2. Montrer une certaine persistance dans les actes consommatoires pour eviter ` a lagent de tergiverser sans arr et, lemp echer par exemple de prendre un peu de nourriture, puis un peu deau, puis un peu de nourriture, etc. d epensant alors plus d energie ` a aller dun point ` a un autre qu` a se rassasier. Pour eviter ce probl` eme, il sut de donner aux stimuli externes une intensit e qui d epende de la distance de lagent ` a lobjet quil convoite.
287
3. Trier en fonction des motivations: plus un agent a faim, plus il doit avoir tendance ` a d eclencher une cha ne dactions lui permettant dassouvir cette faim. 4. Pr ef erer les actions consommatoires aux app etitives. Ce nest pas la peine daller chercher ailleurs ce que lon a d ej` a sous la main. 5. Favoriser laccomplissement de cha nes dactions et eviter des comportements trop lunatiques dans lesquels un agent narr ete pas de commencer une cha ne dactions et narrive jamais ` a en terminer une. 6. Interrompre une action si une situation nouvelle met en p eril lagent (pr edateur ou danger) ou si laction sav` ere manifestement impossible ` a accomplir (obstacle). 7. Montrer un certain opportunisme et pouvoir accomplir des actes consommatoires qui ne sont pas n ecessairement reli es ` a la cha ne dactions (` a la t ache) courante. 8. Utiliser toutes les informations disponibles pour exhiber le comportement le plus adapt e ` a la situation. Par exemple, lagent doit eviter daller vers une source de nourriture si un pr edateur se trouve ` a c ot e. 9. Permettre laccomplissement de plusieurs actions en parall` ele, tel que fuir en envoyant un signal de d etresse. 10. Etre facilement extensible pour permettre au concepteur dajouter de nouvelles actions et de nouvelles cha nes dactions ` a son r epertoire. 11. Evoluer par apprentissage, en modiant eventuellement les choix de mani` ere plus appropri ee avec lexp erience. Certains de ces crit` eres peuvent sembler contradictoires: vouloir ` a la fois que lagent soit capable de persister dans ses actions, de sinterrompre et de faire montre dopportunisme semble dicile ` a r ealiser dans un m eme syst` eme. Mais de nombreux mod` eles permettent, dans une certaine mesure, de satisfaire la plupart dentre eux. Actions situ ees et champs de potentiels Le premier de ces mod` eles est celui des actions situ ees que nous avons etudi e au chapitre 4. Il se compose dun ensemble de r` egles qui relient une action ` a une situation. Bien que ce mod` ele ait surtout tendance ` a valoriser les conditions environnementales, il est possible dy adjoindre des param` etres correspondant ` a des etats internes et ainsi de d enir la situation courante comme un couple <conditions environnementales, etat interne >
288
Le syst` eme Able de D. Connah et P. Wavish fonctionne de cette mani` ere (Wavish et Connah 1990). Il est susamment souple pour faire op erer plusieurs agents ensembles. Il peut traiter des situations relativement complexes comme celle qui consiste, pour un chien de berger (simul e), ` a faire entrer des moutons dans un enclos (Wavish 1992). N eanmoins, les actions situ ees sourent de nombreux maux: il leur est dicile de faire montre dune v eritable pers ev erance (sauf ` a programmer quelques m ecanismes de mani` ere ad hoc, mais cela condamne alors lextensibilit e du syst` eme), et sils savent se montrer tr` es opportunistes, il leur est dicile de savoir prendre des d ecisions fond ees sur des poids. Il est tr` es compliqu e de programmer un agent ` a laide dactions situ ees pour lui faire eectuer plusieurs t aches di erentes. De ce fait, les actions situ ees ne sont pas consid er ees comme de bons mod` eles de s election daction. Lusage de champs de potentiels, comme ceux que nous avons examin es au chapitre 4, peut r esoudre un certain nombre de probl` emes. En tenant compte de la distance de lagent ` a la source des stimuli, ces champs donnent ` a lagent une certaine persistance dans ses activit es consommatoires. De plus, ils lui permettent de tenir compte de nouvelles informations, d etre opportuniste et de traiter plusieurs actions en parall` ele. Par exemple, dans le syst` eme Pengi que nous avions pr esent e au chapitre 4, le pingouin peut ` a la fois fuir les abeilles et aller chercher des diamants, tout en gobant de mani` ere tr` es opportuniste les nouveaux diamants qui se trouvent sur son chemin. Pour tenir compte des motivations internes, il sut de consid erer que lintensit e dun signal est multipli e par un facteur d ependant de ces motivations. N eanmoins, les champs de potentiels, en etant tr` es li es ` a lenvironnement ne peuvent pas toujours traiter tous les probl` emes de s election de cha nes dactions, et il est parfois n ecessaire dintroduire dautres m ecanismes pour conduire un comportement ecace, tels que ceux que nous verrons par la suite. N eanmoins, il pr esentent de nombreuses qualit es int eressantes pour la conduite de comportements dynamiques multiples, et nous les reverrons associ es ` a dautres syst` emes de s election de t aches. Mod` eles hi erarchiques De nombreux mod` eles se sont inspir es des travaux en ethologie pour impl ementer des mod` eles ecaces de s election daction. Les plus etudi es reposent sur une approche hi erarchique du comportement, dans laquelle des comportements de haut niveau sont d ecompos es en actions de bas niveau. Le plus c el` ebre de ces mod` eles est d u` a un ethologue eminent, prix Nobel de surcro t, N. Tinbergen (Tinbergen 1951). Dans celui-ci, lorganisation du comportement est donn ee sous la forme dune hi erarchie de nuds. A chacun de ces nuds, qui se comportent comme des sortes des neurones formels, est li e un m ecanisme inn e de d eclenchement (MID), sorte de pr econdition pour lactivation du nud. Le d eclenchement des nuds seectue par la combinaison de stimuli provenant de lext erieur et des nuds hi erarchiquement sup erieurs. Lorsque la somme des stimuli a erents aux nuds d epasse un certain seuil, le nud est lib er e et son energie dactivation est transmise aux nuds de niveau inf erieur. Les nuds sup erieurs correspondent ` a des

niveau suprieur: instincts majeurs (ex: migration printanire) hormones
289
Facteurs internes et externes 1er niveau: apptence (ex: recherche de territoire, reproduction) MID
Inhibition rciproque Seuil de dclenchement
2me niveau: apptence (ex: recherche de territoire, combat)
3me niveau: actes consommatoires ractions instinctives
niveaux des coordinations motrices neurophysiologiques
Figure 5.14: Le syst` eme hi erarchique des instincts de N. Tinbergen
activit es g en erales telles que reproduction ou nettoyage, et plus on descend, plus les nuds soccupent dactions de bas niveau, allant m eme jusqu` a d eclencher les muscles (g. 5.14). Chaque nud dun niveau est en conit avec les autres nuds du m eme niveau: si lun deux est activ e, alors les autres sont inhib es. Ce mod` ele est int eressant par son aspect p edagogique et explicatif mais il na jamais et e con cu en vue dune impl ementation informatique ou robotique. De toute fa con, les mod` eles hi erarchiques, en donnant trop dimportance aux pulsions (aux stimuli internes), emp echent les r eactions opportunistes et ne permettent pratiquement pas ` a une cha ne dactions de sinterrompre. En dautres termes, lagent est alors trop concentr e sur ses buts, trop sourd aux stimuli environnementaux. Cest pourquoi certains auteurs, tels que Rosenblatt et Payton (Rosenblatt et Payton 1989) et Tyrrell (Tyrrell 1993b), ont propos e dautres mod` eles qui sont a la fois hi ` erarchiques dans la structure, mais non hi erarchiques dans la prise de d ecision. Ces mod` eles sont fond es sur ce quils appellent des hi erarchies ` a ux libre (free-ow hierarchies), dans lesquelles les nuds sup erieurs ne d ecident pas des nuds inf erieurs ` a activer, mais d enissent simplement des pr ef erences sur un ensemble de candidats de plus bas niveau. A partir du mod` ele initial de Rosenblatt et Payton, Tyrrell en a adapt e un autre quil a mis en comp etition avec dautres mod` eles daction quil a test es dans un monde dans lequel un agent doit accomplir un certain nombre de t aches pour survivre, telles que manger, boire, echapper aux pr edateurs et se reproduire (Tyrrell 1993a). La gure 5.15 montre la structure dun
290
tel mod` ele pour la t ache de recherche de nourriture. On peut voir que le ux des activations descend des niveaux sup erieurs vers les niveaux inf erieurs, mais sans que ces derniers ne soient en opposition. Ce nest quau niveau inf erieur quun m ecanisme de s election choisit laction ayant la valeur dactivation la plus grande.
Faim
chercher nourriture
Manger
approcher nourriture (taxie)
retrouver nourriture perue
Fruit
Lgende Manger Fruit aller gauche aller tout droit aller droite
Stimulus
Action
TD
TD
percevoir nourriture
souvenir nourriture
Figure 5.15: Le mod` ele de Rosenblatt et Payton pour la t ache de recherche de nourriture M eme sil sagit dun mod` ele qui demande de tr` es importantes mises au point pour faire en sorte que les comportements app etitifs ne viennent pas totalement dominer les actions consommatoires, il est, dapr` es Tyrrell, celui qui pr esente les meilleures qualit es par rapport ` a des mod` eles purement hi erarchiques ou m eme des mod` eles ascendant comme celui de P. Maes. Mod` eles ascendants En prenant totalement le contre-pied des syst` emes hi erarchiques, dautres auteurs tentent de trouver une voie qui passe par l elimination totale de toute organisation dans laquelle toute forme de dominance puisse exister. Cest le cas en particulier de lapproche choisie par P. Maes avec son syst` eme ANA (Maes 1991; Maes 1992) qui tient ` a la fois du r eseau de neurones, de lapproche multi-agent de Minsky et du mod` ele des t aches comp etitives. Le mod` ele ANA est compos e dun r eseau de modules, chacun correspondant ` a une action el ementaire, telle que aller-vers-nourriture, boire-eau, fuir-creature, etc. Chaque action est d ecrite par ses conditions dapplication, son niveau dactivation, les liens quelle a etablis avec ses pr ed ecesseurs, ses successeurs et les actions avec lesquelles elle se trouve en opposition:
` LACTE REACTIF 5.7. LE PASSAGE A T^ ache aller-vers-cr eature niveau dactivation: 56.3 conditions: (cr eature-per cue) successeurs: combattre pr ed ecesseurs: explorer oppos ees: fuir-cr eature code: le code des commandes ` a ex ecuter
291
Le r eseau dun tel syst` eme est repr esent e` a la gure 5.16. Les stimuli environnementaux et les motivations internes (peur, fatigue, agression, faim, soif, curiosit e) tendent ` a activer certaines actions en elevant leur niveau dactivation. Laction ayant le plus fort niveau dactivation est s electionn ee, et ses successeurs voient leur niveau dactivation l eg` erement augment e, ce qui augmente leur chance de s election.
peur viter-obstacle agressivit curiosit explorer fuir-crature aller-vers-nourriture aller-vers-eau dormir boire soif fatigue manger faim successeurs opposes motivations aller-vers-crature combattre
peur
Figure 5.16: Le r eseau dactivation des t aches du syst` eme ANA de P. Maes Ce syst` eme tend ` a d egager les actions app etitives des actions consommatoires: les premi` eres ne sont li ees ` a aucun stimuli interne, alors que les secondes le sont. Les liens successeurs qui existent entre elles sont constitu es et renforc es chaque fois quun acte consommatoire suit une action app etitive. Tyrrell a test e le syst` eme de P. Maes dans son environnement simul e (Tyrrell 1993a) et il a constat e quil navait pas de tr` es bonnes performances lorsque le r eseau etait tr` es important. Ce ph enom` ene est d u essentiellement ` a des probl` emes de choix entre actions consommatoires ou app etitives, ` a la dicult e de bien prendre en compte les buts multiples et tout simplement ` a lembarras quil y a ` a choisir entre de nombreuses actions candidates. Il semblerait donc quune certaine structure soit n ecessaire pour assurer une bonne s election daction. N eanmoins, en reprenant une technique assez neuronale, G. Werner (Werner 1994) propose une d emarche qui, dapr` es lui, poss` ede tous les avantages de la m ethode de Rosenblatt et Payton, sans reposer sur une approche hi erarchique, et qui, en plus, donne la possibilit e dex ecuter plusieurs actions simultan ees ind ependantes. Son mod` ele repose en fait sur une simple combinaison multiplicative des motivations internes et externes, en reprenant donc le m ecanisme motivationnel que
292
nous avions vu plus haut (section 5.6.2). Il comprend quatre ensembles de nuds: les nuds dentr ee qui sont connect es ` a des types de percepts relatifs ` a lagent (nourriture-` a-droite, pr edateur-devant, etc.) ainsi quaux pulsions (faim, soif,...), les nuds de sortie qui commandent des actions el ementaires (aller-` a-droite, aller-` agauche,...), des nuds correspondant ` a une couche cach ee (mais qui nest pas utilis ee dans les exemples pr esent es), et surtout un ensemble de nuds qui repr esentent ce que Werner appelle des commandes et qui ressemblent en fait ` a ce que nous avons appel e des tendances, cest-` a-dire des propensions ` a eectuer une action plut ot quune autre. Ces commandes sont utilis ees comme des coefcients qui interviennent de mani` ere multiplicatives dans les connexions qui relient les neurones dentr ee aux neurones de sortie (g. 5.17). De ce fait, plus un agent a faim, plus il a tendance ` a se diriger vers la nourriture. N eanmoins, sil y a de leau tr` es proche et quil a un peu soif, il se dirigera dabord vers leau si le produit du stimulus externe provenant de la pr esence deau avec la pulsion de soif est sup erieure ` a celle du produit du stimulus de la nourriture (qui est situ ee plus loin) avec celle de lenvie davoir de la nourriture. Cela montre que le comportement de lagent est ` a la fois pers ev erant (il ne change pas davis si sa pulsion est susamment forte) et opportuniste (si un stimulus externe est susamment puissant, il essayera de le satisfaire).
Nourriture gauche
Avancer roue gauche
Nourriture droite
Avancer roue droite
Eau gauche Eau droite
Intensit nulle Intensit faible Intensit forte
Faim Chercher nourriture
Soif
Chercher eau Intensit trs forte
Figure 5.17: Le mod` ele de syst` eme d ecisionnel de Werner pour un agent r eactif. La force des connexions est indiqu ee par l epaisseur des ` eches. Bien que les exemples pr esent es montrent en eet quun agent peut survivre dans un environnement dans lequel il doit trouver sa nourriture, se d esalt erer et fuir les pr edateurs, G. Werner na pas test e son mod` ele dans un environnement susamment complexe pour que lon sache si son mod` ele sait correctement choisir entre comportements app etitifs et actes consommatoires, etant donn e que lexemple quil pr esente semble pouvoir etre r esolu uniquement avec des taxies et des actes consommatoires. N eanmoins, il pr esente lavantage de la simplicit e et montre limportance des facteurs multiplicatifs dans la combinaison des percepts et des pulsions. Il existe une autre approche ascendante, celle choisie par A. Drogoul pour le mod` ele EMF (Etho Modelling Framework) (Drogoul 1993) qui se trouve ` a la base
293
du syst` eme Manta (Drogoul et Ferber 1994) de simulation de lactivit e dun nid de fourmis (cf. chap. 7). Sa probl ematique est un peu di erente des autres, car il sagit dun des seuls mod` eles pr esent es ici (avec le mod` ele de L. Steels pr esent e section 5.7.3 ci-dessous) qui consid` erent lagent non pas isol ement mais socialement en interaction avec dautres agents. Laccent de ce mod` ele, fond e sur une architecture ` a base de t aches comp etitives (cf. chap. 3), a et e mis sur ses capacit es dadaptation sociales et, en particulier, sur sa capacit e` a sp ecialiser les comp etences dun agent au cours du temps. A la di erence des autres mod` eles, il nexiste pas dans EMF de di erence entre action app etitive, taxie et action consommatoire, mais une distinction de niveau entre t aches et actions. Une action est ici une primitive comportementale telle que suivre un gradient, prendre un objet ou consommer de la nourriture. Une t ache est un ensemble de telles primitives qui sex ecutent en s equence ` a limage dun programme classique. N eanmoins, une t ache peut etre arr et ee ` a tout moment si les conditions environnementales et l etat de lagent le n ecessitent. La gure 5.18 pr esente une t ache compos ee de deux actions primitives dans le langage graphique de l editeur de t aches du syst` eme Manta.
Figure 5.18: Repr esentation graphique de la composition dune t ache de prise de nourriture dans le mod` ele EMF. Lagent suit dabord un gradient dodeur jusqu` a la source de la nourriture (action de taxie), avant de consommer la nourriture lorsquil peut le faire directement. Comme dans les autres syst` emes ascendants, une t ache est d eclench ee par un compos e des stimuli internes et externes. La particularit e du mod` ele EMF par rapport aux autres mod` eles vient de ce que le syst` eme tend ` a se sp ecialiser dans le d eclenchement pr ef erentiel de certaines t aches ou, en dautres termes, plus une t ache est d eclench ee, plus elle aura de chances de se d eclencher dans le futur. La gure 5.19 montre le diagramme de contr ole dune t ache EMF. Les stimuli internes et externes sont multipli es comme dans le syst` eme de Werner, mais le poids de la t ache joue aussi comme eet multiplicateur pour augmenter la sensibilit e du syst` eme ` a ces types de stimuli. Le comparateur prend toutes les t aches dont le niveau dactivation est sup erieur ` a un seuil S. La t ache s electionn ee voit alors son poids augment e dun incr ement. De plus (mais cela nest pas montr e dans le diagramme) une t ache qui sex ecute voit son poids diminu e an dimpl ementer un eet de fatigue et de faire en sorte que les autres t aches aient une chance d etre s electionn ees. Ce mod` ele, ind ependamment de ses caract eristiques adaptatives pour un ensemble dagents, est particuli` erement simple a ` mettre en uvre et ` a utiliser pour programmer dautres comportements. N eanmoins, lun de ses probl` emes majeurs r eside dans sa dicult e ` a revenir sur une t ache lorsque celle-ci est interrompue par eet dopportunisme. Lagent oublie ce quil etait en train de faire. Par exemple si un agent aam e et assoi e est interrompu dans sa qu ete de nourriture, il ne reprendra pas n ecessairement cette activit e. Ce quil fera d ependra enti` erement des facteurs environnementaux et de
294

Sensibilit des stimuli au pass Stimulus externe ai S Seuil de dclenchement Stimulus interne a'i 1 poids de la tche
+
incrment
Wi
Slection
0 0 0
commande de la tche i
Comparateur
Figure 5.19: Diagramme du m ecanisme de contr ole dune t ache dans EMF ses pulsions du moment. Ce mod` ele partage cette caract eristique avec la plupart des autres syst` emes et il sapparente notamment ` a celui de Werner par le fait quil conjugue de mani` ere multiplicative les pulsions et les stimuli externes. Mais ` a lencontre de ce dernier, les t aches, qui correspondent ` a des comportements de haut niveau (niveau 2 dans la hi erarchie de Tinbergen), sont elues par un m ecanisme de s election comp etitive. Du fait de ses qualit es intrins` eques, il est dommage que Tyrrell nait pas pu comparer ce mod` ele ` a celui de P. Maes ou ` a celui de Rosenblatt et Payton.
5.7.3
S election daction ou combinaison dynamique
Le m ecanisme de passage ` a lacte par s election daction, bien que partag e par tous les syst` emes consid er es jusqu` a pr esent (hormis celui de Werner), est tr` es controvers e par ceux qui pr econisent la d enition de syst` emes dynamiques. En eet, la s election comp etitive, ce que les Anglo-saxons appelle le winner-takes-all (le gagnant rae toute la mise), les actions sont n ecessairement incompatibles les unes avec les autres. Lorsquune action est s electionn ee, les autres sont de facto mises en sommeil, et il est impossible non seulement daccomplir deux actions de mani` ere simultan ee, mais aussi dex ecuter une combinaison de ces actions: chacune delle est totalement ind ependante des autres. Dans les syst` emes hi erarchiques, lordre est donn e par en haut, alors que dans les syst` emes ascendant ou distribu es, le choix d epend des conditions environnementales et des liens que les actions ont institu ees entre elles. Mais, dans tous les cas, une action et une seule est s electionn ee ` a un moment donn e. De ce fait, les agents utilisant ce mod` ele ne savent pas ` a la fois fuir un pr edateur et aller vers une source de nourriture. Ils font lun ou lautre en fonction de l etat dans lequel ils se trouvent. Seuls, parmi les mod` eles vus plus haut, celui des champs des potentiels et celui de Werner sont capables de combiner des actions parce quils combinent en fait les tendances qui les poussent ` a agir. Cest contre cette limitation des m ecanismes de s election comp etitive que L. Steels sest insurg e en d enissant son mod` ele de syst` eme dynamique (Steels 1994) que nous avons pr esent e dans le cadre des architectures au chapitre 3. Ce mod` ele peut etre illustr e par le diagramme de la gure 5.20. Les comportements primitifs sont des fonctions (g en eralement lin eaires) des

Capteurs x1 f1(xi,yj) x2 f2(xi,yj) x3 f3(xi,yj) x4 Comportements primitifs
Effecteurs
295
y1
y2
Figure 5.20: Mod` ele dun syst` eme dynamique de comportement. Les r esultats des comportements primitifs sont somm es avant de commander les eecteurs. stimuli internes et externes et des valeurs des eecteurs (vitesse des roues gauche ou droite, etat de la pince, etc.). Les r esultats de ces fonctions sont ensuite somm ees avant d etre envoy ees comme valeur de commande aux eecteurs correspondant. La d enition formelle de la valeur dune commande yj peut donc etre donn ee par l equation dynamique discr` ete suivante:
p
yi (t + 1) =
k=1
fk (x1 (t), .., xn (t), y1 (t), .., ym (t))
o` u les xi (t) et les yj (t) donnent respectivement la valeur des stimuli i et des eecteurs j au temps t. Lint er et de cette approche est de pouvoir combiner des comportements d enis de mani` ere ind ependante et dobtenir un comportement r esultant qui est le fruit de la composition de ces comportements. Mais linconv enient du mod` ele de L. Steels est, nous lavons dit, d etre encore trop li e` a une architecture mat erielle d enie. Que lon enl` eve un capteur ou que lon ajoute une roue et il faut totalement reprendre la d enition de ces fonctions. Il ny a pas de v eritable modularit e entre les niveaux d ecisionnels d enissant le passage ` a lacte et les niveaux dex ecution qui mettent en uvre ces comportements. En dautres termes, cest larchitecture qui est responsable du comportement, et il ny a pas, ` a proprement parler, de mod` ele comportemental dun agent ind ependamment de son organisation mat erielle. Il est pourtant possible dans certains cas de sabstraire de la repr esentation mat erielle, tout en conservant la facult e de combiner les actions pour d enir un comportement. Lorsque les actions peuvent sexprimer dans un espace m etrique, ce qui est souvent le cas, il est possible de leur appliquer les lois du calcul vectoriel et de combiner les comportements comme sil sagissait de vecteurs. Par exemple, si lagent doit ` a la fois eviter un pr edateur et aller chercher de la nourriture, alors il est possible de d enir trois comportements: aller vers un but, eviter un danger en le contournant et fuir si le danger devient trop important (par exemple si le pr edateur se dirige vers lagent). Il sut pour cela de consid erer que les buts et les dangers produisent des champs de potentiels et donc des forces qui sont parall` eles
296
aux gradients de ces champs (g. 5.21). De plus, on peut d enir le comportement de contournement comme un d eplacement se situant le long dune ligne de m eme potentiel ou, si lon pr ef` ere, comme un d eplacement perpendiculaire au gradient (cf. chap. 8).
Nourriture
Taxie vers la nourriture
Prdateur
Contournement
Fuite
Figure 5.21: Le comportement dun agent peut etre donn e comme la combinaison vectorielle de comportements el ementaires donn es sous la forme de vecteurs. Ces comportements peuvent etre ensuite combin es pour d ecrire tout un ensemble de comportements tels qualler vers une nourriture en contournant un danger, mais fuir si le danger est trop important. Cest la technique qua adopt e K. Zeghal dans son syst` eme Craash d evitement de collisions entre avions (Zeghal 1993). Chaque appareil consid` ere les autres comme un danger potentiel: si deux avions risquent dentrer en collision, ils cherchent ` a s eviter en se contournant tout en essayant de conserver leur trajectoire de route, mais si par hasard la distance devient vraiment trop faible alors il vaut mieux quils se fuient quitte ` a prendre une autre direction. Le comportement global, d ecrit par le vecteur X , peut etre alors d eni par l equation: X= B + F + C ++
o` u les vecteurs B , F et C repr esentent respectivement lattraction vers un but, la fuite et le contournement dun danger. Lintensit e de ces vecteurs d epend du potentiel produit par les buts et les dangers. Les param` etres , et correspondent ` a des facteurs critiques qui d ependent de la position respective de lagent, du but et surtout du danger. Si la distance entre le danger et lagent devient trop importante, alors la valeur de augmente au d etriment de celle de et de . La combinaison de ces comportements ne se r eduit pas au contournement et ` a la fuite dagents, et il est possible dajouter facilement de nouveaux comportements aux anciens. Par exemple, il est possible de d enir des comportements de troupeaux (ou de patrouilles) dans lesquels les agents cherchent ` a se grouper (cf. chap. 8), lesquels viennent se superposer aux comportement dattraction, de fuite et de contournement. Lavantage de cette technique, du fait de sa formalisation, est de pouvoir d enir de mani` ere
297
totalement abstraite le comportement dun agent sans devoir faire r ef erence ` a des capteurs ou ` a des eecteurs pr ecis. De plus, la combinaison de ces actions est totalement modulaire, ce qui rend le comportement dun agent ais ement extensible. Enn, il sut dutiliser les techniques multiplicatives des stimuli internes et externes pour b en ecier ` a la fois de pers ev erance et dopportunisme. La combinaison vectorielle des actions constitue donc a priori la meilleure des solutions pour la d enition de comportements r eactifs dans l etat des connaissances actuelles.
298
5.8
Passages ` a lacte intentionnels
Apr` es les modes dactions r eactifs, nous pouvons commencer ` a etudier la notion dintention telle quelle appara t dans les travaux dIAD et dans les sciences cognitives. Le probl` eme est ` a la fois tr` es simple et tr` es ardu: Comment un agent parvient-il a faire ce quil fait dans un univers plus ou moins stable, o` ` u les liens quil entretient avec les autres agents peuvent ` a tout moment dispara tre? La r eponse ` a cette question, disent certains sp ecialistes en sciences cognitives, se trouve dans lintention, cest-` a-dire dans la volont e consciente deectuer un acte, dans cette disposition mentale qui pousse ` a agir dans un certain sens en se proposant un but pour des actions futures. Nous expliquons commun ement ce que font les autres en supposant quils le font avec une certaine intention. Les ambitions, les d esirs, les volont es et les motivations servent ainsi ` a expliquer le comportement des etres humains. Pourtant il ne sagit pas n ecessairement dune attitude scientique. En eet, expliquer les conduites humaines par la notion dintention est souvent consid er ee comme de la psychologie na ve, cest-` a-dire comme une pseudo-th eorie constitu ee de concepts et de sch emas de raisonnement que lon emploie quotidiennement pour expliquer le comportement des etres qui nous entourent, sans quils soient accept es par le milieu scientique. Par exemple, si Marie me dit Je crois que Paula aime les eurs, je pourrais en inf erer quelle a une croyance sur les pr ef erences de Paula et quelle a lintention de lui orir des eurs. Jattribue ainsi des etats mentaux ` a Marie, tels que des croyances ou des intentions, sans que je sache pr ecis ement si elle poss` ede eectivement ces etats mentaux, et si son comportement est motiv e par ces derniers. Le fait que lon parle ` a cet egard de psychologie na ve (folk psychology) ne signie pas que lapproche pour comprendre ces ph enom` enes soit na ve elle-m eme. Bien au contraire, ces th eories font lobjet dun grand nombre de travaux et plusieurs mod` eles formels ont et e propos es pour th eoriser le passage ` a lacte chez les agents, quil sagisse dindividus humains ou articiels (Pacherie 1993). Le terme cl e de ces th eorie r eside dans le concept dintention, cest-` a-dire dans ce qui fait quun agent cognitif sengage ` a accomplir une action. Le concept dintention a et e (et demeure) lun des plus controvers es de lhistoire de la psychologie. Certains, les eliminativistes, refusent purement et simplement dintroduire ce concept dans leurs th eories, consid erant non seulement quil est inutile, mais aussi quil brouille inconsid er ement les questions. Dautres, au contraire, pensent quil sagit dun des concepts essentiels de la psychologie et quon devrait lui donner un r ole central, car il constitue la cl e de vo ute de lexplication du comportement humain en termes d etats mentaux. Enn, l ecole psychanalytique ny voit quun vague concept commode dans certains cas, mais quil convient g en eralement de substituer au prot du d esir et des pulsions, seuls capables de rendre compte du comportement global de l etre humain dans ses aspirations et ses sourances. La notion dintention n epuise pas lensemble de la probl ematique du passage a lacte pour les agents cognitifs. En eet, bien que les philosophes du XVIIIe ` si` ecle consid eraient le passage ` a lacte comme une simple r esultante de conits
` LACTE INTENTIONNELS 5.8. PASSAGES A
299
entre tendances pond er ees, la plus forte remportant la mise et d enissant laction a accomplir comme pour les agents r ` eactifs, lintention ne peut se r esumer ` a un simple conit entre tendances issues de pulsions, de demandes et de contraintes. Si les tendances prennent leur source dans des el ements extr emement simple du psychisme de lagent, les intentions supposent une analyse raisonn ee de la situation pr esente et future et des possibilit es daction. Les agents cognitifs sont capables de pr evoir dans une certaine mesure les cons equences de leurs choix, puisquils d ecident en tenant justement compte des rapports de causalit e existant entre les ev enements, cest-` a-dire en anticipant sur le futur. Cest cette capacit e ` a pr evoir les ev enements qui permet de dire quun agent intentionnel est n ecessairement cognitif puisquil base son comportement sur une projection des situations futures, cest-` a-dire sur un mod` ele du monde quil est capable de manipuler pour evaluer les cons equences de ses actes et choisir laction ` a entreprendre. De plus cette prise de d ecision est suppos ee etre rationnelle comme nous lavions indiqu e plus haut, cesta-dire subordonn ` ee aux objectifs de lagent. Cest en eet par un calcul conscient que lagent peut comparer les situations nales, quil peut calculer et comparer les avantages correspondant aux di erentes situations et donc faire le bilan des di erentes possibilit es qui souvrent ` a lui an de toujours choisir la solution qui sav` ere la meilleure en fonction des buts de lagent et de ses possibilit es. De nombreux auteurs en IA et en philosophie ont propos e de consid erer lintention quun agent a daccomplir un acte comme une des caract eristiques majeures des agents cognitifs. LIAD nest pas en reste, car lintention est un concept fort important pour les syst` emes multi-agents car il permet de relier les buts aux croyances et aux engagements en disposant dune th eorie du passage ` a lacte des agents cognitifs. La plus grande partie des th eories portant sur la notion dintention dans le cadre dagents cognitifs est issue des travaux eectu es dabord en philosophie analytique par Searle (Searle 1985), Casta neda (Casta neda 1975) et surtout Bratman (Bratman 1987) et reprise par des chercheurs en intelligence articielle tels que Allen et Perrault (Allen et Perrault 1980) et surtout Cohen et Levesque (Cohen et Levesque 1990a) qui ont donn e la base dune th eorie formelle des comportements intentionnels.
5.8.1
Th eories logiques de lintention
On distingue g en eralement entre deux types dintentions (Searle 1985): lintention dagir dans le futur et lintention de faire quelque chose maintenant. Par exemple, si je dis jai lintention daller aux Antilles cet hiver, lintention est dirig ee vers le futur (surtout si le moment de l enonciation est l et e), et se trouve ` a la source dun comportement, en particulier des autres intentions que je pourrais formuler pour atteindre mon but initial: aller prendre un billet davion, se renseigner pour trouver un endroit o` u s ejourner (h otel, club, maison ` a louer), etc. Lintention de faire maintenant est relative ` a laction imm ediate: si je dis jai lintention de prendre cette pomme, laction qui sensuit doit etre eectu ee maintenant, et nimplique pas dautres intentions secondaires, car elle pr eside ` a la r ealisation de mon geste. En fait ces deux types dintentions ne co ncident pas totalement et renvoient a deux formes dintentionnalit ` e di erente. La premi` ere suppose un m ecanisme de
300
planication, alors que la seconde renvoie seulement au m ecanisme de lex ecution des actions. La premi` ere est la plus int eressante du point de vue des agents intentionnels, car elle suppose un m ecanisme danticipation et de planication des ev enements futurs caract eristique de ce que lon appelle les agents intentionnels. Nous ne nous int eresserons qu` a celle-l` a et nous appellerons intention ce m ecanisme de projection dans le futur dun etat du monde non r ealis e actuellement. Lintention sinscrit dans le temps, laction et les croyances. Un agent d esire accomplir une action parce quil croit que ce quil va faire va permettre de satisfaire un but. De ce fait, toute th eorie de lintention n ecessite une bonne d enition de ce quest une action, un ev enement, un etat du monde et comment ces ev enements et etats du monde sont li es dans le temps. Cest dailleurs la partie g en eralement la plus complexe des th eories des intentions, et aussi ce qui les rend les plus fragiles, du fait de la double dicult e` a manipuler des op erateurs temporels et ` a rendre compte de lensemble des aspects de la notion daction. Bratman (Bratman 1990) introduit ce quil pense etre les caract eristiques n ecessaires a une th ` eorie de laction intentionnelle: en premier lieu, les intentions, pour aboutir, sont ` a lorigine de probl` emes que les agents devront r esoudre. Les intentions doivent aussi etre coh erentes entre elles, ce qui implique quelles fournissent un ltre dacceptabilit e (screen of admissibility) pour adopter dautres intentions. Par exemple, si un agent a lintention de faire un uf sur le plat et quil ne dispose que dun uf, il ne peut en m eme temps avoir lintention de faire une omelette. En outre, les agents suivent les r esultats de leurs actions tout en etant pr ets ` a replanier leurs actions pour satisfaire leurs intentions. Enn, il est n ecessaire de distinguer entre les r esultats intentionnellement voulus par un agent de ceux qui ne sont que les cons equences involontaires de laction. D enition: on dit quun agent x a lintention de faire une action a, ce que lon note intention(x,a) si x a comme but quune proposition P portant sur un etat du monde soit vraie (not e but(x,P)) et que les conditions suivantes soient satisfaites: 1. x croit que P appartient aux cons equences de a; 2. x croit que P nest pas vrai actuellement; 3. x croit quil est capable de faire a; 4. x croit que a sera possible et donc que P pourra etre satisfait. De plus, on suppose que la persistance de lintention durera tant que les conditions pr ec edentes sont v eri ees et que P fait partie des buts de x, cest-` a-dire quun agent nabandonnera pas son intention pour rien. Par exemple, si un agent d esire aller chercher du bois et pense que laction est possible, cest-` a-dire quil pense quil existe un tas de bois dont il conna t le lieu et dont il conna t un chemin pour y aller, et sachant quil a la capacit e de se d eplacer, alors il aura lintention dy aller, cette intention etant ` a lorigine de son action daller chercher le bois. Cependant cette d enition repose sur la notion de croire quune action est possible. Dans le cas dun univers mono-agent statique, cest-` a-dire dont les seules
301
modications de l etat du monde d ependent de lagent, une action est r ealisable (ou possible) si les conditions pour accomplir cette action sont r ealis ees ` a linstant pr esent, ou sil existe un plan, cest-` a-dire une suite dactions ex ecutables par lagent qui permette de v erier les conditions dapplication de cette action que lagent a lintention de faire. Que le monde evolue ou que plusieurs agents puissent modier le monde par leurs propres actions, et il nest pas s ur que lagent pourra eectivement aller jusquau bout de son intention. Dans ce cas, les conditions de r ealisation dune action sont nettement moins simples, car elles reposent sur les possibilit es danticiper sur l evolution du monde. Par exemple, si jai lintention daller faire du ski, cela signie que je pense que les conditions n ecessaires sont v eri ees et en particulier quil y a de la neige. Or, si jai lintention non pas daller faire du ski maintenant mais dans quelques mois, cela signie que je dois pr evoir quil y aura de la neige au bon moment, mais rien ne massure de cette situation. Tout d epend des connaissances g en erales que je peux avoir sur la question. Je peux en eet penser que le fait daller faire du ski en f evrier dans une station savoyarde est possible (en tout cas par d efaut ou de mani` ere statistique). Rien ne me garantit totalement cette possibilit e. Si la saison est particuli` erement mauvaise, la neige pourra ne pas etre au rendez-vous. Il en est de m eme dans le cas dunivers multi-agents dans lesquels les actions des autres peuvent modier l etat du monde ` a tout moment. Pour savoir si une action est possible, je dois prendre en compte non seulement mes comp etences et l evolution naturelle du monde, mais aussi les actions et surtout les intentions des autres agents. Par exemple, si le robot Clotaire sait que le robot Chilp eric a lintention daller chercher un outil, il peut le prendre en compte dans l elaboration de ses propres intentions et donc se d eterminer en utilisant les actions de Chilp eric comme sil sagissait du r esultat de ses propres actions et en supposant que ce dernier nabandonne pas ses actions de mani` ere inconsid er ee. De ce fait, l elaboration des intentions sappuie sur les r egularit es du monde, cesta-dire sur le fait que lenvironnement et les autres agents sengagent sur les actions ` futures quils envisagent daccomplir. Toute d enition dintention dans des syst` emes multi-agents cognitifs repose sur la possibilit e de planier des actions conjointes entre agents multiples dans un univers evolutif. N eanmoins, cette d enition pose tout de m eme un probl` eme: rien nest dit sur le fait que lagent qui a lintention de faire laction a poursuit eectivement cette intention et va mettre tout ce qui est en son pouvoir pour r ealiser cette action. Avoir lintention de faire quelque chose, cest aussi sengager, au moins envers soi-m eme, a essayer de laccomplir. De ce fait, les th ` eories formelles sur lintention prennent la notion dengagement comme un el ement fondamental du passage ` a lacte dun agent cognitif. Les travaux les plus connus dans ce sens sont ceux de Cohen et Levesque et la tentative de mise en uvre de Yoav Shoham.
5.8.2
La th eorie de laction rationnelle de Cohen et Levesque
Philip Cohen et Hector Levesque ont d eni une logique de laction rationnelle qui a eu beaucoup de retentissements dans le monde des univers multi-agents et qui a vu
302
un nombre importants de recherches reprendre le formalisme et les fondements de cette th eorie. On trouvera dans (Cohen et Levesque 1990a; Cohen et Levesque 1990b) les d etails de cette th eorie et en particulier les d enitions proprement formelles. Nous ne pr esenterons ici que ses caract eristiques les plus g en erales, ainsi que ses cons equences sur la d enition de m ecanismes intentionnels. La th eorie de Cohen et Levesque est particuli` erement int eressante pour deux raisons: elle fournit une notation uniforme et pratique pour lier des notions telles que les intentions, les croyances et les actions et, surtout, elle propose une conception relativement int egr ee de laction rationnelle. La notation Le formalisme de Cohen et Levesque repose sur une logique modale, cest-` a-dire sur un syst` eme logique des pr edicats du premier ordre (avec egalit e) augment e dun certain nombre dop erateurs repr esentant des attitudes propositionnelles ou des s equences d ev enements. Les deux modalit es de base de leur logique sont la croyance et le but. Le premier croire(x,p) signie que lagent x croit p, et le second, but(x,p) indique que x a pour but que p soit satisfait. Dautres pr edicats servent a g ` erer la notion daction ou plus exactement celle d ev enement, car ici laction est consid er ee simplement comme un ev enement qui rend possible la satisfaction dune proposition. Ils ne prennent donc pas en compte les eets de bords ou les cons equences des actions, ni ne consid` erent les probl` emes de simultan eit e comme le chapitre 4 lavait montr e. Ces pr edicats suppl ementaires sont agent(x,e) pour signier que lagent x est le seul agent initiateur de la s equence d ev enements e, e1 e2 qui stipule que e1 est une s equence d ev enements pr ec edant e2, et vaSePasser(e) et achev ee(e) qui indiquent quune s equence d ev enements est juste sur le point de se passer ou vient d etre achev ee. Dans leur formalisme, la notion daction nest pas distincte de celle de s equence d ev enements. On parlera ainsi indistinctement daction ou d ev enements. Ces s equences peuvent etre structur ees ` a laide dop erateurs semblables ` a ceux de la logique dynamique (Harel 1979): a; b est la composition s equentielle dactions. Cela signie que lon fait donc dabord a, puis b lorsque a est termin e. a|b est le choix non d eterministe dactions. Cela signie que lon fait soit a soit b. p? est une action qui teste si p est v eri ee. Si elle nest pas v eri ee, cette action bloque les autres actions emp echant la suite de la s equence de saccomplir. a* est la r ep etition. Laction a se r ep` ete ind eniment, sauf si elle est interrompue par un test ne v eriant pas une certaine propri et e. A partir de ces op erateurs de base, il est possible de construire des structures de contr ole plus elabor ees de la mani` ere suivante:
303
si p alors a sinon b =def p?; a|p?; b, ce qui signie que la conditionnelle est une action dans laquelle on eectue a d` es que p est v eri ee et b d` es que p est fausse. tantque p faire a =def (p?; a); p?, ce qui signie que lon r ep` ete a tant que p est vraie et quensuite p est fausse. finalt(p) =def e vaSePasser(e; p?), d ecrit lop erateur nalement (eventually) qui indique quil existe une s equence daction e apr` es laquelle p sera vraie. tjrs(p) =def finalt(p), d ecrit lop erateur toujours, qui signie que p est toujours vraie (litt eralement p ne sera jamais fausse). plusTard(p) =def p finalt(p), qui signie que p sera vraie plus tard, cest-` a-dire que p nest pas vraie maintenant mais sera nalement vraie. avant(p,q)=def c vaSePasser(c; q?) a(a c) vaSePasser(a; p?), cesta-dire que p vient avant q si quand q est vraie p a ` et e vraie pr ec edemment. et dintroduire des abr eviations telles que achev e(x,a) =def achev ee(a) agent(x,a) vaFaire(x,a) =def agent(x,a) vaSePasser(a) qui permet de repr esenter la notion daction achev ee et accomplie par un agent a. La d enition de tous ces op erateurs est donn ee par une axiomatique modale (en particulier lop erateur de croyance correspond ` a une axiomatique S5, cf. section 5.3.3) et par une s emantique des mondes possibles sur lensemble des op erateurs de croyances, de buts et de constructions de s equences. A partir de ces d enitions, il est possible de tirer tout un ensemble de cons equences, telles que celle-ci: finalt(q) avant(p,q) finalt(p) cest-` a-dire que si q nalement est v eri ee et que p est avant q alors p sera n ecessairement v eri ee aussi. Lintention et laction rationnelle Pour Cohen et Levesque, la th eorie de laction rationnelle reprend les id ees de Bratman telles que nous les avons r esum ees ci-dessus. Lintention y est con cue comme un choix et un engagement envers son choix. Leur concept de but est assez particulier: ils nutilisent pas une formalisation de la notion intuitive du mot but, mais consid` erent que la formule but(x,p) signie que p sera vraie dans tous les mondes possibles dans lesquels leurs buts seront achev es. Ainsi ils peuvent faire l economie du concept de but et ne consid erer que les cons equences des buts. Lintention est alors une sorte de but persistant, cest-` a-dire un but quun agent conserve tant que certaines conditions demeurent. Dans leur notation, un but persistant sexprime ainsi:
304
CHAPTER 5. LAGENT DANS TOUS SES ETATS but-p(x,p) =def but(x,plusTard(p)) croire(x, p) [avant(croire(x,p) croire(x,tjrs(p)), but(x,plusTard(p))]
ce qui se lit ainsi: on dit quun agent x a un but persistant p sil a le but que p soit v eri e plus tard, quil croit que p nest pas v eri e pour linstant, et quil abandonnera son but si soit il croit que p est vrai soit il croit que p ne pourra jamais etre vrai. De ce fait, les buts persistants introduisent la notion dengagement quoique de mani` ere implicite. En eet, lagent persistera dans son but sauf si une condition particuli` ere est v eri ee. De ce fait, si lon suppose que les agents un jour abandonneront leurs buts (il ne peuvent rester ind eniment prostr es et tenter datteindre ind eniment leurs buts). On peut donc en d eduire que: but-p(x,p) finalt[croire(x, p) croire(x, tjrs(p))] cest-` a-dire que si un agent poss` ede un but persistant il lui arrivera nalement soit de croire que p est vrai soit que p ne sera jamais vrai. A partir de ces premi` eres d enitions, Cohen et Levesque d enissent lintention pour un agent x de faire une action a comme un engagement fanatique daccomplir laction a d` es quelle peut etre eectu ee (en fait d` es que lagent croit quelle peut seectuer), ce qui s ecrit ainsi: intention-fan(x,a) =def but-p(x,achev ee(x, croire(x,vaSePasser(a))?;a)) Cette d enition permet davoir une id ee de la notion dintention, mais elle est trop stricte. Elle concerne ce que Cohen et Levesque appellent des agents fanatiques, qui ne peuvent supprimer leur but une fois que ces derniers se sont engag es ` a les satisfaire. Un agent impl ement e avec une telle notion dintention se comportera comme ces robots tueurs des lms de science-ction que lon ne peut arr eter une fois quils ont re cu leurs consignes et qui deviennent ainsi dangereux m eme pour ceux qui les ont programm es. Cohen et Levesque ont donc d eni une autre sorte de but quali e de persistantrelatif, cest-` a-dire un but persistant li e` a une condition de satisfaction suppl ementaire. Cette derni` ere fonctionne comme une garde dans la r ealisation de laction, ce que ces auteurs consid` erent comme les raisons pour un agent daccomplir une action. but-p-rel(x,p,q) =def but(x, plusTard(p)) croire(x, p) [avant([croire(x, p) croire(x, tjrs(p)) croire(x, q)], but(x, plusTard(p))] A partir de cette d enition il est possible de caract eriser une nouvelle notion dintention relative ` a une condition q qui sexprime ainsi: intention-rel(x,a,q) =def but-p-rel(x,achev e(x,croire(x,vaSePasser(a))?;a),q)
305
cest-` a-dire que x a lintention daccomplir a relativement ` a la condition q, sil a le but persistant relatif ` a q daccomplir a d` es quil croit que cette action peut etre eectu ee. Ces auteurs ont aussi d eni la notion dintention vague ou dintention abstraite. Par exemple, lintention de devenir riche est vague parce que lagent ne dispose pas n ecessairement dune action imm ediate qui lui permettrait de satisfaire ce but. Lintention se rapporte alors ` a la satisfaction dune proposition et non ` a la r ealisation dune action. Avoir lintention dans ce sens consiste alors ` a croire quil existe une s equence daction e telle quil soit possible ensuite daccomplir laction e qui satisfasse p: intention-abs(x,p) =def but-p(x,e achev e(x, [croire(x,e vaFaire(x, e ; p?) but(x, vaFaire(x, e; p?))]?; e; p?)) La th eorie en question Le principal int er et de cette th eorie est de fournir un langage relativement simple et concis et de montrer qu` a partir dun tel langage il est possible de d enir une th eorie de laction rationnelle qui puisse se formaliser et ainsi pr eter ` a discussion de mani` ere rigoureuse. On peut aussi voir que de nombreuses situations humaines ou articielles peuvent se traduire sous cette forme. Par exemple, pour un agent calculateur qui a besoin de certains param` etres, son intention consiste ` a chercher sil existe un agent qui poss` ede ces param` etres, tant que le probl` eme initial na pas et e r esolu, ce que lon peut exprimer de cette mani` ere: intention-rel(Agent23,trouverParam` etres({p1,p2}), trouv e(probl` eme1)) Plusieurs chercheurs ont elabor e des th eories multi-agents ` a partir de ce formalisme. Par exemple, J. Galliers a d ecrit une th eorie des actions de coop eration en utilisant cette technique (Galliers 1988) et C. Castelfranchi et R. Conte ont elabor e une th eorie des intentions sociales et des inuences (Castelfranchi et Conte 1992; Conte et al. 1991). Ce type de formalisation pr esente cependant quelques lacunes: 1. Les actions sont consid er ees comme des constructions d ev enements, et non comme des op erations applicables sur le monde. De ce fait, ce type de th eorie ne peut prendre en compte les modications apport ees par les actions des agents et donc sav` ere inad equat pour r esoudre des probl` emes de planication (mono ou multi-agents) ou plus g en eralement les ph enom` enes dinteractions entre agents. N eanmoins, avec des agents purement communiquants, il est possible (et Cohen et Levesque lon fait (Cohen et Levesque 1990c)) dintroduire des op erateurs de communications et ainsi de r ealiser une extension de leur formalisme pour traiter les interactions entre agents. Cette extension passe par la th eorie des actes de langages que nous verrons au chapitre 6. 2. Il est dicile de prouver m ecaniquement de telles th eories: les op erateurs modaux multiples ainsi que les constructions de logique dynamique ne rendent
306
CHAPTER 5. LAGENT DANS TOUS SES ETATS pas facile lautomatisation dinf erence permettant de juger de la validit e ou non dune formule. Tout doit se faire ` a la main en utilisant des consid erations s emantiques sur les mondes possibles, ce qui est assez mal commode.
3. Quoi quen disent Cohen et Levesque, il ne sagit nullement dune description op eratoire des m ecanismes mis en uvre pour quun agent rationnel passe ` a lacte, mais seulement des conditions minimales qui doivent etre satisfaites pour que lon puisse parler dintention chez un agent. Par exemple, la notion dengagement nexiste que par d efaut et le passage ` a lacte appara t nulle part. On a limpression que lagent a toujours le d esir daccomplir laction mais on ne voit pas quand il accomplit cette action ni sil laccomplit explicitement. De ce fait, ` a partir des sp ecications de Cohen et Levesque, on pourrait r ealiser un agent, peut- etre un peu irrationnel il faut bien le dire, qui passerait son temps ` a avoir le but daccomplir des actions sans les ex ecuter eectivement. Mais il ne faut pas en porter grief ` a Cohen et Levesque, mais plut ot au formalisme qui ne permet pas de prendre en compte lop erationnalit e de lintention et se r ev` ele donc incapable de d ecrire eectivement le passage ` a lacte dun agent. Dune mani` ere g en erale, ce type de th eorie pr esente lavantage de bien d egager quelques-uns des concepts cl es de lintention. Cependant, il a tendance ` a simplier a lextr ` eme les probl` emes de laction et en particulier ` a ne pas prendre en compte les r evisions de laction ni ` a int egrer le m ecanisme d elaboration de ces intentions et donc des conits qui peuvent survenir entre les motivations de diverses natures et les contraintes. Cette th eorie suppose quil existe une relation 1 : 1 entre les buts et la s equence dactions qui peut satisfaire les buts. Elle est prise en d efaut d` es quil existe plusieurs moyens datteindre un m eme objectif, ce qui est pourtant le cas le plus courant. Par exemple, si une rme veut monter une revue de communication dentreprise, elle peut soit essayer de l editer en interne sur un syst` eme de micro- edition, soit utiliser les services dune entreprise externe sp ecialis ee en edition. Ces deux possibilit es atteignent le m eme but bien que les moyens soient di erents. Or ce type de th eorie ne dit rien sur cette prise de d ecision. Elle permet seulement, en codant explicitement les raisons dabandon, de pouvoir remettre en cause un but si celui-ci ne convient plus. De ce fait, de telles th eories de laction rationnelle devraient etre etendues par des consid erations d evaluation de buts et de moyens, en utilisant des techniques semblables ` a celle de la th eorie des jeux ou de la d ecision. Il serait pr ef erable de rendre compte de la notion dintention ` a partir de m ecanismes r eactifs comme ceux que nous avons examin es section 5.7. Cela permettrait de faire le pont entre les agents r eactifs et les agents cognitifs en montrant que les intentions, les choix et les engagements sont le produits de m ecanismes el ementaires fond es sur des consid erations de poids, de seuils et de renforcement. Mais ce travail reste ` a faire. Toute bonne th eorie de laction rationnelle devrait pouvoir int egrer et coordonner les notions de but, de croyance, de d ecision, de passage ` a lacte, dengagement, de communication et de r esultat des actions de mani` ere coh erente. Il serait de plus
307
int eressant que ces th eories puissent aider ` a limpl ementation dagents fonctionnant sur ce principe. La th eorie de Yoav Shoham, elabor ee dans son article Agent Oriented Programming (Shoham 1993), correspond ` a cet objectif en proposant un langage de programmation orient e agent de la m eme mani` ere quil existe des langages orient es objets. Il sagit de consid erer que lon programme un agent ` a laide d el ements de haut niveau tels que des buts, des choix, des comp etences, des croyances, etc. et que les types de message que les agents s echangent se r ef` erent ` a m ecanismes de communication de haut niveau eux aussi, en d enissant des messages dinformation, de requ ete, dore, de promesse, de refus, dacceptation, etc. Son mod` ele de langage est fond e sur des logiques et une s emantique en termes de th eorie des mondes possibles. Ses deux modalit es de base sont la croyances et lengagement, repr esent ees respectivement par croire(x, p)t pour dire que lagent x croit la proposition p au temps t, et engagement(x, y, a)t pour signier que lagent x sest engag e au temps t aupr` es de y pour accomplir laction a. Toutes les autres modalit es sont d eriv ees de ces deux primitives. Choisir deectuer une action est d enie comme un engagement envers soi-m eme et la capacit e` a ex ecuter une action comme limplication que le choix de p entra ne p. choix(x, p)t =def engagement(x, x, p)t capable(x, p)t =def choix(x, p)t p A partir de ces conception initiales, il a d evelopp e Agent0, un mod` ele dagents capables dex ecuter des actions, dinformer dautres agents et de leur envoyer des requ etes. Bien que tr` es int eressante parce que pr esentant une tentative dop erationnaliser des sp ecications du type de celle de Cohen et Levesque, cette th eorie demeure encore un peu simpliste et montre de ce fait la dicult e dintroduire un v eritable langage orient e agent et surtout une th eorie du passage ` a lacte pour les agents cognitifs qui puisse sop erationnaliser. Dautres tentatives ont et e faites dans ce sens. Signalons en particulier celle de Chaib-Draa (Chaib-Draa 1989) qui a d evelopp e, ` a partir des travaux de Cohen et Levesque (ceux que nous avons pr esent es ici et ceux quils ont eectu es sur la communication entre agents ` a partir des actes de langages que nous d evelopperons dans le chapitre suivant), un syst` eme permettant a plusieurs agents de coop ` erer pour r esoudre des probl` emes de planication relativement simples. R ecemment, un petit groupe de chercheurs, autour dH. Levesque, dY. Lesp erance et de R. Reiter, ont repris lid ee de Y. Shoham et ont d evelopp e, sur des bases personnelles, une autre approche logique plus compl` ete de la programmation dagents qui d ecrit directement le fonctionnement interne des agents (Lesp erance et al. 1995).
308
Chapter 6 Communications
6.1 Aspects de la communication
Les communications, dans les syst` emes multi-agents comme chez les humains, sont a la base des interactions et de lorganisation sociale. Sans communication, lagent ` nest quun individu isol e, sourd et muet aux autres agents, referm e sur sa boucle perception-d elib eration-action. Cest parce que les agents communiquent quils peuvent coop erer, coordonner leurs actions, r ealiser des t aches en commun et devenir ainsi de v eritables etres sociaux. La communication sexprime comme une forme dinteraction dans laquelle la relation dynamique entre les agents sexprime par linterm ediaire de m ediateurs, les signaux, qui, une fois interpr et es, vont produire des eets sur ces agents. Il existe un grand nombre dapproches de la communication: les sciences humaines et en particulier la linguistique et la philosophie du langage ont d evelopp e tout un ensemble de concepts dont je minspirerai pour pr esenter les principales approches de la communication dans les syst` emes multi-agents.
6.1.1
Signes, indices et signaux
Les communications seectuent par linterm ediaire de signaux, chaque signal caract erisant un indice ou un signe. A la di erence du langage courant o` u ces termes sont presque synonymes (on dit quun m edecin diagnostique une maladie ` a partir de signes ou dindices cliniques), la linguistique et la s emiologie, cest-` a-dire la science des signes, distinguent tr` es pr ecis ement les signes des indices et des signaux. Un signal est l el ement le plus primitif. On peut le d enir comme une marque, une trace, une modication de lenvironnement sur le plan m ecanique (audition, toucher), electromagn etique (vision) ou chimique (syst` eme olfactif ou gustatif), eventuellement porteur dune information pour celui qui est capable de percevoir ce signal. Les signaux se propagent en vertu de leurs propres lois de propagation et en tant que tels ne signient rien. Pour signier, il leur faut deux conditions: un agent ayant des capacit es de perception susantes pour etre sensible ` a ce signal (par exemple, en tant qu etre humain notre ou e nest sensible ` a des vibrations de lair que dans la bande passante 30-16000 Hz) et un syst` eme interpr etatif capable de transformer ce signal en un sens ou tout du moins en un comportement. Lorsque
310
CHAPTER 6. COMMUNICATIONS
le signal ne produit quun comportement, on dit quil sagit dun stimulus. Cest le cas pour la plupart des animaux et, pour ce qui nous concerne, pour lensemble des agents r eactifs. Comme nous lavons vu au chapitre 5, un signal, lorsquil est re cu par un tel agent, est capable de renforcer une tendance et, si cette derni` ere est susante, de le faire passer ` a lacte. Lorsque le signal ne produit pas seulement un comportement, mais sins` ere dans un syst` eme cognitif lui permettant de le rendre intelligible, on dit alors que le signal est porteur de signication et prend le statut de signe. Comme le remarque U. Eco (Eco 1988), le signe est d eni avant tout comme aliquid stat pro aliquo, cest-` a-dire quelque chose (une expression concr` ete, un son, un mouvement, une gure, etc.) qui renvoie ` a quelque chose dautre (une situation, un objet physique, une action, une proc edure, une autre expression, etc.). Les signaux inclus dans les signes nont par eux-m emes rien de commun avec le sens quils sont destin es ` a transmettre. On dit avec Saussure que les signes linguistiques sont arbitraires, cest-` a-dire quils d erivent dune convention et que leur forme nest pas li ee ` a ce quils r ef` erent (Baylon et Mignot 1991). Il existe plusieurs cat egories de signes. Il y a dabord les signes linguistiques qui sont issus dun langage, cest-` a-dire dune structure de communication poss edant ` a la fois une premi` ere articulation phon etique, les sons se combinant pour composer des mots, et une seconde articulation grammaticale dans laquelle les mots sont assembl es pour construire des phrases. Les signes linguistiques, qui sont les constituants essentiels des communications entre agents cognitifs, associent ` a une forme signiante, qui prend g en eralement la forme dune cha ne de caract` eres, un signi e, cest-` a-dire un concept, une id ee, la repr esentation de quelque chose ou dun etat mental. Mais les signes linguistiques ne constituent quune partie de lunivers des signes. Les indices notamment forment une cat egorie importante de signes qui ne sont pas construits ` a partir dun langage dot e dune double articulation, mais renvoient ` a la construction dhypoth` eses sur une situation ou une chose. Par exemple, des traces danimaux constituent des indices de leur passage, les sympt omes dun malade sont les indices dune maladie, la fum ee est lindice dun feu. Le proc ed e cognitif par lequel un agent passe dun indice ` a une hypoth` ese est appel e abduction. Il est caract eristique de tous les raisonnements dinvestigation (pensons en particulier ` a Sherlock Holmes capable de reconstruire toute la personnalit e dun individu ` a partir de quelques indices) et de diagnostic1 .
6.1.2
D enition et mod` eles de communication
Il existe de nombreuses th eories de la communication mais elles reposent essentiellement sur des variantes de la th eorie de la communication issue des recherches en t el ecommunications des ann ees 40 d evelopp ees par Shannon et Weaver (Shannon et Weaver 1948). Dans ce mod` ele, lacte de communication consiste en une transmission dinformation dun emetteur vers un r ecepteur (ou destinataire), cette information etant cod ee ` a laide dun langage et d ecod ee ` a larriv ee par le destinataire. Cette
1 Pour avoir une bonne id ee des th eories du signe et du sens en linguistique et en s emiologie ` a partir dune lecture provenant des sciences cognitives, on pourra essayer de se procurer (Enjalbert 1993).
6.1. ASPECTS DE LA COMMUNICATION
311
information est transmise dans un canal (ou m edium) de transmission qui peut etre bruit e. Le contexte est la situation dans laquelle les interlocuteurs sont plac es (ce contexte est lui-m eme d ecompos e en contexte de l emetteur et contexte du destinataire). La gure 6.1 illustre ce mod` ele.
Code Message Mdium/Canal Contexte
Emetteur
Destinataire
Figure 6.1: Le mod` ele classique de la th eorie de la communication Le mod` ele initial de cette th eorie etait tr` es simpliste et totalement li e` a des motifs techniques, le probl` eme etant alors de transmettre des donn ees de mani` ere quelles soient le moins perturb ees par le canal de transmission. Depuis, ce mod` ele sest beaucoup am elior e en prenant en compte les etats mentaux des interlocuteurs dune part et le contenu des messages dautre part, en distinguant di erentes situations de communication et en classant les fonctions assur ees par les messages, comme nous le verrons ci-dessous. La notion de communication sest depuis structur ee et, de la simple transmission dinformation initiale, on est pass e` a des formes plus elabor ees, telles que les actes de langage et les structures conversationnelles qui mettent laccent sur la notion dinteraction dans les communications. Mais la communication va au-del` a de l echange verbal. En eet, cette vision de la communication comme un processus d emission/r eception de messages ne constitue pas la seule th eorie en vigueur. Pour des chercheurs en sciences humaines (ethnologie, sociologie et psychologie) r eunis dans une ecole de pens ee connue sous lappellation d ecole de Palo Alto, cette conception est tr` es li ee ` a son origine technique. Elle porte essentiellement sur la communication verbale, consciente et volontaire qui s etablit entre deux etres humains et ne permet pas de comprendre le fait de communication dans son int egralit e, cest-` a-dire lensemble des interactions signiantes sexprimant entre plusieurs etres. La communication est alors consid er ee comme un processus social permanent int egrant de multiples modes de comportement: la parole, le geste, le regard, la mimique, lespace interindividuel, etc. La communication est un tout int egr e (Bateson et al. 1981). Dans ce cas, les messages nont plus de signication intrins` eque: seul le contexte est capable dapporter une lumi` ere sur la signication des modes dinteraction. Enn, dans le contexte des sciences cognitives, certains remettent en cause le mod` ele classique de communication d enie ` a partir de consid erations cognitivolinguistiques en constatant que, dans ce m ecanisme de codage/d ecodage, le code constitue une connaissance partag ee par les interlocuteurs. Mais cette connaissance commune existe-t-elle vraiment dans tous les cas? Est-ce bien la m eme chose qui est emise et interpr et ee? Le code nest-il pas un leurre de notre perception na ve des
312
formes de communication? Cest en r epondant par la n egative ` a toutes ces r eponses et en mettant laccent sur les m ecanismes inf erentiels des interlocuteurs que Sperber et Wilson (Sperber et Wilson 1986) proposent un sch ema de communication qui repose sur laspect interpr etatif des communications: un enonc e qui a du sens est un enonc e pertinent, cest-` a-dire l enonc e minimal n ecessaire pour que l emetteur parvienne ` a se faire comprendre et donc ` a faire en sorte que le destinataire ait le moins de mal possible ` a le comprendre. Chacun des interlocuteurs se construit un ensemble dhypoth` eses sur les repr esentations et les objectifs de lautre: le locuteur ne produit que les enonc es qui lui paraissent n ecessaire pour que le destinataire ait eectivement compris ses intentions communicationnelles. Cette conception de la communication, qui est encore tr` es peu utilis ee dans le monde de lintelligence articielle distribu ee, est pourtant tr` es int eressante car elle repose enti` erement sur des m ecanismes inf erentiels et sur la construction de mod` eles de lautre. De plus, elle suppose que le destinataire dispose dun ensemble de capacit es de traitement qui pr esentent de grandes analogies avec les di erents syst` emes de compr ehension de langage naturel d evelopp es par lintelligence articielle (Sabah 1989).
6.1.3
Cat egories de communication
Malgr e toutes les critiques prononc ees ` a son egard, le sch ema classique de la communication est apparu comme susamment pertinent par nombre de linguistes pour quils lint` egrent dans leur propre description des faits de langues en classant les mani` eres de communiquer par rapport aux relations qui sexpriment entre les di erentes entit es concern ees par lacte de communication. Ces relations portent sur: 1. la liaison emetteur-destinataire 2. la nature du m edium 3. lintention de communiquer Liaison emetteur-destinataire Quelle est la relation qui unit le receveur dune communication ` a son emetteur? Lorsque le destinataire est connu de l emetteur, ce dernier peut lui adresser des messages en particulier et ainsi instaurer une communication individuelle. On dit alors que les communications sont eectu ees selon un mode point ` a point. Cest ce type de communication qui est g en eralement le plus employ e dans les agents cognitifs. On le notera ainsi: (id) < emetteur> : <destinataire> << < enonc e> o` u <id> est lidentiant (optionnel) du message, < emetteur> est lagent emetteur du message, <destinataire> est lagent ` a qui est destin e le message et < enonc e> correspond au contenu du message. Par exemple, le message suivant: (M1) A : B << bonjour}
313
est une communication point ` a point qui se r esume pour A ` a dire bonjour ` a B. Si le destinataire nest pas connu de l emetteur, le message est envoy e sous un mode appel e diusion (broadcasting) ` a tout un ensemble dagents, ces derniers etant li es ` a l emetteur par une relation de voisinage (proximit e dans lenvironnement, connexit e dans un r eseau, etc.). Ce type de communication est tr` es utilis e dans les syst` emes dynamiques dans lesquels des agents peuvent appara tre ou dispara tre. Il semploie en particulier dans des protocoles dallocation de t aches comme celui du r eseau contractuel dont nous parlons au chapitre 7. On notera ` a la place du destinataire le mot cl e Tous ou la relation de voisinage reliant l emetteur au destinataire. Par exemple, la communication (M2) A : Tous << bonjour
consiste ` a dire bonjour ` a tous les agents du syst` eme, et (M2) A : {x | dist(A,X)} < d} << bonjour}
` diuser le m a eme message ` a tous les agents dont la distance avec A est inf erieure a ` une valeur d. A la di erence des messages comportant un destinataire explicite, les messages dius ne sont pas n ecessairement des primitives du syst` eme. Ils peuvent en eet etre d ecrits par combinaisons de messages directs ` a condition quil existe une entit e responsable de la diusion. Par exemple, le message dius (M3) A : {x | P(x)} << M
peut sexprimer comme la combinaison des message M3 et M3" suivants: (M3) (M3") A : C << diffuser(M) pour tout x de Receveurs(C), C : x << M
o` u C est une entit e de diusion, un m ediateur, qui se contente de d el eguer un message a tous ses receveurs. Par exemple, si une entreprise d ` ecide denvoyer un mailing, elle sadressera ` a une entreprise sp ecialiste en marketing direct qui transmettra son message publicitaire ` a lensemble des personnes pr esentes dans son chier de mailing, lentreprise sp ecialis ee jouant alors le r ole de lentit e de diusion. Nature du m edium La nature du canal de communication joue aussi un r ole important dans la communication. On peut distinguer trois sortes de m ecanismes dacheminement de message: lacheminement direct, lacheminement par propagation dun signal et lacheminement par voie dache. 1. Lacheminement direct est le mode le plus simple: lorsquun agent d esire envoyer un message, celui-ci est pris par le canal de communication et apporte le message directement ` a son destinataire (ou ` a tous les destinataires potentiels dans le cas dun message dius) sans tenir compte de la distance (sauf si elle est explicitement mentionn ee dans len-t ete dun message dius) et sans donner la possibilit e` a dautres agents de le recevoir. Lexemple dans notre vie courante est celui du courrier postal ou electronique. Cest ce type dacheminement qui est le plus souvent pratiqu e dans les syst` emes multi-agents cognitifs.
314
2. Lacheminement par propagation dun signal est caract eristique du mode de communication des agents r eactifs. Un agent emet un signal qui se diuse dans lenvironnement et dont lintensit e d ecro t en fonction de la distance. Cette d ecroissance varie g en eralement soit lin eairement soit en fonction du carr e de la distance. Ainsi au point x, le signal poss` ede lune des intensit es V (x) suivantes: V (x) = V (x0 ) dist(x, x0 ) V (x) = V (x0 ) dist(x, x0 )2
o` u x0 correspond au point de la source du signal. De ce fait, plus un agent se trouve pr` es de la source, plus le signal emis sera fort. Si ce signal est consid er e comme un stimulus, les agents se trouvant pr` es de la source auront plus tendance ` a tenir compte de ce signal que les agents situ es plus loin. Ce type de communication rend
So Agent A
Agent B
Figure 6.2: Lagent A re coit un signal plus fort que celui de lagent B. dicile toute communication directe: tout agent situ e pr` es de la source peut recevoir le signal et linterpr eter comme il lentend. Pour adresser un message ` a un destinataire particulier, il faut ajouter des informations suppl ementaires. Par exemple dans le monde r eel, la communication parl ee n ecessite tout un ensemble dindices suppl ementaires (posture du corps, direction du regard, appel pr ealable, etc.) pour que deux personnes puissent communiquer directement et faire en sorte quun canal de communication privil egi e sinstaure entre l emetteur et le destinataire. La d ecroissance des signaux au cours du temps pr esente un impact majeur sur lorganisation dune soci et e dagents en d enissant des di erences topologiques entre les agents. Les di erences spatiales sont alors transform ees en di erences sociales par les agents. Si les agents sont sensibles ` a lintensit e des signaux, leur comportement sera aect e par leur position respective dans lenvironnement. Par exemple, supposons que lon dispose dun syst` eme multi-agent r eactif et quun stimulus S produit par une source au point x0 peut d eclencher le comportement P dans lun des deux agents A et B. Si A est plus proche de la source que B, puisque lintensit e du stimulus d ecro t en fonction de la distance, le niveau du stimulus sera plus elev e pour A que pour B, ce qui aura plus tendance (toutes choses egales par ailleurs) ` a d eclencher le comportement P chez A que chez B. En dautres termes, on peut dire que lappel du stimulus se fait plus pressant pour A que pour B (g. 6.2). Si de plus il existe un m ecanisme tendant ` a renforcer les comportements d ej` a d eclench es (par exemple si les agents utilisent une architecture de t aches en comp etition avec renforcement, cf. chap. 3), le simple fait que A se trouve plus pr` es dun signal que
315
B produira une sp ecialisation des comportements des deux agents. Cest ce que lon exprime en disant que les di erences topologiques conduisent ` a des di erences sociales. Cette caract eristique est tr` es utilis ee dans les syst` emes multi-agents r eactifs comme m ecanisme ` a la fois de di erenciation et de r egulation sociale comme nous le verrons au chapitre 8. 3. Le mode dacheminement par voie dache est moins utilis e dans les syst` emes multi-agents, sans grande raison dailleurs. Cest typiquement le m ecanisme de communication des petites annonces. Un agent, sil d esire communiquer, place son message dans un espace commun, appel e tableau dachage, tableau noir ou ether (Kornfeld 1979), visible par tous les agents (ou tous ceux dune classe particuli` ere). Ce mode de transport combine les caract eristiques des messages directs (rien nemp eche de mettre un destinataire en en-t ete) et ceux des messages dius. Il est cependant tr` es utilis e dans les architectures de types tableaux noirs (cf. chap. 3) o` u les sources de connaissances sont d eclench ees par les ev enements survenant sur le tableau noir, mais il na pas et e v eritablement envisag e comme m ecanisme dacheminement de communications entre agents, sauf dans le cas du syst` eme Ether (Kornfeld et Hewitt 1980) o` u les messages de demandes de r esolution, dhypoth` eses, de preuves et de r efutation jouent un r ole essentiel pour la r esolution de probl` emes distribu es. Lintention de communiquer Lagent veut-il communiquer ou non? Laction de communication est-elle li ee ` a une intention de l emetteur qui d esire ainsi obtenir quelque chose de son destinataire, ou bien sagit-il dune action incidente, dun processus ind ependant de la volont e de l emetteur? Ces deux formes de communication qui existent dans la nature se retrouvent dans les syst` emes multi-agents. Lorsque deux personnes conversent, lorsquun herbivore signale lapparition dun pr edateur aux autres membres de son groupe ou lorsquune personne envoie une lettre ` a un tiers, la communication peut etre quali ee dintentionnelle, en ce sens que l emetteur d ecide r esolument de communiquer quelque chose ` a son (ou ses) destinataire(s). Les communications intentionnelles proc` edent dun choix. Elles expriment une volont e, ou tout du moins une d ecision daction. Au contraire, les communications incidentes sont eectu ees sans que l emetteur y prenne une part active. Les traces dodeur ou les empreintes de pas, les postures du corps chez un etre humain sont de v eritables messages pour ceux qui veulent (ou peuvent) les interpr eter, mais ils sont souvent communiqu es ` a linsu de celui qui les envoie. Ces messages sont des epiph enom` enes de la pr esence ou de l etat dans lequel se trouvent les agents et peuvent etre utilis es par ceux qui y sont sensibles. On ne peut pas parler dintention dans ce cas. Lherbivore ne d esire pas sp ecialement exprimer sa pr esence ` a un pr edateur, mais son odeur dius ee dans latmosph` ere ou ses empreintes de pas sont le simple r esultat de sa pr esence. Les communications incidentes pr esentent deux caract eristiques notables: leur s emantique est li ee uniquement ` a l etat de l emetteur (sans que l emetteur soit n ecessairement capable de ma triser cette communication), et leur interpr etation, qui ne r esulte pas dun code x e` a lavance est totalement variable et ne d epend que
316
du receveur et de la signication quil lui donne. En eet, bien que lon puisse parler de langage des traces ou des postures du corps, le sens de ces signes r ef` ere en derni` ere analyse ` a l etat de celui qui les a produits dune part et des capacit es inf erentielles de celui qui les re coit dautre part. En ce sens, les communications incidentes sont totalement li ees aux inf erences interpr etationnelles du receveur (Sperber et Wilson 1986). De ce fait, ces messages peuvent etre employ es de mani` eres tr` es diverses en fonction du receveur du message. Par exemple, des traces peuvent etre utilis ees par un animal pour retrouver ses cong en` eres comme elles peuvent servir a ` le pister par un chasseur. Bien quil existe une s emantique (ce signe r ef` ere ` a un etat de l emetteur), il nexiste pas de pragmatique intrins` eque au message (le signe peut engendrer des comportements di erents chez les receveurs). Ce type de message doit donc etre nettement di erenci e des messages intentionnels dont la pragmatique peut etre analys ee par la th eorie des actes de langage comme nous le verrons plus loin. Lintention de communiquer nest pas une aaire de tout ou rien, mais un syst` eme gradu e qui d epend des capacit es cognitives de l emetteur. Les etudes des communications animales notamment ont permis de d egager les rapports complexes existant entre les capacit es de repr esentation dun individu et les formes de communications quil utilise (Vauclair 1992). J. Vauclair rappelle ainsi que D. Dennett (Dennett 1983) a propos e un ensemble de niveaux dintentionnalit e hi erarchis es selon une echelle de complexit e qui part de 0 pour aller jusqu` a un niveau th eorique n. Lintentionnalit e dordre 0 d ecrit les situations dans lesquelles l emetteur envoie un signal parce quil pr esente un certain etat interne (par exemple, crier sil a faim) ou parce quil re coit un certain stimulus (perception dun pr edateur par exemple) m eme sil nexiste aucun r ecepteur pour ce signal. La production de signal repose alors uniquement sur un rapport stimulus/r eponse et ne d epend aucunement dune quelconque d elib eration de la part de l emetteur, ce que lon peut exprimer en disant que: X envoie le message M parce que X per coit S o` u S est un signal. Dans ce cas, on dit que M est un message incident. Lintentionnalit e dordre 1 suppose lexistence dune volont e directe de l emetteur dobtenir un eet du r ecepteur. Par exemple, poser une question pour obtenir eectivement une r eponse ou crier pour faire quitter les lieux ` a un animal constituent des intentionnalit es dordre 1. On peut exprimer la relation entre le message et lintention de la mani` ere suivante: X envoie le message M ` a Y parce que X veut que Y fasse P La plupart des communications multi-agents dites intentionnelles se situent ` a ce niveau. Les niveaux sup erieurs soccupent des croyances produites par les messages. En particulier lordre 2 suppose que l emetteur ne veut plus directement obtenir une r eponse du r ecepteur mais une croyance portant sur un etat du monde. Sa forme logique est la suivante: X envoie le message M ` a Y parce que X veut que Y croie P
317
Par exemple, un individu X peut crier pour que son agresseur croie quil va attaquer. Lordre 3 peut etre d ecrit par la forme: X envoie M ` a Y parce que X veut que Y croie que Z croie P o` u Z d esigne un tiers. Les formes suivantes se ram` enent naturellement ` a des croyances imbriqu ees suppl ementaires. Ces di erents niveaux dintentionnalit e ne sont pas des caract eristiques externes quil est possible de d eterminer par observation. En eet, si lon voit un agent X envoyer un signal ` a Y et que lon observe une r eaction de Y, il nest pas possible den inf erer un quelconque niveau dintentionnalit e. Il se peut tout simplement que X poss` ede une intentionnalit e dordre 0 et que Y soit un agent r eactif directement d eclench e par le message de X, ou que X poss` ede une intentionnalit e dordre 2 et que Y a r eagi ` a la croyance induite par le message de X. Il est impossible de trancher simplement entre les deux situations. Pour en avoir le cur net, il faut soit avoir acc` es ` a larchitecture de X et Y et savoir quels sont leurs etats mentaux respectifs, soit eectuer des exp eriences complexes comme le font les sp ecialistes de la cognition animale (Vauclair 1992). On ne trouve g en eralement pas dans les syst` emes multi-agents toute la gamme des communications possibles. Le tableau 6.1 montre les principaux types de langages en indiquant leurs caract eristiques en termes de modes de diusion, dacheminement et dintentionnalit e.
Types de message Message symbolique point point Message symbolique diffus Annonce Signal Mode de communication Point point Diffusion gnrale Point point/ diffusion gnrale Diffusion Acheminement Direct Direct Tableau d'affichage Propagation Intentionnalit Gnralement intentionnel Gnralement intentionnel Gnralement intentionnel Incident
Table 6.1: Principaux modes de communication dans les syst` emes multi-agents Il est bien entendu possible dimaginer dautres types de messages, tels que des messages point ` a point achemin es par propagation, mais ils pr esentent a priori moins dint er et et ne sont g en eralement pas impl ement es.
6.1.4
A quoi sert la communication?
Nous avons class e les communications par rapport aux el ements de communication et non par rapport ` a ce qui fait lessence de la communication, cest-` a-dire la fonction quelle assure. Selon Roman Jakobson (Jakobson 1963), qui adopte sur le langage un point de vue fonctionnaliste, il est possible de classer les modes de communication selon leurs fonctions. Il en distingue six: les fonctions expressives,
318
conatives, d enotatives, phatiques, po etiques et m etalinguistiques. Cette derni` ere sera d ecompos ee par nos soins en fonction paralinguistique et m etaconceptuelle. La fonction expressive caract erise lattitude de l emetteur du message: elle indique l etat dans lequel se trouve cet agent et quelles sont ses intentions, ses buts et comment il juge et voit les choses. Cette fonction permet en particulier de synchroniser des agents et donc de coordonner leur t aches, mais aussi de mettre en commun leurs croyances. Cette fonction peut se r esumer par la phrase: Voil` a mon etat, voil` a ce que je pense, voil` a mes croyances. La fonction conative (du latin conari, entreprendre, essayer) renvoie au destinataire du message et correspond ` a la notion dordre ou de requ ete quun emetteur adresse ` a un destinataire. Il faut remarquer que la plupart des messages dans les syst` emes multi-agents les plus frustres assurent cette fonction. Elle est r esum ee par lune des phrases: Fais ceci ou R epond ` a ma question. On lui associe aussi les r eponses dacceptation et de refus. Il sagit certainement de la fonction la plus manifeste et la plus importante dans les syst` emes multi-agents. Nous l etudierons plus particuli` erement dans la section r eserv ee a la th ` eorie des actes de langage. La fonction r ef erentielle est centr ee sur le contexte. Cette fonction est garante de la transmission dinformations portant sur des faits du monde. Un message qui assure cette fonction porte alors sur un etat du monde ou dune tierce personne. Voil` a ce qui est est une phrase qui caract erise cette fonction. La fonction phatique sert essentiellement ` a etablir, prolonger ou interrompre une communication. Elle est utilis ee notamment pour v erier que le canal fonctionne. Les messages dacquittement chers aux protocoles des syst` emes distribu es rel` event essentiellement de cette fonction. Elle peut se r esumer par lexpression: Je veux communiquer avec toi, je re cois bien tes messages. La fonction po etique ou esth etique sattache ` a la mise en valeur du message lui-m eme. Dans les syst` emes multi-agents o` u laspect esth etique na pas encore et e trait e, la fonction po etique nest pas (ou peu) mise en evidence. La fonction m etalinguistique porte sur tout ce qui se rapporte aux messages, a la langue et ` ` a la situation de communication. Cette fonction est tr` es importante dans les syst` emes multi-agents, car elle permet ` a des messages de parler dautres messages, de la situation de communication et aussi de mettre a lunisson les concepts, le vocabulaire et la syntaxe employ ` es par les interlocuteurs. On distinguera la fonction paralinguistique qui se rapporte aux messages qui vont ou viennent d etre emis de la fonction m etaconceptuelle qui sattache a la d ` enition dun moule linguistique et conceptuel commun. La premi` ere porte sur les communications ant erieures et post erieures en sattachant aux objectifs de la communication et ` a limportance des messages. Des phrases du type Pourquoi me demandes-tu cela?, Je ne comprend pas, peux-tu pr eciser?, Ceci est tr` es important sont caract eristiques de cette fonction.
319
La seconde porte sur le code du message. Les interlocuteurs sassurent de la bonne compr ehension de ce qui vient d etre exprim e et de la d enition des concepts employ es. Cette derni` ere est souvent la plus complexe ` a mettre en uvre dans les syst` emes multi-agents car elle porte en particulier sur l elaboration de concepts communs, la d enition de notions communes. On peut r esumer cette fonction par la phrase par X je veux dire Y. Un message assure plusieurs fonctions en m eme temps. En particulier tout message poss` ede ` a la fois une fonction expressive et phatique. Par exemple, un message de la forme: (SM1) B: A << Quels sont les X tels que P(x) qui assure une fonction bien evidemment conative, comporte aussi une fonction expressive en indiquant que l etat de l emetteur B se trouve dans un etat o` u il cherche a savoir quelque chose. De plus, comme ` ` a tout message, on peut lui associer une fonction phatique: en eet, par sa seule pr esence, SM1 indique que B veut continuer le dialogue. On appellera fonction principale la fonction associ ee directement au type de message utilis e et fonctions secondaires les autres fonctions v ehicul ees par ce message. Dans lexemple pr ec edent, la fonction principale de M1 est conative, les fonctions expressives et phatiques etant secondaires. En revanche, un message de la forme: (SM2) B: A << Je crois que P(c)
assure une fonction essentiellement expressive. Outre la fonction phatique port ee par chaque message, M2 entretient une fonction r ef erentielle, puisquon y parle de quelque chose (lobjet C) auquel on attribue la propri et e P. Par exemple un message de la forme: (M2.1) B: A << Je crois que C est en position <x1,y1>
est un exemple possible du sch ema de message SM2. Il exprime non seulement la croyance que B place dans le positionnement de C en <x1,y1>, mais aussi le fait que C se trouve peut etre eectivement dans cette position si B ne sest pas m epris. Il existe en plus une fonction conative secondaire, si lon interpr` ete ce message comme une tentative de la part de B de convaincre A de croire ` a la v eracit e de P(C), cesta-dire sil est interpr ` et e par B comme un message de la forme: (M2.2) B: A << Je veux te convaincre que C est bien en position <x1,y1>
La communication sexprime aussi comme un contrat cognitif (Ghiglione 1986) dans lequel l emetteur suppose connu certaines informations et donc en avance de nouvelles sans rappeler les anciennes. Grice a donn e quelques conseils, sous la forme de maximes (Grice 1975), sur la mani` ere dintervenir dans une conversation de mani` ere la plus concise et pertinente possible. Par exemple, la maxime de quantit e pr ecise quun message doit etre aussi informatif que possible, mais pas plus
320
que n ecessaire. La maxime de qualit e prescrit de ne donner que des informations vraies, ou tout du moins que l emetteur croit vraies. Ces maximes peuvent etre utilis ees dans le cadre de syst` emes multi-agents (Gleizes et al. 1994), non pas comme Grice lentendait, pour essayer davoir la meilleure communication possible, mais a contrario comme point de d epart pour concevoir un syst` eme communicationnel. Ainsi, on supposera que tous les agents ne communiquent que des informations quils croient vraies (postulat dhonn etet e) et r epondent syst ematiquement aux demandes qui leur sont adress ees (postulat de politesse). La notion de contrat cognitif est aussi a rapprocher de celle dengagement que nous avons vu au chapitre 5 et qui porte sur ` le fait quil existe n ecessairement un substrat commun pour que deux agents puissent communiquer. Ce substrat nest pas forc ement xe et d etermin e une fois pour toutes. Bien au contraire les recherches actuelles en psychologie sociale de la communication mettent laccent sur la facult e qua la communication de produire et dentretenir des univers cognitifs communs, cest-` a-dire une co-construction de la r ef erence (Ghiglione 1989). Malheureusement, cette conception de la communication comme source de construction du mod` ele cognitif des interlocuteurs et du langage lui-m eme semble parfois un peu trop en avance pour les possibilit es techniques dont nous disposons ` a lheure actuelle dans la r ealisation de syst` emes multi-agents, car elle suppose une certaine plasticit e du langage, la possibilit e de jouer sur la polys emie des termes et sur les connotations engendr ees par les mots et les enonc es, et pose le probl` eme central du symbole et de sa signication, un probl` eme crucial que les syst` emes multi-agents ne peuvent pr etendre r esoudre seuls.
6.2
Les actes de langage
Il est des th eories qui semblent ` a la fois etre une evidence et en m eme temps constituer une rupture majeure avec les conceptions pr ec edentes. Ceci est particuli` erement vrai pour ce que lon appelle maintenant la pragmatique du discours, ou plus simplement les actes de langage. Il sagit dune th eorie majeure de la philosophie du langage qui pr esente un grand int er et pour lanalyse des communications symboliques point ` a point dans les syst` emes multi-agents.
6.2.1
Dire, cest faire
La parution, en 1962, du livre dAustin How To Do Things With Words (Quand dire, cest faire) t un peu leet dune bombe. Pour tous les linguistes, descendants de Ferdinand de Saussure, et pour tous les philosophes de la langue issus du positivisme logique, etudier le langage, c etait essayer de comprendre le sens des phrases en indiquant comment ` a partir dune combinaison de mots il est possible de donner un enonc e signiant. Pour les th eoriciens de la s emantique du langage, cest-` adire de l etude du sens des enonc es, limportant etait de comprendre comment une phrase pouvait rendre compte de mani` ere satisfaisante de la r ealit e. Pour cela, ils sint eressaient essentiellement ` a savoir quel etait le degr e de v erit e (ou de fausset e) dune phrase constative, cest-` a-dire qui arme quelque chose du monde. De ce fait,
6.2. LES ACTES DE LANGAGE
321
les th eoriciens ne sint eressaient qu` a la fonction d enotative du langage, cest-` a-dire au r ole de transfert dinformations, n egligeant par l` a m eme les autres aspects de la communication et en particulier la fonction conative qui traite de laction sur le destinataire du message. Dans ce cadre, nul ne se posait v eritablement la question de savoir ` a quoi sert le langage, ou plus exactement, comme lindique le titre anglais du livre dAustin, de savoir si lon pouvait faire des choses avec des mots. Pour Austin et ses successeurs, dont le plus important est sans conteste John Searle, l enonciation, cest-` a-dire le fait de produire un enonc e, est un acte qui sert avant tout ` a produire des eets sur son destinataire. Lorsquon dit passe moi le sel a ` table, on ne sint eresse pas directement ` a la v erit e ou ` a la fausset e de la phrase, mais surtout ` a leet que cette demande peut produire sur son interlocuteur et donc ` a ce que ce dernier passe eectivement le sel. Plus exactement cette phrase nest ni vraie ni fausse, mais elle renvoie ` a une action qui peut r eussir ou echouer. De ce fait le probl` eme de la v erit e perd sa place centrale et laisse le champ libre aux crit` eres de succ` es de la communication, cest-` a-dire ` a la pragmatique des communications. Mais quest-ce quun acte de langage? Les actes de langage d esignent lensemble des actions intentionnelles (au sens op eratoire de perform) eectu ees au cours dune communication. Il existe plusieurs types dactes de langage. Dapr` es Searle (Searle 1979) et Vanderveken (Vanderveken 1988) on peut distinguer les principaux types dactes suivants: 1. Les assertifs servent ` a donner une information sur le monde en armant quelque chose (exemple: il fait beau, Jean a 21 ans, les rectangles ont quatre angles droits). 2. Les directifs sont utilis es pour donner des directives au destinataire (exemple: donne moi ta montre, lave-toi les mains, quelle est la valeur de la troisi` eme d ecimale de ). 3. Les promissifs engagent le locuteur ` a accomplir certains actes dans lavenir (exemple: je viendrai ` a la r eunion de 5 heures, je te promets de tenvoyer des cartes postales). 4. Les expressifs servent ` a donner au destinataire des indications concernant l etat mental du locuteur (exemple: je suis heureux, je mexcuse pour hier, je te remercie). 5. Les d eclaratifs accomplissent un acte par le fait m eme de prononcer l enonc e (exemple: je d eclare la s eance ouverte, je vous condamne ` a 2 ann ees de prison, je te maudis, je vous engage). Cette classication, malgr e son int er et pratique, nest pas toujours consid er ee comme totalement d enitive. Elle pose encore de nombreux probl` emes qui font lobjet de recherches dans le domaine de la pragmatique linguistique (R ecanati 1981; Moeschler 1989). En particulier comment classer les expressions conditionnelles (exemple: si tu nes pas sage, tu nauras pas de dessert) ou les injures. De plus, elle est trop g en erale et ne peut etre utilis ee telle quelle pour r ealiser des syst` emes multi-agents. Cest
322
pourquoi nous serons amen e` a proposer une classication plus ne que la pr ec edente. Cette op eration sera eectu ee en deux temps. Dune part, nous d ecomposerons les directifs en interrogatifs qui servent ` a poser une question pour obtenir des informations et en exercitifs qui demandent ` a un agent daccomplir une action dans le monde. Dautre part, nous anerons notre analyse en d enissant des sous-actes de langage en d etaillant lobjet (ou laction) sur lequel porte lacte et, surtout, comme nous le verrons par la suite, en caract erisant la structure conversationnelle dans laquelle il sins` ere.
6.2.2
Actes locutoires, illocutoires et perlocutoires
Depuis Austin (Austin 1962) et surtout Searle (Searle 1969), les actes de langage sont d enis comme des structures complexes form ees de trois composantes, consid er ees comme des actes el ementaires: La composante locutoire concerne la g en eration mat erielle des enonc es par emission dondes sonores ou par ecriture de caract` eres, cest-` a-dire le mode de production de phrases ` a laide dune grammaire et dun lexique donn es. La composante illocutoire se rapporte ` a la r ealisation de lacte eectu e par le locuteur sur le destinataire de l enonc e. Les actes illocutoires, les plus etudi es en pragmatique du langage, sont caract eris es par une force illocutoire (exemple: armer, questionner, demander de faire, promettre, ordonner, pr evenir, etc.) et par un contenu propositionnel qui est lobjet de la force illocutoire. Il est ainsi possible de repr esenter ces actes sous la forme F(P) o` u F est la force illocutoire et P le contenu propositionnel. Par exemple, armer quil pleut se mettra sous la forme: Affirmer(il pleut) alors que linterrogation correspondante, Est-ce quil pleut?, sera repr esent ee ainsi: Questionner(il pleut) cette expression indiquant quil sagit dune question. Souvent les actes illocutoires sont indiqu es par la pr esence dun verbe, appel e performatif, qui marque le type dacte. Par exemple, la phrase Je te demande de venir demain matin marque un acte illocutoire directif introduit par le performatif demander. La notion de performatif est utile pour les syst` emes multi-agents, puisque ce sont les performatifs qui indiqueront les di erents types dactes de langage que peuvent emettre et interpr eter les agents. De ce fait, les enonc es des messages sont exprim es sous la forme <performatif>(<contenu>)
323
o` u <performatif> est un mot cl e qui d esigne le type dacte illocutoire associ e au message, et <contenu> est la forme propositionnelle. La composante perlocutoire enn porte sur les eets que les actes illocutoires peuvent avoir sur l etat du destinataire, ses actions, ses croyances et ses jugements. Par exemple, convaincre, inspirer, erayer, persuader, etc. sont des actes perlocutoires. Ceux-ci ne sont pas introduits par des performatifs mais doivent etre compris comme des cons equences des actes illocutoires. Par exemple, la phrase Je tarme que la Terre tourne autour du Soleil est un acte illocutoire darmation, qui peut etre pris, dans un certain contexte d enonciation, comme une tentative de convaincre le destinataire que la Terre tourne et donc de modier lensemble de ses croyances. De m eme lorsquon demande ` a quelquun de faire quelque chose, le fait quil ait compris quil sagisse dun exercitif montre quil a reconnu la composante illocutoire de lacte, et sil accomplit eectivement ce qui lui a et e demand e, alors on peut dire que la composante perlocutoire a et e satisfaite. Tous ces actes se trouvent pr esents dans la m eme expression ` a di erents niveaux. Cest pourquoi on peut aussi parler des aspects locutoires, illocutoires et perlocutoires des expressions. Lorsque nous parlerons dactes de langage, nous nous r ef ererons implicitement ` a la totalit e de ces trois aspects et pas seulement aux actes illocutoires comme le font Searle et un certain nombre dauteurs, m eme sil sagit dun des aspects les plus important.
6.2.3
Succ` es et satisfaction
Comme nous lavons vu, un enonc e nest pas vrai ou faux, il r eussit ou echoue. Par exemple, si lagent A demande ` a B de r esoudre une equation di erentielle, et que B ne sache pas le faire, la demande echouera. Il en est de m eme si B na pas compris la demande. Dans les deux cas, lacte de langage na pas r eussi. Ainsi, un acte de langage peut manquer son but de plusieurs fa cons. Il peut le faire: 1. Dans l enonciation de lacte: Que la transmission ne seectue pas bien, que le locuteur balbutie, quil y ait du bruit sur la ligne ou que le destinataire ne comprenne pas la langue utilis ee par l emetteur et lacte echouera soit parce quil ne sera pas compris, soit parce quil entra nera une m eprise de la part du destinataire. 2. Dans linterpr etation de lacte: L emetteur sexprime correctement et le message est arriv e` a bon port, mais le destinataire ninterpr` ete pas correctement la force illocutoire de l emetteur. Par exemple, si ` a la question: (M4) A: B << Questionner(il pleut)}
le destinataire B comprend en fait (M4) A: B << Affirmer(il pleut)}
324
CHAPTER 6. COMMUNICATIONS il confondra une question et une armation, ce qui peut lamener ` a produire une r eponse que A consid erera peut etre comme bizarre: (M5) B: A << Affirmer(je vais donc prendre mon parapluie)}
3. Dans la r ealisation eective de lacte entra n e par l enonciation: Les causes d echec sont multiples. Il sut par exemple que lun des interlocuteurs nait pas la comp etence pour r ealiser cet acte. Si A demande ` a B de r esoudre un probl` eme d equations di erentielles et que B ne sache pas le faire, cela constituera un echec. Dune mani` ere g en erale un refus du destinataire conduit ` a faire echouer tous les actes directifs, cest-` a-dire qui portent sur une question ou sur une demande daccomplir une action. De m eme, les promesses sont caduques si l emetteur nest pas capable de remplir ses promesses. La promesse Je te rendrai ton argent demain risque d echouer si l emetteur est totalement sans le sou et quil na aucun moyen de rendre cet argent. De m eme un prisonnier qui promet ` a une personne hors de prison quil viendra la voir demain aura toutes les chances de faire echouer sa promesse sil nest pas lib er e entre-temps. Vanderveken (Vanderveken 1988) propose une autre classication concernant laspect pragmatique des actes de langage en di erenciant le succ` es de la satisfaction. Les conditions de succ` es sont celles qui doivent etre remplies dans un contexte d enonciation pour que l emetteur r eussisse ` a accomplir cet acte. Une promesse a comme condition de succ` es que le locuteur sengage eectivement ` a accomplir lacte correspondant ` a la promesse. De m eme une d eclaration, telle que je d eclare la s eance ouverte a comme condition de succ` es que le locuteur ait bien lautorit e lui permettant cette d eclaration. Il y a donc succ` es si le locuteur accomplit lacte illocutoire impliqu e par l enonc e. Par exemple, comme le signale C. Brassac (Brassac 1992), le message (M5) A: B << DemanderFaire(P)}
est accompli avec succ` es et sans d efaut si: a) le locuteur tente de faire en sorte que son interlocuteur ajuste le monde aux mots (cest-` a-dire que le monde soit dans l etat que d ecrit P), b) avec une certaine position dautorit e, c) en lui laissant la possibilit e de refuser, d) linterlocuteur est dans la capacit e de le faire et e) le locuteur d esire que ce dernier le fasse (le d esir est le mode psychologique relatif aux conditions de sinc erit e des directifs). En revanche, les conditions de satisfaction sont relatives ` a la composante perlocutoire et prennent en compte l etat du monde r esultant de cet acte. De ce fait, lacte de langage associ e au message M5 est satisfait si B accomplit P. De m eme une question est
325
satisfaite si le destinataire r epond ` a la question, une armation si elle est vraie, une promesse si elle est tenue. La condition de satisfaction est donc plus forte, puisquelle prend en compte le r esultat de laccomplissement de P. Ainsi la satisfaction entra ne le succ` es, mais non linverse.
6.2.4
Composantes des actes illocutoires
An de mieux comprendre la structure des actes illocutoires, Searle (Searle 1969) d ecrit les di erents types dactes de langage par lensemble des conditions quil estime n ecessaires et susantes pour leur accomplissement: 1. Conditions de d epart et darriv ee ou dentr ee/sortie: elles portent sur le fait que le message peut arriver de l emetteur, qui nest pas muet, au destinataire, qui nest pas sourd, et donc quil existe un canal de communication en etat de fonctionnement entre les deux interlocuteurs. En dautres termes, la fonction phatique de la communication est assur ee. 2. Conditions sur le contenu propositionnel: les actes de langage supposent g en eralement une structure particuli` ere de la syntaxe des contenus propositionnels qui leur sont associ es. Ces conditions portent donc sur les restrictions grammaticales et conceptuelles concernant le contenu de ces propositions. 3. Conditions pr eparatoires: elles portent sur ce qui doit etre vrai dans le monde pour quun locuteur puisse accomplir un acte de langage. Dans le cas des exercitifs, cest-` a-dire dans le cas dun enonc e tel que M5, ces conditions sont les suivantes: B est capable de faire P A croit que B est capable de faire P il nest pas certain, ni ` a A ni ` a B que B fera P On peut remarquer que ces conditions pr eparatoires ressemblent fort ` a la d enition logique de lintention du chapitre 5. En eet, communiquer cest agir, et il nest pas curieux que les conditions de r ealisation dune communication intentionnelle soient tr` es voisines des conditions dex ecution dune action intentionnelle. La di erence essentielle vient de la pr esence ici de deux agents (pour communiquer, il faut etre au moins deux), alors que dans laction intentionnelle on ne mettait en uvre quun seul agent (on peut agir seul). 4. Conditions de sinc erit e: un acte ne peut r eussir que si le locuteur est sinc` ere, cest-` a-dire sil veut r ealiser ce quil pr etend faire en enon cant sa phrase. Dans le cas dune demande daction, cela signie que A veut r eellement que B accomplisse laction P. De la m eme mani` ere, si A fait une promesse ` a B de faire P, cela signie quil a vraiment la volont e deectuer P dans le futur. Enn, sil sagit dune armation, A est suppos e croire en ce quil arme. Ces conditions, qui ne sont pas toujours r ealis ees lors dagents naturels, sont evidentes pour des agents articiels.
326
5. Condition essentielle: il sagit en fait de ce que veut r eellement faire le locuteur en eectuant un acte de langage. Si le locuteur pose une question, cest parce quil d esire obtenir une information. Sil demande de faire quelque chose, cest parce quil veut que laction soit accomplie, etc. A cette condition essentielle, nous pr ef erons la notion de but illocutoire de Vanderveken, qui correspond ` a lintention principale amenant la r ealisation de lacte. Ces buts, dapr` es lui, sont au nombre de 5 et correspondent aux di erents types dactes de langage: buts assertif, promissif, directif, d eclaratif et expressif. 6. Le degr e de puissance de Vanderveken (Vanderveken 1988) correspond ` a lintensit e avec laquelle lacte est accompli. Par exemple, sil sagit dun acte exercitif, la supplication est plus forte que la simple demande car elle suppose un d esir daccomplissement plus fort. De m eme, la conjecture est plus faible que lassertion qui est elle-m eme plus faible quune armation solennelle. Cependant, nous pr ef ererons par la suite classer les actes de langage relatifs ` a tous ces degr es de puissance en une taxonomie portant sur leur r ole dans des sch emas de communication, plut ot que de les caract eriser par une simple valeur num erique, ce qui g en eralement est la marque dune analyse supercielle. Cohen et Perrault (Cohen et Perrault 1979) ont remarqu e que toutes ces conditions ne se situaient pas du tout sur le m eme plan. Alors que certaines se rapportent ` a laspect locutoire du message, dautres se rapportent ` a lintentionnalit e du locuteur, cest-` a-dire ` a ce quil d esire accomplir lorsquil emet un message. Par exemple, le but illocutoire est directement relatif ` a lintention de l emetteur et les conditions pr eparatoires aux connaissances quun agent poss` ede sur un autre agent.
6.3
Les conversations
La th eorie des actes de langage telle quelle a et e d evelopp ee par Austin, Searle, Vanderveken, R ecanati et dautres ne prend en compte que lacte isol e, l enonciation initiale avec ses conditions dapplication et les eets locaux quelle peut avoir sur les interlocuteurs. Elle ne traite absolument pas de la s equence dinteractions qui s etablit entre les interlocuteurs lors de leurs communications ni de leurs attentes r eciproques. Par exemple, un agent qui pose une question sattend ` a une r eponse ou a un refus, une promesse conduit par la suite ` ` a la r ealisation de la promesse ou au d edit de cette promesse par le locuteur, de m eme quune armation entra ne une acceptation du genre Je le savais d ej` a ou ` a une d en egation Cela nest pas possible. De ce fait, la notion dinteraction dialogique est parfois oubli ee par les actes de langage. N eanmoins, une ecole de pens ee, essentiellement europ eenne, autour de Moeschler (Moeschler 1985) ` a Gen` eve et de Trognon et Brassac ` a Nancy (Trognon et Brassac 1988), a tent e de fournir une th eorie des encha nements conversationnels ` a partir dune extension de la logique illocutoire formalis ee par Searle et Vanderveken (Searle et Vanderveken 1985; Vanderveken 1992). Dans ce cadre, les actes de langage sont les unit es el ementaires permettant danalyser les conversations. En particulier,
6.3. LES CONVERSATIONS
327
Brassac et Trognon ont montr e quil etait possible dassigner la force illocutoire dun enonc e` a partir des enonciations futures et que lattribution dun acte de langage r esulte dun processus de co-interpr etation des enonc es (Trognon et Brassac 1992). Cette approche semble particuli` erement f econde dans le cadre des conversations humaines car elle ne suppose pas quil existe a priori une et une seule interpr etation possible dun enonc e. Au contraire, une phrase ne prend son sens que par lensemble des r eactions quelle suscite chez les interlocuteurs, la signication pragmatique, et donc la force illocutoire, etant reconstruite a posteriori. N eanmoins, cette th eorie est encore en avance par rapport aux possibilit es des syst` emes multi-agents. Nous proposerons donc une autre extension de la th eorie des actes de langage qui sappuie sur la d enition de protocoles de communication, en consid erant que tout acte de langage suppose un certain encha nement possible des enonciations et quil engendre certaines modications dans l etat mental des interlocuteurs. En eet, un acte de langage nest pratiquement jamais accompli isol ement, et il se trouve souvent a ` lorigine dautres actes. Par exemple, une promesse telle que Je te promets de venir demain constitue un engagement du locuteur pour eectuer un acte particulier, celui de venir, ` a un moment pr ecis, le lendemain. De m eme, la demande (M5) A: B << DemanderFaire(P)
est un acte de demande daction et se trouve ` a lorigine de toute une s erie dactions ult erieures: lacceptation ou le refus de B deectuer P, eventuellement la r ealisation de la t ache P et sa signalisation ` a A. Ces cons equences sont importantes car elles entra nent des attentes de la part du locuteur. Ce dernier, en fonction des messages de B, pourra prendre des dispositions concernant ses propres actes ` a accomplir et sera ainsi ` a m eme danticiper sur le futur. Par exemple, si lagent B accepte de faire P, A peut supposer que laction P sera termin ee ` a la date D+T o` u D est la date de d ebut de laction P et T est le temps normal de r ealisation de P. Par exemple, si A est le propri etaire dune maison, B un peintre et P laction de peindre le salon de la maison de A, le message M3, sil est accept e par B peut amener A ` a penser que son salon sera repeint apr` es un certain temps. La d enition de ce temps peut lui m eme faire lobjet de transactions ou bien se r ef erer au temps normal dex ecution, cest-` adire faire r ef erence ` a une conception standard, partag ee par les interlocuteurs, des caract eristiques normales de la r ealisation de la t ache en question. En eet, un agent A qui pose une question ` a un agent B, cest-` a-dire qui emet un message de la forme: (M6) A: B << Questionner(quel est lensemble {x | P(x)})
attend lune des trois r eactions suivantes: 1. La r eponse ` a la question: (M7) B: A << R eponse(M6, a1,..,an) o` u les a1,..,an sont les r eponses ` a la question pr ec edente, cest-` a-dire les valeurs de x qui satisfont P(x); 2. Un refus de r epondre ` a la question, eventuellement adjoint dune explication: (M7) B: A << RefuserIncomp etentDemande(M6)
328
3. Une demande de renseignements compl ementaires (en passant au niveau m eta, puisquil est n ecessaire de parler de la communication): (M7") B: A << M etaQuestionner(M6, Arguments(P)) La mod elisation de ces conversations passe notamment par la d enition de protocoles, cest-` a-dire de s equences valides de messages. Il existe plusieurs mani` eres de d ecrire des protocoles, mais les plus courantes utilisent des automates ` a etats nis ou des r eseaux de Petri.
6.3.1
Conversations et automates ` a etats nis
Une conversation peut se d ecrire comme une suite d etats li es par des transitions, les communications que s echangent les agents et donc se mod eliser sous la forme dun automate ` a etats nis (Winograd et Flores 1986). La gure 6.3 montre lautomate correspondant ` a une conversation initialis ee par un exercitif.
B: A << NoticationFinAction(P)
3
B: A << AccepterFaire(P) A: B << DemanderFaire(P)
B: A << EchecFaire(P)
5 6
B: A << RefuserFaire(P)
Figure 6.3: Automate de description dune conversation commen cant par un exercitif Initialement la conversation se trouve dans l etat 1. Puis A, en demandant ` a B daccomplir une action P, entame la conversation, qui passe alors dans l etat 2. Plusieurs possibilit es souvrent alors: B peut accepter, ce qui lengage aupr` es de A ou B peut refuser (par exemple en se consid erant incomp etent pour accomplir cette action). Il est aussi possible pour B de passer au niveau m eta en demandant des pr ecisions suppl ementaires, mais ceci nest pas pris en compte dans le diagramme. En fonction des r eponses de B, la conversation passera dans l etat 3 ou 6, d eterminant ainsi les suites de communications possibles. La conversation est consid er ee comme termin ee lorsque lautomate atteint lun de des etats terminaux 4, 5 et 6. A partir des remarques de Winograd et Flores (Winograd et Flores 1986) sur la nature des conversations, il est possible dindiquer les propri et es principales que doivent remplir ces structures communicationnelles: 1. Les conversations d ebutent par un acte de langage majeur (assertif, promissif, exercitif, interrogatif, d eclaratif et expressif) et sexpriment comme le r esultat dune intention dun agent envers un autre agent. 2. A chaque etape de la conversation, il existe un ensemble r eduit dactions possibles. Ces actions sont des actes de langage majeurs ou mineurs (exemple: refus, acceptation, etc.).
329
3. Il existe des etats terminaux qui d eterminent la n dune conversation. Lorsque lun de ces etats est atteint, la conversation est consid er ee comme achev ee. 4. La r ealisation dun acte de langage modie non seulement l etat du discours, mais aussi l etat des agents (croyances, engagements, intentions) impliqu es dans la conversation. Par exemple, lorsquun agent B indique quil ne peut pas accomplir une action P parce quil lui manque la comp etence pour la faire, lagent A peut mettre ` a jour ses accointances en modiant la repr esentation quil a de B. De m eme lorsque B sengage aupr` es de A pour accomplir P, ce dernier peut ajouter cette promesse dans sa liste des engagements.
6.3.2
Conversations et r eseaux de Petri
Les automates ` a etats nis sont tr` es pratiques pour pr eciser la structure des conversations lorsquelles apparaissent de mani` ere isol ee, cest-` a-dire lorsquon peut ramener une conversation ` a un seul processus. Cependant, les agents sont parfois engag es dans plusieurs conversations ` a la fois et il leur faut g erer ces conversations multiples. Il est alors plus facile de d ecrire la nature de ces interactions en utilisant les r eseaux de Petri introduits au chapitre 4. Ces derniers sont dailleurs tr` es utilis es pour mod eliser des protocoles dans des syst` emes distribu es (par exemple (Estraillier et Girault 1992)) et il nest pas etonnant quon puisse les utiliser pour d ecrire des conversations entre agents. Cette approche, qui na et e pour linstant que tr` es peu d evelopp ee dans le cadre des syst` emes multi-agents (sauf par (Coria 1993) et (Ferber et Magnin 1994)), semble pourtant promise ` a un bel avenir. La gure 6.4 montre un r eseau de Petri correspondant au traitement dun exercitif identique ` a celui de la section pr ec edente. Chaque agent est d ecrit par un sous-r eseau de Petri, dont les places correspondent aux etats internes de lagent (ou de la t ache en cours, comme nous le verrons par la suite). Les transitions correspondent soit ` a des synchronisations dues ` a la r eception de messages, soit ` a des conditions dapplications des actions, telles que les conditions essentielles ou pr eparatoires des actes de langage associ es. Les messages en cours dacheminement sont repr esent es par des places suppl ementaires qui raccordent les agents A et B de mani` ere ` a ne plus former quun seul r eseau. Les places DA et DB d ecrivent les etats initiaux dans lesquels se trouvent les agents avant le d ebut de la conversation et les places FA1, FA2 et FB repr esentent les etats de n de conversation. A partir de l etat DA, lagent A envoie une requ ete a B et passe dans l ` etat AR1 qui repr esente une attente de r eponse. Si B ne sait pas faire P, il renvoie un refus ` a A, qui passe alors dans l etat FA1, ce qui indique que A doit chercher ailleurs la r ealisation de P. Si B peux faire P, il envoie un message dacceptation ` a A, qui se place de nouveau en attente de r eponse. Pendant ce temps, B se trouve dans l etat BR en essayant daccomplir laction P. Sil peut la faire, alors il envoie une notication de n daccomplissement, ce qui place lagent A en etat FA2, sinon il indique quil ne lui est pas possible de faire P, mais dans les deux cas il passe dans l etat terminal FB. Lint er et de cette approche est de pouvoir non seulement expliquer les echanges
330
Agent A DA <n,A,B,P> <n,A,B,P>
Agent B DB DemandeFaire(P) B ne sait pas faire ou ne veut pas faire P RefuserFaire(P) AR1 <n,A,B,P> n=n n=n ImpossibleFaire(P) Succs AR2 n=n <n,A,B,P> <n> Accompli(P) <n> n=n Satisfaction FA2 FB <n,P> <n> <n,P> <n> <n,A,B,P> <n> AccepteFaire(P) <n> <n,P> <n,A,B,P> B sait faire P <n,P> <n,A,B,P>
A veut faire P A ne peut pas faire P
R <n,A,B,P>
Impossible de faire P P est ralis
FA1
Figure 6.4: Mod elisation dune conversation par r eseau de Petri entre les agents, mais aussi de pr eciser les etats internes dans lesquels ils se trouvent, et donc de d ecrire plus nement ce qui se passe au cours dune conversation. On notera dailleurs que toutes les caract eristiques li ees aux actes de langage se retrouvent ici. Par exemple les etats de succ` es et de satisfaction de la demande initiale sont gur es respectivement aux places AR2 et FA2. Les r eseaux de Petri permettent m eme de mod eliser plusieurs communications simultan ees avec plusieurs correspondants en utilisant les r eseaux de Petri color es. Dans ce cas, ce ne sont plus des jetons qui circulent sur les places et franchissent les transitions, mais des structures qui repr esentent les conversations en cours. Pour que les agents puissent sy retrouver et ne confondent pas les messages de plusieurs conversations di erentes, on num erote chaque message par un num ero dordre correspondant ` a la conversation ` a laquelle il appartient. Cest ce que nous verrons ` a la section suivante, avec une mod elisation des actes de langage ` a laide de Bric.
6.3.3
Une classication des actes de langage pour des structures conversationnelles multi-agents
Il est bien dicile de donner une taxonomie g en erale de tous les actes de langage pouvant etre utilis es par des agents intentionnels, et cela pour plusieurs raisons. En premier lieu, l etendue des performatifs n ecessaires ` a la r ealisation dun syst` eme multi-agent donn e d epend bien evidemment des capacit es des agents eux-m emes. Si ces derniers ne sont pas capables de sengager par exemple, les promissifs ne serviront ` a rien. En deuxi` eme lieu, il nest pas toujours facile de savoir si un acte particulier doit faire lobjet dun nouveau performatif ou sil faut au contraire utiliser
331
des modalit es dans le contenu propositionnel. Par exemple, pour quun agent puisse demander ` a un autre agent de le pr evenir chaque fois quil recevra une information portant sur un sujet donn e, faut-il d enir un nouveau performatif et envoyer des messages de la forme (M20) A: B << DemanderPrevenirNouvellesInformationsSur(S)
ou bien au contraire utiliser un acte exercitif plus g en eral et d ecrire laction consistant a ` pr evenir dans le contenu propositionnel, quitte ` a ce que ce langage puisse contenir lui-m eme des mentions aux performatifs, en particulier pour d ecrire des actes conditionnels? (M21) A: B << DemanderFaire(si(info(x) & type(x,S) alors Informer(A,x))
Il est evident quun choix dans un sens ou un autre aura un impact important sur lensemble des performatifs, mais aussi sur le langage de communication utilis e dans la forme propositionnelle, et que ces deux langages sont compl ementaires lun de lautre: plus lensemble des performatifs est important, plus le langage de contenu propositionnel peut etre simpli e. Au contraire, un ensemble de performatifs r eduit renverra toute la dicult e sur le langage de description. Malgr e toutes ces dicult es, nous pr esentons ici une classication dun ensemble dactes de langage destin es ` a etre utilis es dans un syst` eme multi-agent. On d enit ces types par genre et esp` ece, cest-` a-dire en les classant hi erarchiquement. Au niveau le plus g en eral se trouvent les genres, cest-` a-dire les actes principaux d enis dans leurs caract` eres g en eriques. Au niveau inf erieur se situent les sous-types correspondant ` a des esp` eces, cest-` a-dire ` a des sp ecialisations de ces actes principaux. Le tableau 6.2 r epertorie quelques actes de langage el ementaires, avec leur cat egorie pragmatique et des exemples de performatifs caract eristiques. Les sous-types sont
Type de performatif Demande Interrogation Affirmation Offre de service Proposition d'hypothse Exemple de performatif
DemanderFaire Questionner Affirmer OffrirService
Catgorie Exercitif Interrogatif Assertif Promissif Expressif Expressif
Indication de comptences S a i t F a i r e
ProposerHypothse
Table 6.2: Quelques actes de langage el ementaires construits par di erenciation de ce type principal en associant lobjet (ou laction) sur lequel porte lacte de langage. Les performatifs des sous-types sont obtenus par concat enation du performatif du type et des objets ou des actions qui pr ecisent le sens de lacte. Par exemple, les performatifs des sous-types de Demande seront form es par concat enation de Demander et des arguments suppl ementaires, tels que
332
DemanderFaire pour quune action soit accomplie, ou DemanderR esoudre pour solliciter un calcul. Evidemment ce proc ed e sera r eit er e jusquau niveau de d etail voulu. Cependant, pour des raisons de simplication, certains performatifs seront d enis ` a partir de mots plus courts et plus faciles ` a comprendre. Par exemple, le performatif Aviser devrait en fait s ecrire InformerDemanderPr evenir dapr` es notre syst` eme de d enomination. On distingue deux grands groupes dactes de langage: les actes initiateurs qui sont ` a lorigine dune conversation et les actes r eponses qui ninterviennent quen r eponse ` a un acte initiateur. A ces actes el ementaires, il faudrait ajouter dautres types dactes plus complexes qui sappuient sur des structures conversationnelles plus elabor ees, telles que lappel dore ou les di erentes formes de collaboration, de coordination daction et de n egociation, que nous verrons aux chapitres suivants. El ements de description des actes de langage Les actes de langage seront donn es sous une forme double: une che regroupe les informations de lacte et un diagramme Bric d ecrit la structure conversationnelle associ ee. Les ches exposent pr ecis ement les conditions dapplication dun acte de langage du point de vue de linitiateur de lacte, reprennent les composantes des actes illocutoires en indiquant le but illocutoire, les conditions essentielles et pr eparatoires d ecrites par Searle et Vanderveken, ainsi que les conditions de succ` es et de satisfaction. Elles comprennent aussi les echecs possibles et leurs cons equences normales. Une che est compos ee des parties suivantes:
Format : d ecrit la syntaxe du message associ e` a lacte. Il est de la forme A : B << F(P1,...,P o` u A est lagent emetteur, B le destinataire, F est le performatif indiquant lacte de langage, et les Pi sont les arguments du performatif repr esentant le contenu propositionnel de lacte. Sous-actes : liste lensemble des variantes de lacte et leurs performatifs. Conditions : donne les conditions de r ealisation de lacte, cest-` a-dire ses conditions pr eparatoires et essentielles. Elles portent g en eralement sur les intentions et les croyances de l emetteur et sur les comp etences des deux interlocuteurs. Succ` es : d ecrit les cons equences normales du succ` es de lacte et le message qui r ealise cette condition. Satisfaction : liste les post-conditions de satisfaction associ ees ` a la satisfaction de lacte, ainsi que le message signalant la validit e de cette condition. Echecs : donne les conditions d echecs normales, cest-` a-dire enti` erement pr evisibles si lune des conditions de r ealisation de lacte nest pas satisfaite. Ces echecs, signal es par des messages particuliers, entra nent g en eralement des cons equences sur les croyances de l emetteur et dune mani` ere g en erale sur son etat. Cependant, il nest pas fait mention des comportements de demande dexplications qui sont souvent associ es aux causes d echecs.
333
Les conditions et les cons equences de ces actes sont sp eci ees ` a laide de pr edicats et de cognitons de base. En voici la liste: Cognitons croire(A,P) : lagent A croit lexpression P. Les croyances sont suppos ees etre r evisables. croire(A,P) signie en position pr edicative que lagent A croit P, et en position daction que lagent A remet en cause ses croyances de mani` ere a croire d ` esormais que P est vrai, quelle que soit la valeur de sa croyance ant erieure sur P. but(A,P) : lagent A a le but que la condition P soit vraie. intention(A,P) : lagent A a lintention de faire laction P. engager(A,B,P) : lagent A est engag e aupr` es de B pour faire P.
comp etent(A,P) : signie que lagent A est comp etent pour faire laction P. croire(A,comp etent(B,P)) pr ecise que lagent A croit que lagent B est comp etent pour faire P. Pr edicats calculer(E) : repr esente laction de calculer une expression E. Par exemple, calculer(2x+3 avec x=5) correspond ` a laction de calculer lexpression 2x+3 dans laquelle la valeur x vaut 5, calculer({x|descendants(LouisXIV,x)}) d ecrit laction de calculer tous les descendants de Louis XIV. percevoir(A,E) : indique si lagent A per coit lobjet ou la situation E. exec(P) : indique si laction P est ex ecut ee ou non. vouloirFaire(A,P) : signie que lagent A voudra bien faire P dans le futur. Ce cogniton est equivalent ` a finalt(intention(A,P)), en utilisant lop erateur finalt pr esent e` a la section 5.8, dans le cadre de la th eorie des intentions de Cohen et Levesque. Les exercitifs Les exercitifs comprennent essentiellement deux actes de langage principaux: les d el egations (demandes daction et demandes de r esolution) et les demandes dabonnement. Ces deux actes de langage sont initiateurs de conversation. La d el egation La conversation associ ee ` a lacte de d el egation est certainement, avec la question, le type de conversation le plus utilis e dans les syst` emes multi-agents. Un mod` ele en termes de r eseau de Petri a dailleurs d ej` a et e pr esent e pr ec edemment (g. 6.4). Une demande daction ou de r esolution dun probl` eme est envoy ee ` a un agent qui indique sil sengage ou non ` a la r ealisation de cette t ache. Sil sengage, alors
334
a) soit il retourne ensuite une notication de n daction ou le r esultat sil sagit dune r esolution de probl` emes, b) soit il indique quil lui a et e impossible daccomplir son engagement, malgr e sa promesse. On notera dans le diagramme Bric correspondant (g. 6.5) que les conditions dinitiation de lacte ne sont pas trait ees dans ce diagramme, car elles appartiennent au syst` eme de d ecision et dallocation de t ache de lagent A qui choisit lagent auquel il d esire demander ce service. De m eme, les echecs et les satisfactions produisent des modications de l etat mental dun agent non d ecrites dans ce diagramme. Labonnement Labonnement, ou plus exactement la demande dabonnement, est une forme de conversation tr` es importante et malheureusement peu etudi ee dans les travaux sur les syst` emes multi-agents. Le principe en est simple: un agent A d esire etre pr evenu lorsquun ev enement se passe ou obtenir toutes les informations quun agent B pourrait acqu erir sur un sujet particulier. Par exemple, le travail dexploration, de surveillance ou denqu ete ` a plusieurs est fond e sur ce type de protocole dans lequel des agents ont pour mission de r ef erer de toutes les informations concernant tel type dinformations. Labonnement peut etre cyclique, A demande ` a B de faire un rapport syst ematiquement ` a intervalles r eguliers, ou sur ev enement, d` es que quelque chose de nouveau est apparu. La gure 6.6 montre un mod` ele de conversation de demande dabonnement sur ev enement. On peut constater que ce type de conversation produit des echanges r eguliers, jusqu` a ce que: a) soit linitiateur de la conversation (lagent A) emette une n dabonnement, b) soit le destinataire (lagent B) consid` ere quil ne peut plus faire son travail et arr ete ses emissions.
Les interrogatifs Les interrogatifs servent ` a poser des questions dont les r eponses ne doivent pas donner mati` ere ` a lex ecution dun calcul complexe. Les questions peuvent porter aussi bien sur le monde, en demandant ` a quoi croit un agent, ou sur l etat mental du destinataire: quels sont ses buts, ses engagements, ses accointances, etc. La gure 6.7 montre un mod` ele dacte de langage interrogatif. Poser une question est relativement simple puisquil nexiste pas dengagement possible du destinataire: si A questionne B, soit B conna t la r eponse, veut bien la donner et la donne, soit il ne sait pas ou refuse de r epondre. Les assertifs Les assertifs servent ` a donner des renseignements sur le monde et donc ` a d ecrire des objets ou des situations. On peut consid erer deux niveaux dassertifs. Ceux qui sont envoy es ` a la demande dune information, et qui sont donc soumis ` a la logique dautres
335
Demander : acte de langage principal consistant ` a demander ` a un autre agent deectuer une t ache: accomplir une action ou r esoudre un probl` eme Format : A: B << Demander(P) avec P une t ache Sous-actes : DemanderFaire(P) avec P une action DemanderR esoudre(P) avec P un probl` eme Conditions : but(A,C) croire(A,exec(P) C) croire(A,comp etent(B,P)) croire(A,vouloirFaire(A,P)) [croire(A, comp etent(A,P)) vouloirFaire(A,P)] croire(A,finalt(C)) Succ` es : B: A << AccepterFaire(P) engager(B, A, P) Satisfaction : B: A << NotificationFinAction(P) croire(A, C) si P est une action B: A << R esultat(P,R) croire(A,R) si P est un probl` eme Echecs : B: A << RefuserFaire(P) croire(A,comp etent(B,P) vouloirFaire(B,P)) A << EchecFaire(P) demander explications
Figure 6.5: Mod` ele conversationnel de d el egation dune t ache ` a un autre agent
336
Abonner : Acte de langage principal consistant ` a demander ` a un autre agent quil le pr evienne selon lune des modalit es suivantes: ` a intervalles r eguliers, lorsquun ev enement intervient ou lorsque le destinataire poss` ede de nouvelles informations dun certain type. Format : A: B << Abonner(P,R) avec P une condition et R une expression Conditions : but(A,croire(B,P) croire(A,R)) croire(A,finalt(croire(B,P))) croire(A,croire(B,P) vouloirFaire(B,B: A << Aviser(R))) Succ` es : B: A << AccepterAbonner(P,R) engager(B,A,croire(B,P) vouloirFaire(B: A << Aviser(R))) Satisfaction : B: A << Aviser(R) croire(A, R) B: A << RefuserAbonner(P,R) croire(A,vouloirFaire(B,croire(B,P) vouloirFaire(B: A << Aviser(R)) Echecs : B: A << RefuserAbonner(P,R) croire(A,vouloirFaire(B,croire(B,P) vouloirFaire(B << A, Aviser(R))
Figure 6.6: Mod` ele conversationnel dun abonnement. La r esiliation de labonnement nest pas indiqu e.
337
actes de langage, et ceux qui cherchent ` a faire partager une croyance ` a un autre agent. Dans le premier cas, le succ` es et la satisfaction sont li es: il sut de r epondre a la requ ` ete pour que lacte soit r eussi, cest le cas par exemple du performatif R epondre qui est envoy e` a la suite dune demande dinformation. Dans le second, en revanche, lacte se d ecompose en une phase de transmission de linformation (ce qui constitue le succ` es) et une phase dacceptation de linformation (la satisfaction), qui prouve que cette information est compatible avec les croyances du destinataire. Par exemple, un avertissement (exemple: il y a un virus qui se prom` ene) conduit a ` donner une information sans que cela d ecoule dun acte initiateur ant erieur. Ce type de conversation, dont le performatif Affirmer est caract eristique (g. 6.8), suit un protocole assez simple: A informe B, lequel accepte (Acquiescer) ou exprime son d esaccord (RefusCroire). Dans une forme plus complexe, B pourrait m eme r efuter ce que lui dit A et il peut sensuivre un dialogue de type argumentation o` u les deux agents cherchent mutuellement ` a se convaincre de la v eracit e (ou de la fausset e) dun enonc e. On trouvera dans les travaux de J. Quinqueton, P. Reitz et J. Sallentin des d enitions dagents rationnels engag es dans des conversations complexes portant en particulier sur largumentation (suite darmation, dacceptation et de r efutations, voire de silence) comme forme sup erieure darmation (Quinqueton et al. 1991). Outre le performatif Affirmer, les assertifs comprennent le performatif Informer qui est plus faible que le pr ec edent, puisquil ne suppose pas quun agent A qui informe un agent B d esire que B croie eectivement linformation quil lui envoie. Quelques autres performatifs A c ot e des performatifs principaux que nous venons de voir, il est possible de d enir dautres performatifs. En voici quelques uns que nous ne ferons que lister sans en donner les sp ecications d etaill ees: Les promissifs OrirService : un agent A propose ses services (exemple: r ealiser une t ache) a ` un agent B qui peut refuser ou non. Cette proposition engage A aupr` es de B, qui normalement doit ex ecuter les demandes de B correspondant ` a ses comp etences. Proposer/Conrmer/R efuter Hypoth` ese : cet ensemble de performatifs peuvent etre utilis es lors dune r esolution distribu ee de probl` emes. Les expressifs SaitFaire : un agent A indique ` a un autre agent B ses comp etences. Il existe aussi le performatif inverse, dans lequel un agent pr ecise quil ne sait pas faire quelque chose. Croire : un agent A indique ` a un autre agent B quil pense quune expression est vraie. Cette liste ne se veut ni d enitive, ni exhaustive. Nous verrons tout un ensemble dautres performatifs aux chapitres suivants.
338
6.4
KQML
Aux Etats-Unis, un projet de recherche fond e par la Darpa a pour but de d evelopper un standard de communication de haut niveau fond e sur les actes de langage pour permettre ` a des agents cognitifs de coop erer. Le tableau 6.3 donne la liste des performatifs propos es pour ce langage qui sappelle KQML pour Knowledge Query and Manipulation Language. Il sagit dun projet qui nest pas achev e et les descriptions qui sont donn ees ici pourront changer avec le temps. Malgr e lint er et certain dun tel travail, le projet KQML pr esente de nombreuses lacunes. Ainsi, pour Cohen et Levesque, il pr esente les d efauts suivants (Cohen et Levesque 1995): Ambigu t e et impr ecision. La signication des performatifs est donn ee sous la forme de simples descriptions en langage naturel, ce qui les rend souvent vagues et confus. Performatifs inutiles et incoh erents. Certains performatifs ne sont en fait pas des actes de langage, car ils nont pas le pouvoir de satisfaire les buts de lagent emetteur. Cest particuli` erement vrai des performatifs achieve, broker et stream-all, qui ne peuvent etre compris comme des actes de langage indirects puisquils satisfont en fait des buts appartenant ` a dautres agents. N eanmoins, il est clair que tout syst` eme de communication doit pouvoir faire intervenir des m ediateurs et il est donc indispensable de prendre en compte de tels actes. Performatifs manquants. Malgr e le nombre imposant de performatifs, toute une cat egorie de performatifs manque: les promissifs . Par exemple, il nest pas possible en KQML de dire que lon sengage, aupr` es dun tiers, ` a accomplir une action. Toutes ces raisons montrent que KQML manque cruellement de sp ecications et de formalisation. De ce fait, nimporte qui peut pr etendre quil emploie KQML simplement parce que ses agents sont capables de senvoyer des requ etes et des informations. A partir de ces critiques, Cohen et Levesque proposent de d enir un ensemble minimum de performatifs en leur donnant des propri et es de compositionnalit e, an quil soit possible de d enir de nouveaux performatifs comme combinaison dactes de langage plus primitifs. Pour cela, et ` a partir de leur th eorie de laction rationnelle etudi ee au chapitre 5, ils ont d evelopp e une s emantique pour quelques-uns des performatifs les plus fondamentaux de KQML. Malgr e lint er et de ce travail, je pense que les sp ecications en termes d etats mentaux posent un probl` eme majeur: si lon suppose que des standards de communication comme KQML ont par essence le projet de faire communiquer entre eux des agents de natures diverses, alors toute th eorie reposant sur des etats mentaux imposent aux agents de se conformer ` a une architecture sp ecique qui impl emente pr ecis ement cette th eorie. Par exemple, la th eorie des cognitons que nous avons d evelopp ee au chapitre 5 ne saccorde pas n ecessairement ` a celle de Cohen et Levesque, laquelle ne reprend pas les m emes primitives que celle de Y. Shoham. De ce fait, tout standard de communication, qui repose sur la mani` ere dont un agent se comporte, limite les possibilit es dint egration
6.4. KQML
339
Nom achieve advertise ask-about ask-all ask-one break broadcast broker-all broker-one deny delete delete-all delete-one discard eos error evaluate forward generator insert monitor next pipe ready recommend-all recommend-one recruit-all recruit-one register reply rest sorry standby stream-about stream-all subscribe tell transport-address unregister untell
Description A veut que Y accomplisse une action A indique quil peut faire P A veut toutes les expressions sur P de la BC de B A veut toutes les r eponses de B ` a une question A veut une r eponse de B ` a une question A veut supprimer une communication A veut que B envoie un performatif ` a toutes ses accointances A veut que B r ecup` ere toutes les r eponses ` a un performatif A veut de laide pour r ecup erer la r eponse ` a un performatif A indique ` a B que le performatif ne sapplique plus ` aB A veut que B supprime une expression de sa BC A veut que B supprime toutes les P correspondantes de sa BC A veut que B supprime une expression P de sa BC A ne veut pas les r eponses suivantes de B Fin dune suite de r eponse ` a une requ ete pr ealable A consid` ere que le message de B est mal form e A veut que B simplie lexpression associ ee A veut que B d el` egue un performatif Identique ` a standby pour un stream-all A veut que R ins` ere une expression dans sa BC A veut que R mette ` a jour ses r eponses ` a un stream-all A veut la r eponse suivante ` a une requ ete pr ealable A veut que R redirige tous les performatifs suivants ` a un agent A est pr et ` a r epondre ` a un performatif pr ealable de B A veut tous les agents qui r epondent ` a un performatif donn e A veut un agent qui r eponde ` a un performatif donn e A veut que tous les agents capables r epondent ` a un performatif A veut quun agent capable r eponde ` a un performatif A indique ` a B quil peut accomplir une action A r epond ` a une demande attendue A veut toutes les r eponses suivantes A ne peut fournir une r eponse plus informative A veut que B soit pr et ` a r epondre ` a un performatif Version ` a r eponses multiples de ask-about Version ` a r eponses multiples de ask-all A veut que B mette ` a jour ses r eponses ` a un performatif Indique quune expression fait partie de la BC de A A associe un nom symbolique ` a une adresse de transport Un deny de register indique quune expression ne fait pas partie de la BC de A
Table 6.3: liste des performatifs d enis dans KQML
340
dagents v eritablement h et erog` enes. Il appara t donc quune sp ecication des communications, non plus en termes d etats mentaux, mais en termes de protocoles, pr esente lavantage de pouvoir faire abstraction de la nature propre des agents en se focalisant sur les relations qui existent entre les communications. Cest dailleurs cette approche qui a et e pr esent ee dans ce chapitre et qui sera d evelopp ee dans les chapitres suivants.
6.4. KQML
341
Questionner : acte de langage principal consistant ` a demander un renseignement ` a un autre agent. Format : A: B << Questionner(f,P) o` u P est une donn ee et f une fonction Sous-actes : QuestionnerBool(P) avec P une expression propositionnelle QuestionnerRaisons(E) avec E une expression sans variables Conditions : but(A,croire(A,R)) avec: R = f(P) croire(A,comp etent(B,f)) croire(A,comp etent(A,f)) croire(A,croire(A,R)) croire(A,vouloirR epondre(B,f)) Satisfaction : B: A << R epondre(R) croire(A,R) Echecs : B: A << RefuserR epondre(R) croire(A, vouloirR epondre(f) comp etent(B,f)
Figure 6.7: Mod` ele conversationnel dune question
342
Armer : acte de langage principal consistant ` a faire partager une croyance a un autre agent, cest-` ` a-dire ` a convaincre un tiers de la v eracit e dun fait. Format : A: B << Affirmer(R) Conditions : But(A,croire(B,R)) croire(A,croire(B,R)) Satisfaction : B: A, Acquiescer(R) croire(A,croire(B,R)) Echecs : B: A, RefuserCroire(R) croire(A,croire(B,R))
Figure 6.8: Mod` ele conversationnel dune armation
Chapter 7 Collaboration et r epartition des t aches

Si la coop eration permet de procurer des avantages en termes decacit e quantitative et d emergence qualitative, comme nous lavons vu au chapitre 2, elle pose aussi des probl` emes de r epartition du travail entre les agents. Ces probl` emes sont diciles, car ils font intervenir de nombreux param` etres: capacit es cognitives et dengagement des agents, comp etences des individus concern es, nature des t aches, ecacit e, co uts de transmission, structures sociales dans lesquelles evoluent les agents, etc. De ce fait, la r epartition des t aches et des ressources constitue ` a la fois lun des domaines majeurs des syst` emes multi-agents et lune de leurs principales contributions ` a linformatique en g en eral. En mettant laccent sur lallocation distribu ee du travail, sur la notion de contrat et dengagement, les syst` emes multiagents posent le probl` eme de lactivit e dans des termes ` a la fois sociaux et calculatoires, ce qui les distingue des formes plus classiques utilis ees auparavant, quil sagisse de probl` eme daectation de machines ou de r epartition des processus sur des processeurs. N eanmoins, comme nous le verrons, les techniques dallocation de t aches reprennent certains des r esultats obtenus dans le domaine de la recherche op erationnelle et des syst` emes distribu es, en les adaptant ` a leurs besoins. R epartir des t aches, des informations et des ressources revient ` a r epondre ` a la question: qui doit faire quoi et avec quels moyens, en fonction des buts et des comp etences des agents et des contraintes contextuelles (types et quantit es de ressources, nature de lenvironnement, etc.). Il sagit l` a dun des points essentiels de la fonction organisationnelle dune soci et e dagents (cf. chap. 3) avec la coordination dactions que nous examinerons au chapitre 8.
7.1
Modes dallocation des t aches
Lallocation (ou r epartition) des t aches passe par la d enition des m ecanismes organisationnels par lesquels des agents peuvent mettre leurs comp etences en commun an de r ealiser un travail collectif. Il sagit donc de d ecrire la mani` ere dallouer les t aches, en sachant que les capacit es dun agent d ependent ` a fois de ses aptitudes
344
CHAPTER 7. COLLABORATION ET REPARTITION DES TACHES
intrins` eques (architectures dont ils disposent, capacit es cognitives, types de communications envisag ees), des moyens energ etiques dont il dispose (temps de calcul et autonomie energ etique), que des ressources externes (outils, sources d energies) et des contraintes environnementales. Les t aches qui r eclament plus de moyens, de travail ou de savoir-faire quun seul agent nest capable de fournir, doivent etre d ecompos ees dabord en plusieurs sous-t aches puis etre r eparties(ou allou ees) parmi les di erents agents. Ces deux op erations sont evidemment li ees car la d ecomposition des t aches doit souvent prendre en compte les comp etences des agents pr esents et faciliter ainsi la r epartition qui sensuit.
7.1.1
Crit` eres de d ecomposition des t aches
Bond, Gasser et Hill (Bond & Gasser 1988) (Gasser & Hill 1990) ont pr esent e quelques crit` eres de d ecomposition des probl` emes. Ils indiquent notamment que si les probl` emes peuvent etre naturellement analys es par niveau dabstraction (en travaillant du plus g en eral au plus d etaill e), il est aussi n ecessaire de prendre en compte dautres contraintes telles que le contr ole, les donn ees ou les ressources. Il est en eet n ecessaire de rendre les t aches aussi ind ependantes que possibles les unes des autres de mani` ere ` a diminuer la coordination. En particulier, on cherchera a minimiser la quantit ` e dinformations que les t aches doivent se transmettre et ` a faire en sorte que les t aches puissent utiliser les ressources locales an de diminuer les conits li es aux ressources. Mais, bien que les activit es de d ecomposition soient aussi importantes que celles de r epartition, elles sont g en eralement eectu ees par des etres humains et il nexiste pas ` a notre connaissance de syst` eme informatique de d ecomposition de t aches. De ce fait, lessentiel de la recherche sest port e sur la r epartition automatique des t aches, laissant un peu de c ot e le probl` eme de leurs d ecomposition en sous-t aches. Nous avons cependant parl e des di erentes mani` eres daborder la d ecomposition des t aches (` a laide dune perspective objet ou fonctionnelle) au chapitre 3.
7.1.2
R oles
Un syst` eme dallocation automatique des t aches doit etre capable de mettre en rapport des agents qui ont besoin dune information ou d esirent que lon r ealise une t ache, les clients ou demandeurs, et des agents capables de fournir un service, les fournisseurs ou serveurs. Souvent les m emes agents peuvent etre ` a la fois clients et serveurs, la qualit e de client ou de fournisseur etant d etermin ee g en eralement de mani` ere dynamique lors du fonctionnement dun syst` eme multi-agents. On dit alors que les agents prennent le r ole de client ou le r ole de fournisseur, sans quil sagisse dune de leurs caract eristiques intrins` eques. Dautres r oles peuvent etre d enis, tels que celui de m ediateur (trader), qui soccupe de la mise en contact des serveurs et des clients.
7.1. MODES DALLOCATION DES TACHES
345
7.1.3
Formes dallocation
La gestion de la r epartition des t aches peut seectuer soit en centralisant le processus dallocation soit en le distribuant ` a lensemble des agents concern es. Dans un mode dallocation centralis e, deux cas se pr esentent: 1. Si la structure de subordination est hi erarchique, cest le sup erieur qui demande pr ecis ement ` a un subordonn e daccomplir sa t ache. On parlera alors dallocation rigide ou d enie. Ce mode dallocation, caract eristique dun appel de proc edure en programmation classique, ne sera pas etudi e ici. On ne rencontre ce type de r epartition que dans les organisations xes (cf. chap. 3). 2. Au contraire, si la structure est egalitaire, la r epartition passe alors par la d enition dagents sp eciaux, les m ediateurs, qui g` erent lensemble du processus dallocation en centralisant les demandes des clients et les ores de services des serveurs, an de mettre en correspondance ces deux cat egories dagents, ce qui permet dappliquer des modes centralis es ` a des organisations variables. Dans un mode dallocation distribu e, chaque agent soccupe individuellement dobtenir les services des fournisseurs qui peuvent lui etre utiles pour la r ealisation de ses projets. Ces modes ne sappliquent quaux organisations variables, cest-` a-dire qui supposent que les liens entre les clients et les fournisseurs peuvent evoluer dans le temps, sans remettre en cause la structure g en erale de lorganisation. On distingue deux m ecanismes dallocation distribu ee dans les organisations pr ed enies : 1. Le mode dallocation par r eseau daccointances suppose que les clients poss` edent une repr esentation des autres agents et des capacit es dont ils disposent. Nous verrons quil nest pas n ecessaire que les agents connaissent les capacit es de tous les autres agents pour pouvoir r esoudre leur probl` eme, mais seulement que le r eseau form e par lensemble des accointances soit fortement connexe (cesta-dire quil existe un chemin allant de nimporte quel agent vers nimporte ` quel agent) et evidemment coh erent (cest-` a-dire que les repr esentations sur les comp etences des accointances dun agent correspondent bien aux comp etences eectives des agents). 2. Le mode dallocation par appel dore est plus connu en intelligence articielle distribu ee sous le nom de r eseau contractuel. Il pr esente lavantage dune tr` es grande dynamicit e et sav` ere particuli` erement facile ` a mettre en uvre. Nous verrons cependant quil faut faire attention lors de sa mise en uvre ` a un certain nombre de probl` emes inh erents ` a la nature particuli` erement dynamique de ce mode. A ces modes sappliquant ` a des organisations pr ed enies, il faut ajouter le mode dallocation emergente, moins connu g en eralement et plus caract eristique des syst` emes r eactifs dans lesquels les communications seectuent de mani` ere incidente (cf. chap. 6) par propagation de stimuli. La gure 7.1 r esume les principaux modes dallocation de t aches. Il peut exister evidemment un certain nombre de variantes de ces approches et, en particulier, des approches hybrides qui tentent de synth etiser les avantages de ces di erentes approches.
346

Allocation impose Allocation centralise Allocation par mdiateur Prdfinie Allocation de tches Allocation distribue Allocation par rseau
Allocation par appel d'offre
Emergente
Figure 7.1: Les principaux modes de r epartition des t aches
7.2
Allocation centralis ee des t aches par m ediateur
Le cas le plus simple est celui o` u il nexiste quun seul m ediateur qui dispose dune table daccointance lui indiquant lensemble des agents capables daccomplir une t ache particuli` ere T. Cette table peut etre mise ` a jour directement par les fournisseurs qui entrent dans le syst` eme et qui indiquent ainsi quelles sont leurs comp etences. La gure 7.2 illustre le d eroulement du processus. Lorsque lagent A a besoin deectuer une t ache T quil ne peut (ou ne veut pas) faire lui-m eme, il demande au m ediateur de trouver quelquun pour r ealiser T. Le m ediateur sadresse alors aux agents dont il sait quils poss` edent la capacit e de faire T. Si lun deux accepte, le m ediateur envoie laccus e dacceptation au client, sinon il linforme quil na trouv e personne pour accomplir la t ache.
Mdiateur Demander(T,A) A AccepterC(T,E) AccepterF(T,E) E DemanderF(T,A) B C Fournisseurs Clients D RefuserF(T,D) DemanderF(T,A)
Figure 7.2: Allocation centralis ee de t aches
DES TACHES 7.2. ALLOCATION CENTRALISEE PAR MEDIATEUR
347
On suppose dans ce traitement quun fournisseur, qui accepte daccomplir une t ache, sengage eectivement ` a la faire et ne se d ediera pas lors de la passation de contrat avec un client ou au cours de la r ealisation de la t ache. On fera aussi lhypoth` ese que le m ediateur poss` ede une table des comp etences des agents qui soit a la fois compl` ` ete et coh erente, tous les agents A qui poss` edent une comp etence etant bien r ef erenc es dans cette table, et que toute r ef erence dans cette table existe bien, cest-` a-dire que pour tout couple <A, C> de la table, lagent A poss` ede bien la comp etence C. Avec ces el ements, le protocole dallocation peut etre d eni sous la forme dun composant Bric. On ne mod elisera que le m ediateur, puisque le comportement des clients et des fournisseurs reprend les structures de requ etes (DemanderFaire) et de r eponses d ecrites au chapitre 6 sur les actes de langages. Ce module, qui d enit enti` erement le comportement du m ediateur, prend en entr ee les requ etes du client et les r eponses du fournisseur et produit en sortie les demandes vers les fournisseurs susceptibles de supporter cette requ ete ainsi que les r eponses vers les clients. Les communications entre le m ediateur, les clients et les fournisseurs utilisent un ensemble de messages correspondant aux actes de langages suivants: Demander(T,X) est une demande du client X au m ediateur pour que la t ache T soit r ealis ee. Accepter(T,Y) est la r eponse du m ediateur au client pour lui indiquer que lagent Y sengage ` a accomplir la t ache T. Impossible(T) est une r eponse du m ediateur au client pour lui indiquer quil nexiste aucun agent qui accepte de faire la t ache T. DemanderF(T,X) est une demande du m ediateur an quun fournisseur accomplisse la t ache P pour le client X. AccepterF(T,Y,X) est la r eponse positive du fournisseur Y ` a la demande du m ediateur. Le fournisseur indique au client quil accepte daccomplir la t ache T pour le client X. RefuserF(T,Y,X) est la r eponse n egative du fournisseur Y ` a la demande dallocation de la t ache T pour le client X. La gure 7.3 montre la repr esentation du m ediateur centralis e en Bric. Lorsque le m ediateur re coit de la part dun client X une demande pour faire T, il cherche dans sa table des comp etences une liste dagents ( eventuellement tri ee par ordre de pr ef erence) capables deectuer cette t ache. Si cet ensemble E est vide, alors le m ediateur r epond par le message ImpossibleFaire. Sinon, il demande it erativement ` a tous les el ements de E sil leur est possible de faire T, en utilisant la place P1 comme m emoire de tous les fournisseurs encore ` a examiner. Si lun dentre eux accepte, la place P1 est vid ee de cette demande de t ache et le m ediateur r epond au client X que le fournisseur Y accepte daccomplir T. Ce module utilise les trois structures de donn ees suivantes:
348

Allocateur centralis Y << DemanderF(T,X) E d(T,X,Y) avec Y = 1er.E d(T,X,Y) avec Y = 1er.E c(T,X,E) c(T,X,rest.E) Table des comptences E= c(T,X,E) t(T,X) P1 E c(T,X,rest.E) E= t(T,X) X << Impossible(T) X << Accepter(T,Y) d(T,X,Y) Demander(T,X) AccepterF(T,Y,X) RefuserF(T,Y,X)
Figure 7.3: La description du m ediateur centralis e en Bric c(T,X,E) donne la liste des agents E ayant la comp etence pour eectuer la t ache T pour le client X. 1er.E retourne le premier el ement de la liste (identique a car en Lisp, et rest.E retourne la liste E priv ` ee de son premier el ement, identique ` a cdr en Lisp). d(T,X,Y) demande du m ediateur aupr` es du fournisseur Y pour quil eectue la t ache T pour X. t(T,X) t ache T demand ee par X. Il est possible dam eliorer ce m ecanisme de plusieurs mani` eres. La premi` ere consiste a optimiser lallocation en s ` electionnant en priorit e les agents les plus comp etents ou ceux qui minimisent une fonction de co ut. Par exemple, dans le cas des robots r ecup erateurs de minerai comprenant ` a la fois des robots foreurs et des transporteurs, il est pr ef erable de r epartir les t aches de transports en fonction de la distance qui s epare les transporteurs des foreurs, de mani` ere ` a minimiser les d eplacements ` a eectuer. On peut envisager deux cas: 1. Si le m ediateur conna t les fonctions d evaluation utilis ees par les fournisseurs, il peut trier les agents comp etents en fonction des r esultats de l evaluation et eectuer ses demandes dans cet ordre. Le protocole nest pas modi e: il sut simplement de supposer que le gestionnaire daccointances du m ediateur retourne lensemble des fournisseurs tri es par ordre de pr ef erence. 2. Si le m ediateur ne conna t pas les fonctions d evaluation, il doit dabord demander ` a chaque agent de formuler sa proposition avant de choisir eectivement celui qui sera consid er e comme le meilleur. Cette technique sapparente alors a un m ` ecanisme dappel dore (cf. section 7.3.2).
DES TACHES 7.2. ALLOCATION CENTRALISEE PAR MEDIATEUR
349
Dans notre algorithme, le m ediateur parcourt lensemble des agents de mani` ere s equentielle, nenvoyant une requ ete ` a lagent suivant que si le pr ec edent a r epondu quil refusait daccomplir la t ache. Il est aussi possible de d enir des algorithmes parall` eles. Dans ce cas, d` es quun fournisseur indique quil est daccord pour accomplir la t ache, on avertit les autres fournisseurs an quils sachent quil nest plus n ecessaire de r epondre. Ce type de gestion est plus n, car il faut tenir compte du fait que des agents peuvent envoyer leurs acceptations entre-temps et quils doivent donc etre capable de mettre ` a jour leurs engagements. Lint er et de lallocation centralis ee est de pouvoir tenir ` a jour lensemble des agents et leurs comp etences respectives et donc de favoriser la coh erence du syst` eme. De plus, les besoins en optimisation sont plus facilement satisfaits, le m ediateur connaissant lensemble des agents disponibles, et il lui est plus facile de choisir le meilleur des agents par rapport ` a une demande de t ache donn ee. Mais linconv enient majeur de ce type de syst` eme est de constituer un goulet d etranglement et donc de diminuer consid erablement les performances du syst` eme d` es que le nombre des agents et des demandes augmente. En eet, le nombre de messages que le m ediateur doit g erer cro t comme le carr e de N , o` u N est le nombre dagents. Si lon consid` ere quil existe un taux de clients potentiels ( est le rapport nombre de clients/N ) qui font k demandes par unit e de temps et si lon appelle le taux des fournisseurs potentiels (cest-` a-dire le rapport nombre de fournisseurs/N ) pour chaque demande, alors le nombre M de messages est egal ` a: M = kN (2 + 2N ) cest-` a-dire au produit du nombre de demandes par la somme des messages qui existent, dune part, entre les clients et le m ediateur et, dautre part, entre le m ediateur et les fournisseurs. Par exemple, si vaut 0,5 (la moiti e des agents sont demandeurs), vaut 0,2 (20% des agents sont des fournisseurs potentiels pour chaque demande, ce qui signie que le syst` eme est relativement redondant) et k vaut 1 (on a une demande par unit e de temps, on obtient la courbe de la gure 7.4).
Messages messages 2000. 1500. 1000. 500. 25. 50. 75. Agents agents 100.
Figure 7.4: Nombre de messages trait es par le m ediateur en fonction du nombre dagents du syst` eme On peut constater que si pour 50 agents, le nombre de messages ` a traiter par le m ediateur est de lordre de 500, il passe ` a 2 000 pour 100 agents, ce qui indique que
350
cette m ethode nest pas ` a conseill ee pour un grand nombre dagents. De plus, si le syst` eme est distribu e, tous les messages doivent passer par le m ediateur sans tenir compte de la topologie du r eseau. Enn, un syst` eme centralis e est tr` es sensible aux d efaillances. En eet, si le m ediateur tombe en panne, tout le syst` eme s ecroule. Il faut alors pr evoir des m ecanismes de secours complexes pour essayer de pallier ces probl` emes, mais ceci est hors de notre propos. Il est possible dam eliorer cette situation en utilisant plusieurs m ediateurs. Mais cela pose dautres probl` emes, car il faut pouvoir g erer la coh erence entre les di erents m ediateurs, ce qui devient alors tr` es compliqu e. Lorsquon souhaite que le syst` eme puisse r epartir ses m ecanismes dallocation, il est pr ef erable de passer ` a un mode dallocation v eritablement distribu e des t aches.
7.3
7.3.1
Allocation distribu ee des t aches

Allocation par r eseau daccointances
Dans les syst` emes dallocation par r eseau daccointances, on suppose que chaque agent dispose dune table de comp etences des agents quil conna t, sous la forme dun dictionnaire de la forme {C1 : [A11 , .., A1k ], .., Cn : [An1 , .., Anl ]} o` u les Ci sont les comp etences requises pour r ealiser une t ache Ti et les Aij sont les agents qui savent eectuer ce type de t aches. Il est possible de repr esenter cette table sous la forme dun tableau local ` a chaque agent comportant en ligne les comp etences et en colonne ses accointances, cest-` a-dire les agents quil conna t. Chaque case du tableau comporte alors 1 ou 0 selon que lagent de la colonne poss` ede ou non la comp etence de la ligne correspondante. Par exemple, un agent A, qui sait quil poss` ede la comp etence C3 , que la comp etence C1 est disponible chez B et C et que D sait faire C3 , poss` ede la table de comp etence suivante:
C1 C2 C3 A B C D 0 1 1 0 0 0 1 0 1 0 0 1
On ne suppose pas que chaque agent connaisse lensemble des comp etences des autres agents, car cela violerait lhypoth` ese de repr esentation partielle des syst` emes multi-agents et poserait une beaucoup trop grande contrainte sur la r ealisation et la mise ` a jour de tels syst` emes. On suppose simplement que les tables daccointances sont correctes, cest-` a-dire que leurs indications correspondent bien aux r eelles comp etences des agents. Dautre part nous ferons lhypoth` ese que les tables daccointances de chacun des agents sont donn ees une fois pour toutes et ne sont pas remises ` a jour. Nous verrons section 7.3.1 comment traiter le probl` eme des remises ` a jour dans des r eseaux daccointances. Un r eseau daccointances peut etre repr esent e sous la forme dun graphe. Les agents sont les sommets du nud et les arcs repr esentent les comp etences que
DES TACHES 7.3. ALLOCATION DISTRIBUEE
351
les agents connaissent des autres agents. Ce graphe superpose ainsi de mani` ere graphique les di erentes tables daccointances locales aux agents. Par exemple, la gure 7.5 repr esente la superposition des tables suivantes:
C1 C2 C3 A 0 0 1 B 1 0 0 A C 1 1 0 D 0 0 1 C1 C2 C3 A 0 0 1 B C D 1 0 0 0 0 1 0 0 0 B C1 C2 C3 A 0 0 0 B 1 0 0 C C 1 1 0 D 0 0 0 C1 C2 C3 A 0 0 0 B 0 0 0 D C 0 1 0 D 0 1 1
Il existe essentiellement deux modes dallocation par r eseau daccointances selon que lon autorise les agents ` a d el eguer leurs demandes ` a dautres agents ou non. On parlera alors dallocation par d el egation ou dallocation directe. Allocation directe
C1
Agent B Agent A C3 C1 C3 C1,C2 C1 Agent C
C2
C3
C2
C2, C1
Agent D C2,C3
Figure 7.5: Un r eseau daccointances superpose lensemble des tables daccointances locales en un graphe unique, qui repr esente ce que chaque agent conna t des comp etences des autres agents. Dans le mode direct, un agent ne peut faire ex ecuter une t ache qu` a un agent quil conna t directement. Le m ecanisme de r epartition est tr` es simple et reprend le comportement du m ediateur unique dans le cas des r epartitions centralis ees. Lagent qui veut faire accomplir une t ache essaye ` a tour de r ole chacun des agents quil conna t et qui dispose de la comp etence d esir ee jusqu` a ce que lun deux accepte. Si aucun naccepte, on atteint un etat sp ecial quil faut traiter. Soit on consid` ere quil sagit dun d efaut du syst` eme, mais il faut alors sassurer que dans tous les cas il y aura au moins un agent qui acceptera deectuer la t ache, soit on prend des mesures tendant ` a passer outre, en aectant autoritairement une t ache ` a un agent ou en relan cant les op erations par un m ecanisme dappel dore permettant de choisir lagent qui a le moins de raisons de refuser cette t ache. Si cela echoue, on peut aussi faire appel ` a un syst` eme centralis e pour allouer la t ache. Les r eserves associ ees
352
aux syst` emes centralis es ne sont plus de mises dans ce cas, puisque seul un petit nombre de demandes seront envoy ees au syst` eme centralis e, les demandes banales empruntant la voie du r eseau daccointances. Dans ce cas, le syst` eme centralis e, qui joue plus le r ole dun agent de maintenance et de r eparation que celui dun v eritable m ediateur, sav` ere tr` es utile car il peut aussi servir ` a mettre a ` jour les tables daccointances des agents et r eorganiser ainsi le r eseau daccointances an dacc el erer le processus dallocation. Ici limpl ementation de ce m ecanisme dallocation nest pas r ealis e par un agent distinct des demandeurs, mais par un module int egr e directement dans le syst` eme organisationnel des clients potentiels. Il y a donc deux types de connexions: celles qui lient le module dallocation aux syst` emes motivationnel et organisationnel et celles qui repr esentent les messages que le client echange avec les autres agents. Les connexions internes sont d enies par les messages suivants: Allouer(T) est une demande du module motivationnel vers le module dallocation pour que ce dernier trouve quelquun pour faire la t ache T. ImpossibleAll(P) est une r eponse du gestionnaire dallocation au syst` eme motivationnel de lagent qui indique quil nexiste aucun agent qui accepte de faire la t ache T. Engag eFaire(Y,T) est une r eponse du module dallocation au module organisationnel indiquant que lagent Y sest engag e` a faire la t ache T. Les messages externes sont d enis par les actes de langage suivants: Demander(T,self ) est une demande de lagent ` a un agent fournisseur potentiel que la t ache T soit r ealis ee. Accepter(T,Y) est la r eponse positive du fournisseur Y ` a la demande du client. Refuser(T,Y) est la r eponse n egative du fournisseur Y ` a la demande dallocation de t ache T. La structure du module dallocation directe est pr esent ee gure 7.6. Il reprend les grandes lignes de la structure dallocation centralis ee de la section pr ec edente. Il di` ere essentiellement sur deux points: 1. Le param` etre X qui repr esentait pr ec edemment le client a disparu des structures de donn ees internes du m ediateur. 2. Les r esultats dacceptation ou dimpossibilit e` a trouver un agent sont renvoy es aux syst` emes motivationnels et organisationnels du client. Comme dans le cas du syst` eme dallocation centralis e, lordre dans lequel les agents sont questionn es nest pas n ecessairement neutre. On peut envisager plusieurs possibilit es, en donnant des priorit es aux agents ou en eectuant un calcul qui tienne compte de la charge de traitement dun agent et des caract eristiques de la t ache. Lavantage de ce mode dallocation r eside evidemment dans sa simplicit e. Il suppose
353
Figure 7.6: Repr esentation du module de demande du m ediateur par accointances directes simplement que les clients ont la capacit e de conna tre susamment de sp ecialistes pour que les t aches quils ne peuvent pas eectuer eux-m emes puissent etre r ealis ees par dautres. Cependant, il sav` ere beaucoup trop limit e, car il ne peut mettre en contact des fournisseurs qui ne seraient pas en contact direct avec les clients. Il est donc n ecessaire dintroduire un m ecanisme qui permette ` a plusieurs agents de r ealiser un contact indirect. Allocation par d el egation La technique dallocation par d el egation permet de relier entre eux des clients et des fournisseurs qui ne se connaissent pas directement. Ce mode dallocation permet en eet ` a un fournisseur ` a qui on demande deectuer une t ache de la renvoyer ` a un autre agent sil sav` ere quil nest pas capable de le faire. Par exemple, dans la gure 7.7, lagent A ne conna t personne capable daccomplir une t ache qui r eclame la comp etence C2. Il doit de ce fait demander ` a tous les agents quil conna t de demander eux-m emes ` a leurs accointances poss edant la comp etence C2 deectuer la t ache T demand ee, ce processus devant etre r ep et e jusqu` a ce que lon trouve un agent qui accepte daccomplir cette t ache ou que lensemble du r eseau ait et e parcouru. La r ealisation dun tel processus de recherche repose sur des algorithmes de parcours de graphes en parall` eles. Il existe essentiellement deux approches: le parcours en profondeur et le parcours en largeur. Il sagit dalgorithmes tr` es connus en algorithmique distribu ee (on pourra par exemple se r ef erer ` a (Raynal 1987)), mais il faut les adapter ` a lallocation de t aches. Nous ne d ecrirons ici que la technique reposant sur un parcours en parall` ele, laissant au lecteur le soin den traduire les principes dans le cas du parcours en profondeur. La technique g en erale des parcours en parall` ele repose sur des algorithmes de diusion qui propagent r ecursivement les demandes ` a tous les agents
354

C1
Je voudrais faire T, mais je ne connais personne qui ait la comptence C2.
C1
Agent B C1 Agent C
Agent A C3
C3
C2
C3 C1 C2,C3 Agent D C2, C1
Figure 7.7: Le probl` eme de lallocation par d el egation dans un r eseau daccointances connus, except e lagent demandeur lui-m eme. Cependant, il faut tenir compte de deux contraintes: dune part, v erier que lon ne demande quune seule fois ` a un agent daccomplir une t ache T et, dautre part, sassurer que le processus termine, an den tenir eventuellement compte pour aecter la t ache T de mani` ere autoritaire ou passer en mode dappel dore. La premi` ere dicult e est r esolue en marquant les agents lors du parcours et la seconde en utilisant un message suppl ementaire, appel e Acquitter, qui sert ` a retourner vers les agents en amont du processus le fait que toutes les demandes situ ees en aval ont bien et e eectu ees. Chaque agent Z, lorsquil re coit une premi` ere demande dun agent Y concernant la r ealisation dune t ache T pour un agent X et r eclamant une comp etence C, evalue dabord la t ache. Sil poss` ede la comp etence et quil laccepte, il envoie alors ` a lagent X un message dacceptation puis retourne ` a lagent Y un message dacquittement de mani` ere ` a indiquer la n du processus. Sinon, il se marque comme ayant d ej` a analys e la demande et relance la demande ` a tous les agents quil conna t. Lorsque tous ont r epondu par un message dacquittement, il en renvoie un lui-m eme. Lorsque de nouvelles demandes lui sont propos ees pour la m eme t ache T, il se contente alors denvoyer un message dacquittement. Il faut de plus g erer la possibilit e davoir plusieurs acceptations simultan ees. Du fait du parall elisme, deux agents peuvent en eet accepter la demande et sengager vis-` a-vis de lagent X. De ce fait, le fournisseur qui accepte ne doit pas sengager, mais simplement r eserver son engagement jusqu` a l etablissement du contrat avec le client. Dautre part le client doit tenir compte du fait quil peut recevoir plusieurs propositions et on consid` ere quil ne doit accepter que la premi` ere. La gure 7.8 illustre le fonctionnement dun tel syst` eme. Lorsque lagent A a besoin de faire eectuer la t ache T, il demande ` a toutes ses
355
Je sais faire T.
A
Accepter(T,F)
B E
Demande Acquittement
Autre message
Figure 7.8: Un syst` eme dallocation par d el egation accointances, B et C, daccomplir T. Comme ils ne peuvent pas le faire eux-m emes, ils d el` eguent la demande ` a D et E pour B et ` a B et F pour C. De ce fait, B re coit une nouvelle demande et il se contente denvoyer un message Acquitter ` a lagent C. Puisque D ne peut pas le faire et quil na aucune accointance, il renvoie simplement le message Acquitter ` a B. En revanche E peut d el eguer la demande ` a F. Supposons que F sache eectuer la t ache T et quil re coive la premi` ere demande de B. Il envoie ` a A son acceptation de faire T et ` a B un message dacquittement. Lorsque F re coit une nouvelle demande de C, il r epond uniquement par un message dacquittement. Si plusieurs messages dacceptation arrivent ` a A, il ne prend en compte que le premier en marquant que la t ache quil a demand ee est en contrat, cest-` a-dire que F sest engag e ` a laccomplir. Les actes de langage n ecessaires aux communications entre agents sont les suivants: Demander(P,X,Y) est une demande du client X au fournisseur potentiel pour que la t ache P soit r ealis ee, cette demande provenant du demandeur Y. Proposer(T,Y) est la r eponse positive du fournisseur Y ` a la demande du client. Il indique quil r eserve T et attend soit un message daccord, soit un message de refus. Acquitter(T,Y) indique soit que lagent Y accepte de faire P, soit quil a re cu un message dacquittement de tous les agents ` a qui il a demand e de faire T. OreAccept ee(T,X) est une r eponse positive du client X ` a la proposition dacceptation du fournisseur. Le fournisseur peut alors sengager ` a faire P pour X. OreRefus ee(T,X) est une r eponse n egative du client X ` a la proposition dacceptation du fournisseur, lequel peut retirer P de ses engagements en r eserve.
356
A ces messages, il faut ajouter comme toujours les connexions avec les syst` emes organisationnel et motivationnel de lagent. On retrouvera les messages internes entre modules d ecrits ` a la section pr ec edente, ` a savoir: Allouer(T) est une demande du syst` eme motivationnel pour essayer de trouver quelquun ` a qui allouer la t ache T. ImpossibleFaire(T) est une r eponse au syst` eme motivationnel indiquant que la t ache T na pas pu etre allou ee. Engag eFaire(T,Y,X) est un engagement de lagent X ` a accomplir la t ache T pour le compte de Y. Chaque fois quil y a entente entre un client et un fournisseur, les deux agents m emorisent cet engagement de mani` ere sym etrique. Le m ecanisme dallocation par d el egation peut s ecrire sous la forme dun ensemble de quatre modules (g. 7.9) qui g` erent aussi bien la partie client que fournisseur de chaque agent: 1. Un module d evaluation des demandes qui soit propose une ore, soit transmet la demande au module de d el egation. Si lagent a d ej` a re cu une demande, il se contente denvoyer un message dacquittement ` a lagent emetteur de la demande. 2. Un module de d el egation qui se charge denvoyer un message de demande ` a toutes ses accointances et de recevoir tous les acquittements. Ce module est activ e soit par une commande du module pr ec edent, soit par une demande dallocation de t ache provenant du syst` eme motivationnel de lagent. 3. Un module d evaluation des propositions, qui se charge simplement daccepter la premi` ere ore re cue dun fournisseur et de refuser toutes les autres. 4. Un module de r eception des d ecisions qui engage lagent ` a accomplir une t ache si lore a et e accept ee et ` a mettre ` a la poubelle les ores en attentes refus ees. Le module de d el egation (g. 7.10) se contente denvoyer le message DemanderF ` a toutes ses accointances et ` a attendre leur acquittement. Il compte les acquittements re cus gr ace ` a la place P1 . Lorsquil a re cu autant dacquittements quil a envoy e de demandes, il renvoie lui aussi un message dacquittement sauf sil est le client, cest-` a-dire lagent initiateur de la diusion. Dans ce cas, il renvoie le message Fin au module d evaluation des propositions. Le module d evaluation des demandes (g. 7.11) se charge de traiter une demande. Sil peut (et veut bien) faire la t ache T, il propose ses services et se met en attente. Sinon il d el` egue cette demande ` a toutes ses accointances, sauf sil a d ej` a re cu une demande semblable, auquel cas, il renvoie simplement un message dacquittement. La place P2 sert simplement ` a m emoriser le fait quil a d ej` a r epondu a une demande deectuer T pour un client X. ` Les deux derniers modules traitent respectivement de la r eception des d ecisions provenant du client (g. 7.12.a) et de l evaluation des propositions (g. 7.12.b).
357
Figure 7.9: Le syst` eme dallocation par d el egation d ecompos e en quatre modules
Figure 7.10: Le module de d el egation
358
Figure 7.11: Le module d evaluation des demandes Ce dernier, lorsquil re coit une ore, indique au syst` eme organisationnel que le fournisseur va bien sengager, m emorise lore ` a laide de la place P5 et refuse toutes les autres. Le premier re coit ces acceptations ou refus et envoie ` a lagent demandeur un acquittement pour lui signaler quil a bien re cu une demande. Enn, si lore est accept ee, il sengage aupr` es de son client. La place P4 m emorise les propositions en attente dacceptation et de refus, et la place P3 , qui sert de puits, consomme les marques si lore est refus ee.
Figure 7.12: Les modules de r eception des d ecisions (a) et d evaluation des propositions (b) Cet algorithme pr esente n eanmoins quelques imperfections. 1. En premier lieu, on na pas tenu compte des informations portant sur les comp etences des accointances pour optimiser le parcours. Chaque agent envoie les demandes ` a toutes ses accointances, alors quil pourrait envoyer la demande en priorit e aux agents quil sait disposer de cette comp etence. Mais, cette optimisation, qui para t bien anodine cache cependant plusieurs petites dicult es. Il faudra dabord que les demandes soient di erenci ees: on fera dabord une requ ete directe aux seules accointances disposant de la comp etence pour leur
359
demander si elles acceptent daccomplir P, que lon fera suivre par une demande g en erale qui se bornera ` a la d el egation des messages. Pour que cet algorithme fonctionne, il faut etre s ur que les repr esentations des agents soient compl` etes, cest-` a-dire que si un agent B fait partie des accointances de A, alors A sait eectivement quelles sont les comp etences de B. 2. Lorsquun agent indique quil accepte une t ache, il serait tentant de vouloir arr eter lensemble du processus et de dire ` a toutes les autres branches qui sont en train de parcourir le r eseau quil nest plus n ecessaire de chercher ` a obtenir un candidat. Il sut alors que lagent qui accepte envoie un message AcquitterSucc` es vers le demandeur et que ce demandeur envoie un message Arr^ eter ` a tous les agents ` a qui il a envoy e une demande et qui nont pas encore acquitt e une r eponse. Cette modication, qui peut augmenter le nombre de messages ` a envoyer entre les agents, nest ecace que si les messages Arr^ eter sont plus rapides et plus prioritaires que les autres. Autrement, cela ne fera que compliquer inutilement le m ecanisme. 3. Cet algorithme, comme les pr ec edents, ne prend pas du tout en compte les di erents niveaux de comp etences des agents, en ne consid erant que la premi` ere acceptation. Lagent ne demande pas de devis ` a partir desquels il serait capable dexprimer un choix. Lintroduction dun tel m ecanisme est cependant relativement facile. Il sut de m emoriser la liste des agents qui acceptent de faire le travail, de ne passer un contrat quavec le mieux disant et dindiquer aux autres quils ne sont pas accept es. Cette technique sapparente alors a ` celles des appels dores que nous verrons ` a la section suivante. 4. Enn, il faut faire attention ` a la mani` ere de libeller une demande de t ache. Si plusieurs demandes correspondant ` a des t aches identiques sont envoy ees les unes derri` eres les autres, elles risquent de se m elanger, un agent croyant avoir d ej` a r epondu ` a la demande de cette t ache alors quil sagit en fait dune nouvelle. En eet, la place qui se trouve dans le module d evaluation des demandes conserve syst ematiquement toutes les demandes quelle a re cu. Pour eviter ces confusions, il sut de libeller les demandes de t aches en concat enant la description de la t ache, lagent demandeur initial et un num ero dordre, les demandes etant alors toutes syst ematiquement di erentes. R eorganisation dun r eseau daccointances Les accointances dun agent peuvent etre consid er ees comme une sorte de m emoire tampon (m emoire cache) par lesquelles un agent est ` a m eme de conna tre directement les caract eristiques des autres agents dont il peut avoir besoin. De ce fait, on retrouve dans les syst` emes daccointances les probl` emes classiques des m emoires tampon et, en particulier, la dicult e` a maintenir une coh erence entre les accointances et l etat des agents quelles repr esentent, notamment lorsque des agents changent de sp ecicit e, quand un nouvel agent appara t dans le syst` eme, ou lorsque lun dentre eux vient ` a le quitter. Dans ce cas il est n ecessaire de mettre ` a jour la base des
360
accointances des agents de telle mani` ere quelle redevienne coh erente, ce qui pose le dicile probl` eme de la r eorganisation dun r eseau daccointances. Par exemple, supposons quun agent A sache quun agent B dispose des comp etences n ecessaires pour accomplir une t ache T et que, pour des raisons quelconques (un module de B tombe en panne, B sest sp ecialis e dans une autre t ache...), B voit ses comp etences modi ees et nait plus la capacit e de faire T. La prochaine fois que A demandera ` a B de faire T, il tombera sur un refus, alors que jusqu` a maintenant il tenait pour acquis le fait que B fasse T chaque fois quil lui demandait. Il est possible de r esoudre ce probl` eme de coh erence distribu ee de deux mani` eres: Soit en faisant en sorte que B transmette son changement d etat a ` tous les agents qui connaissent B. Mais cela soul` eve deux dicult es: (1) il faudrait que B sache que A conna t les capacit es de B, ce qui n ecessite une gestion de relations bilat erales entre toutes les accointances et (2) il faut faire attention aux probl` emes de parall elisme qui peuvent faire en sorte quune autre demande parvienne ` a B avant quil nait eu le temps de pr evenir tous les agents dont il est une accointance. Soit en modiant la table daccointance de A. Lorsque A demande ` a B de faire T et que cette requ ete echoue, alors A m emorise le fait que B ne sait plus faire T et relance le processus de recherche dagent. Il existe evidemment un grand nombre de variantes possibles du r eseau daccointances. Par exemple, on peut vouloir r eorganiser le r eseau de mani` ere dynamique an que les agents qui ne se connaissaient pas initialement soient mis en contact. On peut aussi am eliorer les performances du syst` eme en g erant de mani` ere statistique les accointances des agents de mani` ere ` a optimiser les requ etes. Les agents avec lesquels un agent est souvent en contrat se trouveront dans sa table daccointances, alors quil laissera tomber les accointances qui ne sont jamais utilis ees. Il est alors possible de faire en sorte que le r eseau apprenne ` a allouer les t aches quil doit accomplir au fur et ` a mesure de son fonctionnement. On donne des bonnes notes aux agents qui donnent satisfaction et de mauvaises ` a ceux qui r epondent moins bien aux demandes. Le syst` eme Cascade r ealis e par H.V.D. Parunak (Parunak 1990) qui contr ole un syst` eme de gestion de manutention fonctionne sur ce principe. Que faire lorsque de nouveaux agents sont mis en service dans un univers multiagent? De nombreuses techniques sont disponibles et presque toutes proviennent de la technologie des r eseaux (par exemple le r eseau Internet) ou de celle des r eseaux distribu ees. Avec la technique du check-in notamment, les nouveaux agents se pr esentent ` a un administrateur, mais cela n ecessite que tous les agents soient connus par ladministrateur. On peut eliminer presque totalement cette dicult e en d enissant un syst` eme hi erarchique dadministrateur, comme dans les r eseaux dordinateur, chaque administrateur sachant contr oler sa r egion et son ensemble dagents. On peut aussi faire en sorte que les nouveaux agents ne sadressent qu` a quelques agents du syst` eme, puis, par lutilisation du r eseau daccointances (et en particulier par son syst` eme de r eorganisation daccointances sil en poss` ede un) linformation se propage le long du r eseau. Si le graphe des accointances est bien
361
fortement connexe, tous les agents du syst` eme peuvent b en ecier des caract eristiques des nouveaux entrants.
7.3.2
Allocation par appel dore: le r eseau contractuel
Le r eseau contractuel est un m ecanisme dallocation de t ache fond e sur la notion dappel dore. Introduit par R.G. Smith (Smith 1979), cette technique a re cu un accueil enthousiaste par la communaut e des chercheurs en intelligence articielle distribu ee et de nombreux syst` emes lont utilis ee. Cest en eet une structure de contr ole tr` es simple ` a comprendre et ` a utiliser. Nous verrons, cependant, que sa simplicit e cache quelques dicult es quil faut r esoudre pour employer le r eseau contractuel dans un contexte r eellement distribu e. Le r eseau contractuel est lune de ces techniques de linformatique o` u laspect conceptuel sassocie ` a limpl ementation pour pr esenter des m ecanismes utilisables, faciles ` a appr ehender et ` a programmer, dont les r esultats correspondent relativement bien aux attentes. Le r eseau contractuel reprend le protocole de l elaboration de contrats dans les march es publics. La relation entre le client, ou administrateur (manager), et les fournisseurs, ou orants (bidders), passe par linterm ediaire dun appel dore et dune evaluation des propositions envoy ees par les fournisseurs. Lappel dore seectue en quatre etapes: 1. La premi` ere est d evolue ` a lappel dore proprement dit. Ladministrateur envoie une description de la t ache quil voudrait voir eectu ee ` a tous ceux quil estime pouvoir r epondre ou ` a tous les agents du syst` eme (g. 7.13.a). 2. A partir de cette description, dans une deuxi` eme etape, les orants elaborent une proposition quils envoient ` a ladministrateur (g. 7.13.b). 3. Ladministrateur re coit et evalue les propositions, attribue le march e au meilleur orant au cours de la troisi` eme etape (g. 7.13.c). 4. Enn, dans la derni` ere et quatri` eme etape, lorant, qui a re cu le march e et qui devient ainsi le contractant (contractor), envoie un message ` a ladministrateur lui indiquant quil est toujours daccord pour accomplir la t ache requise (g. 7.13.d) et quil sengage de ce fait ` a la r ealiser ou bien quil ne peut sacquitter du contrat, ce qui relance l evaluation des ores et lattribution du march ea ` un autre agent (et on revient ` a l etape 3).
Algorithme avec un seul administrateur On analysera dans un premier temps les protocoles du r eseau contractuel lorsquil nexiste quun seul administrateur ` a un instant donn e et lon verra ensuite les probl` emes de g en eralisation ` a un nombre quelconque dadministrateurs simultan es. Les types de messages n ecessaires ` a la r ealisation de ce syst` eme dallocation sont les suivants:
362
Administrateur
Offrants
Administrateur
B C
Offrants ventuels (a) Etape 1. Appel d'offre
B D C
Offrants (b) Etape 2. Envoi des propositions
Administrateur
Administrateur
B C
Contractant (c) Etape 3. Attribution du march
B D C
Contractant (d) Etape 4. Etablissement du contrat
Figure 7.13: Les quatre etapes du r eseau contractuel
363
AppelOre(T,X) est un message de ladministrateur X ` a un orant potentiel pour lui demander denvoyer une proposition pour la r ealisation de la t ache T sil est int eress e. Proposition(T,O) est la r eponse positive dun orant Y ` a un appel dore concernant la t ache T. Il retourne alors une ore O, qui comprend entre autres informations le nom de lorant. PasInt eress e(T,Y) est la r eponse n egative dun orant ` a ladministrateur indiquant ` a ce dernier que Y nest pas int eress e pour accomplir T. Attribuer(T,C,X) est le message de ladministrateur X ` a un orant pour lui signier quil lui attribue le contrat C portant sur la t ache T. Accepter(T,Y) est une r eponse positive de lorant Y ` a lattribution du contrat par ladministrateur. Refuser(T,Y) est une r eponse n egative de lorant Y ` a lattribution du contrat par ladministrateur, ce qui relance l evaluation et le processus dattribution. De plus, comme dans les autres syst` emes dallocation distribu es vus pr ec edemment, ladministrateur (qui est aussi le client), pr esente les connexions classiques avec son syst` eme motivationnel et organisationnel: la demande dallocation Allouer, les r eponses (ImpossibleFaire, Engag eFaire) et lengagement de lorant (Engag eFaire). Un agent peut etre ` a la fois administrateur et orant. Il sagit de deux r oles di erents quun m eme agent peut assumer indi eremment. Cependant, pour etre plus clair, jai pr ef er e d ecomposer cet algorithme en distinguant la d enition du comportement de ladministrateur de celui de lorant. Les appels dore seront reconnus dans le r eseau de mani` ere unique par une cl e form ee de la description de la t ache, de ladministrateur responsable de la diusion de lappel et dun num ero dordre local ` a ce dernier. Par soucis de simplication, on confondra la t ache et le num ero de lappel dore. La gure 7.14 pr esente larchitecture g en erale des modules n ecessaires ` a l etablissement dun protocole de r eseau contractuel. Ladministrateur comprend deux modules (g. 7.15): le module de d enition de lappel dore et de r eception des propositions (A). Celles-ci sont ensuite s electionn ees par un second module (B) qui se charge dattribuer les contrats et de recevoir les acceptations ou refus des orants. Le module A comporte trois places. La premi` ere, P1 , contient simplement lidenticateur de tous les agents du syst` eme. La place P2 sert ` a compter les r eponses ` a lappel dore pour savoir quand il peut passer a ` l etape suivante et la place P3 m emorise toutes les propositions re cues. Le module B ne comporte quune seule place qui est utilis ee pour la d enition de lattribution it erative des contrats aux orants. On a suppos e, dans cette impl ementation du protocole du r eseau contractuel, que les orants pouvaient refuser le contrat envoy e par ladministrateur. Dans de nombreux cas, on peut supposer que les orants acceptent toujours ces contrats, ce qui simplie l ecriture de ce module, puisquon peut se passer des r eponses dacceptation et de refus des orants ainsi que du parcours
364

Administrateur (X) Y A, Y << AppelOffre(T,Self) (A) Allouer(T) PasIntress(T,Y) Proposer(T,O) Offrant (Y) ppelOffre(T,X) (C) X << PasIntress(T,Self) X << Proposer(T,O)
Propositions(T,P) Y<<Attribuer(T,C,Self) ImpossibleFaire(T) Refuser(T,Y) (B) Accepter(T,Y) EngagFaire(T,Y,Self) Attribuer(T,C,X) (D) X << Refuser(T,Self) EngagFaire(T,Self,X) X << Accepter(T,Self)
Figure 7.14: Diagramme synoptique dun protocole de r eseau contractuel. Ladministrateur se charge de la d enition de lappel dore et de la r eception des propositions (module A), puis s electionne les propositions et attribue un contrat au mieux disant (module B). Lorant elabore une proposition en fonction de lappel dore (module C) et d ecide ou non daccepter le contrat elabor e par ladministrateur (module D). it eratif de la liste des propositions retenues. Les orants comportent eux aussi deux modules (g. 7.16). Le premier (C) est consacr e` a l evaluation de lappel dore et a l ` elaboration dune proposition, le second ` a l evaluation des contrats attribu es par ladministrateur. Langage d elaboration de contrats Les primitives de communication que nous avons pr esent ees ci-dessus sont assez el ementaires, mais susantes pour impl ementer lessentiel du r eseau contractuel. Cependant, R. Smith propose un langage plus complet qui se situe ` a un niveau dabstraction plus elev e (Smith 1980) dans lequel lannonce de lappel dore comporte, outre la description de la t ache et le num ero du contrat, une d enition des qualit es requises pour la t ache, la forme de la proposition ainsi quune date dexpiration. La d enition des qualit es requises permet d eliminer rapidement les agents qui nont pas ces qualit es sans avoir besoin deectuer une analyse minutieuse de la description de la t ache. La forme de la proposition sert ` a indiquer ` a lorant quels sont les crit` eres qui seront pris en compte lors de l evaluation et donc de faciliter ensuite le travail d evaluation de ladministrateur. Enn, la date dexpiration donne la date limite apr` es laquelle
365
(A) Allouer(T) P1 A = Tous les agents n 0 PasIntress(T,Y) m(T,n) P2 c(T,n-1) n 0 p(T,{}) p(T,P +{O}) P3 p(T,P) n =0 p(T,P) Propositions(T,P) (B) slection p(T,P) p(T,P) P4 ImpossibleFaire(T) T t(T,Y) EngagFaire(T,Y,Self) P= Accepter(T,Y) O = 1er.P, C=Contrat(O), Y=Offrant(O) Y<<Attribuer(T,C,Self) c(T,C,Y) c(T,C,Y) p(T,rest.P) P Refuser(T,Y) Proposer(T,O)
m(T,card(A)) m(T,n-1)
Figure 7.15: Diagramme du comportement de ladministrateur dun appel dore. Le module (A) sert ` a l emission des appels dores et ` a la r eception des propositions qui sont ensuite transmises au module (B) de s election des propositions et dattribution du contrat. les propositions ne seront plus retenues. Prenons lexemple des robots r ecup erateurs de minerai. Un robot explorateur, ayant trouv e un lon, joue le r ole dun administrateur et propose ` a tous les robots capables de creuser dans du sol meuble de forer ` a lendroit o` u il se trouve. Il leur demande leur position, de mani` ere ` a pouvoir s electionner le foreur le plus proche de lui, mais aussi la liste de leurs performances en fonction des di erents types de sols, en sachant que seuls les robots capables de creuser dans des sols meubles seront s electionn es. En utilisant la notation de R. Smith pour d enir des messages entre administrateurs et orants, voici la mani` ere dont un appel dore peut etre dius e: Message: AppelOffre A: * // indique un message diffus e De: Explorateur-25 Contrat: Forer-Explorateur-25-234 DescriptionDeT^ ache:
366

ppelOffre(T,X) peutFaire(T) peutFaire(T) X << PasIntress(T,Self) a(T,X) Elaboration d'une offre: O = Offre(T)
X << Proposer(T,O)
q(T,O,X) (C)
Attribuer(T,C,X) Accepte(T,C) Accepte(T,C) X << Refuser(T,Self) a(T,X) EngagFaire(T,Self,X) d(T,C,X) X << Accepter(T,Self) (D)
Figure 7.16: Diagramme du comportement dun orant. Le module (C) sert ` a l evaluation des propositions et l elaboration dune ore. Le module (D) se charge de lacceptation ou non dun contrat tel quil a et e elabor e par ladministrateur. TypeDeT^ ache: Forer Qualit esRequises: DoitAvoir : SystemeForage DoitPouvoir : ForerSolMeubles FormeDeProposition: Position : <Lat, Long> Qualit esForage : {TypeDeSol : Performance} DateExpiration: 20 Juil 2193 13:06:46 Fin AppelDoffre Les robots explorateurs r epondront en donnant dans leurs propositions les caract eristiques demand ees par ladministrateur: Message: Proposer A: Explorateur-25 De: Foreur-18 Contrat: Forer-Explorateur-25-234 DescriptionProposition: Position : <47N,17W> Qualit esForage : {Sable: 0,5 Argile: 0,3 Schiste: 0,8} Fin Proposition
367
et lexplorateur attribuera le contrat de forage ` a ce quil estime etre la meilleure proposition. La simplicit e apparente de lalgorithme pr esent e ci-dessus ne doit pas masquer un certain nombre de dicult es. Ces points obscurs portent essentiellement sur l evaluation de la proposition, lacc` es aux orants, la prise en compte dadministrateurs multiples et des engagements personnels, la d ecomposition des t aches en sous-t aches et la qualit e de lallocation obtenue. Evaluation de la proposition Un orant int eress e par une t ache envoie une proposition contenant une evaluation de sa capacit e` a r ealiser cette t ache. Cette evaluation peut sexprimer sous la forme dune simple mesure num erique, ou dune description comprenant plusieurs crit` eres evalu es s epar ement. Dans lapplication de ce m ecanisme ` a la r epartition de charges dans un syst` eme multiprocesseur, il est possible de mesurer lint er et dun processeur pour une charge sous la forme dune simple valeur en prenant en compte la charge du processeur. Plus celle-ci est forte, plus lore est r eduite, et inversement. Dans dautres situations, il appara t plus dicile de caract eriser lint er et dun agent pour une t ache et de mesurer ses capacit es ` a orir un bon service. Dans ce cas, il appartient au concepteur du syst` eme de bien choisir sa fonction d evaluation et les crit` eres qui seront reconnus comme pertinents par le syst` eme, car la performance du r eseau contractuel y est fortement li ee. Adressage des orants Dune mani` ere g en erale, le r eseau contractuel consid` ere que lensemble des agents situ es dans le r eseau sont accessibles depuis tous les agents du r eseau et quobtenir leur liste ne constitue pas un probl` eme. En particulier, dans lalgorithme donn e cidessus, nous avons intentionnellement indiqu e que ladministrateur sadressait ` a tous les agents. Il sagit n eanmoins dune conception pour le moins idyllique qui ne traite pas des probl` emes de mises en uvre dans des contextes r eellement distribu es et qui ne r epond pas ` a la question: comment acc eder aux agents susceptibles denvoyer une proposition? Des algorithmes de parcours de r eseau en parall` ele peuvent etre utilis es pour acc eder ` a lensemble des agents du r eseau. Ils ressemblent essentiellement ` a lalgorithme utilis e pour lallocation par d el egation dans un r eseau daccointances, mais au lieu de demander aux agents sils acceptent dex ecuter une t ache on les prie de faire une proposition et denvoyer cette proposition ` a ladministrateur. Lorsque le processus est termin e et que ladministrateur a re cu tous les acquittements, quils soient porteurs dune proposition ou dune indication de non-int er et, ladministrateur sait quil d etient toutes les propositions et quil peut commencer son evaluation. Evidemment ce processus est tr` es co uteux en temps et en quantit e de messages, puisquil suppose que tous les agents du syst` eme doivent etre adress es individuellement. Il pose de plus le probl` eme de la constitution dun r eseau daccointances, m eme si celui-ci est plus simple que dans le cas dallocation par d el egation, puisquon ne demande pas aux agents de conna tre les comp etences de leurs voisins, mais seulement de savoir quils disposent de voisins. Une autre solution consiste ` a ce que tous
368
les agents soient m emoris es dans une structure de donn ee globale conserv ee par un agent unique, mais on retombe alors sur les probl` emes de goulets d etranglement et de sensibilit e aux pannes caract eristiques des syst` emes centralis es. La solution la plus g en eralement adapt ee par les concepteurs de r eseau contractuel consiste ` a placer les agents sur un bus (g. 7.17), cest-` a-dire sur une organisation en anneau dont le fonctionnement est tr` es similaire ` a celui de lanneau a jeton (token ring). `
Figure 7.17: Une mise en uvre du r eseau contractuel par impl ementation des agents sur un anneau Les messages sont alors toujours v ehicul es dans le m eme sens et circulent de proche en proche, quil sagisse dappels dore ou de propositions. Une solution consiste alors ` a consid erer que les appels dore sont plac es sur un plateau. Les orants lisent lappel dore ` a tour de r ole, l evaluent et placent leur proposition sur le plateau. Lorsque le plateau retourne ` a ladministrateur responsable de cet appel, il sait que tout le monde a r epondu et il peut choisir parmi lensemble des propositions. Cette mise en uvre nest pas non plus tr` es rapide, puisque l evaluation est faite s equentiellement et que lon ne tient pas compte du parall elisme potentiel du r eseau contractuel pour acc el erer le processus. N eanmoins, nous verrons plus loin quelle pr esente lavantage de pouvoir d enir des allocations plus optimales que celles que nous avons donn ees ci-dessus. An daugmenter la vitesse de calcul et limiter le nombre de messages, plusieurs am eliorations partielles tenant compte de la nature de lapplication ont et e apport ees. En particulier, lorsque le r eseau est peu volatile, cest-` a-dire que lidentit e des agents, leur nombre et leurs comp etences varient peu, ce qui est g en eralement le cas, il est possible dappliquer des techniques de m emoire tampon qui reviennent ` a g erer localement une table daccointance par les administrateurs, et dindexer les agents par les t aches auxquels ils r epondent. Cette technique a et e mise au point par Van Parunak pour g erer lallocation automatique de t aches dans des ateliers exibles (Parunak 1990). A chaque t ache est associ ee un type, et lon suppose que tous les agents qui savent eectuer les t aches dun certain type r epondent n ecessairement ` a lore en
369
emettant une proposition. Lorsquun administrateur doit eectuer un appel dore pour un nouveau type de t ache, il diuse cet appel dans tout le r eseau et m emorise dans sa table daccointance tous les agents qui ont r epondu ` a ce type de t ache. En pr esence dune t ache du m eme type, il leur sut alors de ne parcourir que cette liste r eduite pour obtenir la m eme ecacit e. La table daccointance joue alors le r ole dune m emoire tampon qui optimise les acc` es. Parfois la liste se r esume a ` un seul individu, et ladministrateur peut alors dresser des contrats directement sans passer par un m ecanisme dappel dore. Si les agents viennent ` a entrer ou ` a quitter le r eseau, ou encore ` a voir leurs comp etences modi ees, on suppose quils en informeront le r eseau en diusant linformation ` a tous les administrateurs. Une telle technique am eliore les temps de r eponse et le nombre de messages envoy es, mais ses avantages ne sont evidemment perceptibles que si les modications sont faibles devant le nombre dappel dore.
Date limite Nous avons jusqu` a maintenant consid er e que ladministrateur attend toutes les r eponses ` a son appel dore avant d evaluer les propositions. Cela permet evidemment de mieux tenir compte de lensemble des potentialit es du syst` eme en noubliant aucune ore, mais au prix de deux inconv enients majeurs: 1. Tous les agents doivent r epondre, m eme ceux qui ne sont pas a priori int eress es par lappel dore. De ce fait, le r eseau risque d etre satur e par une trop grande quantit e de messages ne contenant que tr` es peu dinformation et portant uniquement la mention pas int eress e. 2. Un agent en panne ou en mauvais fonctionnement peut totalement bloquer le syst` eme. Il sut quil ne puisse pas envoyer une r eponse pour que ladministrateur lattende ind eniment. Il sut pour cela de ne pas demander aux agents de retourner de messages sils ne sont pas int eress es, ou evidemment sils sont dans lincapacit e de le faire. Chaque appel dore comprend en revanche une date limite pour la r eception des propositions. Pass e cette date, ladministrateur evalue les propositions quil a re cu et toutes celles qui arrivent apr` es cette date sont directement rejet ees. Evidemment, cette solution pose dautres probl` emes: il faut bien calibrer ce temps de r eaction de mani` ere ` a ce que la plus grande partie des propositions aient le temps de retourner ` a ladministrateur. Une date trop proche et de nombreuses propositions ne seront pas prises en compte, une date trop lointaine et ladministrateur atteindra inutilement avant de commencer son evaluation. Il est n eanmoins possible d elaborer un syst` eme adaptatif: si trop de demandes arrivent apr` es la date limite, on augmente le temps de r eaction et si on attend trop apr` es la r eception des derni` eres r eponses on diminue ce temps. De ce fait, si les agents r epondent tous avec le m eme temps de r eponse, le syst` eme convergera alors vers une valeur bien adapt ee.
370
Administrateurs multiples et optimalit e Nous avons surtout pris en compte le cas dun administrateur unique, mais il sagit en fait dun cas d eg en er e de r eseau contractuel, car plusieurs administrateurs peuvent travailler en m eme temps et donc emettent leurs appel dore simultan ement. Il est donc n ecessaire de g erer le fait que plusieurs administrateurs peuvent envoyer au m eme agent en m eme temps deux appels dore susceptibles dinterf erer et davoir une inuence pernicieuse sur le comportement global du syst` eme. Dans le r eseau contractuel, les attributions de t aches ne sont g en eralement prises qu` a partir de connaissances locales des administrateurs sans prendre en compte ni ce que les autres administrateurs demandent, ni les autres propositions qui peuvent arriver par la suite. Van Parunak (Parunak 1987) consid` ere en eet qu` a cause de la localit e du processus, les agents subissent trois types dignorance: ignorance portant sur les aspects temporels, spatiaux et sur les charges des orants. 1. Lignorance temporelle provient du fait que les orants ne connaissent que les appels dores d ej` a re cus et non ceux qui sont sur le point darriver. Un agent peut sengager ` a eectuer une t ache pour laquelle il nest en fait pas tr` es bien adapt e et ainsi rater des contrats qui correspondraient plus ` a ses v eritables qualit es. 2. Lignorance spatiale provient de lincapacit e pour les administrateurs de savoir quels sont les autres appels dore en cours et pour les orants de conna tre les autres propositions. Par exemple, supposons que deux administrateurs, A et B envoient ` a deux orants potentiels X et Y deux appels dore pour deux t aches TA et TB, et que les propositions qui en r esultent aient la forme:
A la r eception de ces propositions, ladministrateur A choisira normalement X, car sa proposition semble plus int eressante que celle de Y et de m eme B choisira X puisque sa proposition dans ce cas est aussi bien meilleure que celle de Y. De ce fait X va etre enorm ement charg e pendant que Y restera inactif, alors que lon pr ef ererait attribuer la t ache TB ` a X et laisser la t ache TA ` a Y. Si X connaissait la proposition de Y, il pourrait diminuer sa proposition envers TA, et si Y connaissait la proposition de X, il pourrait augmenter sa proposition envers TB. Il existe ainsi des algorithmes dans lesquels tous les orants envoient leurs propositions ` a tous les autres agents, ce qui permet dobtenir des propositions plus nuanc ees qui tiennent compte de lensemble des propositions des agents. Cependant ces techniques sont tr` es co uteuses en temps et en quantit es de messages, leur complexit e croissant de mani` ere exponentielle avec le nombre dagents dans le syst` eme. 3. Lignorance sur les charges est due ` a ce que les orants ne connaissent pas les charges de travail des autres agents. De ce fait, un agent qui travaille peut
371
etre amen e` a gagner devant un autre dont la charge est presque nulle. Pour rem edier ` a ce probl` eme, Van Parunak propose que les agents disposent des informations portant sur les charges des autres, de mani` ere ` a modier leur proposition et, si besoin est, d etre plus agressif pour remporter le contrat. Engagements, r eservations et rejets des contrats Le parall elisme pose un autre probl` eme: les orants peuvent recevoir de nouveaux appels dore entre le moment o` u ils envoient une proposition et celui o` u ils re coivent lattribution ou le rejet de ladministrateur. Lorant se trouve alors devant un choix dicile. Il peut soit r eserver de la place pour toutes les t aches pour lesquelles il emet une proposition et risquer alors de se trouver sans rien ` a faire, soit au contraire envoyer de nouvelles propositions sans tenir compte des pr ec edentes, quitte ` a se retrouver trop charg e et dans lincapacit e de tenir ses engagements. Chacune de ces possibilit es pr esente des avantages et des inconv enients quil convient danalyser au regard du type dapplication consid er e. 1. En r eservant les t aches, un agent consid` ere que la probabilit e de se voir attribuer une t ache est grande. De ce fait, il r eserve les ressources (en temps et espace) n ecessaires ` a lex ecution de cette t ache. Lorsquun nouvel appel dore lui parvient, il prend en compte les t aches r eserv ees, comme sil s etait eectivement engag e ` a les faire, et envisage le cas ech eant denvoyer des propositions peu int eressantes si les t aches r eserv ees deviennent trop importantes. Il risque cependant de voir ses propositions rejet ees et donc de perdre des contrats, sil r eserve trop de t aches et ne devient plus susamment comp etitif dans ses propositions pour acqu erir de nouveaux march e. Le risque dans ce cas de gure est donc de se retrouver sans un nombre susant de t aches ` a accomplir. Cependant, cette m ethode nest pas sans avantage, notamment par la simplicit e de sa mise en uvre. D` es quune proposition est emise, lagent se contente de r eserver les ressources n ecessaires ` a la r ealisation de cette t ache et calcule ses propositions en tenant compte des t aches r eserv ees comme si elles etaient eectivement engag ees. Cest dailleurs cet algorithme que nous avions choisi pour la pr esentation g en erale du r eseau contractuel. On peut qualier de prudent un agent fonctionnant selon un tel principe, car il minimise les risques de surchaue, mais augmente les risques de ch omage technique. Cette technique est particuli` erement int eressante si le nombre dagents emettant une proposition est peu important, et si les risques li es ` a des surchaues locales sont peu importantes. 2. Au contraire, en ne tenant pas compte des ores d ej` a emises, un agent ne r eserve aucune ressource pour lex ecution des t aches pour lesquelles il emet une proposition. Il risque alors de se trouver avec de nombreux contrats ` a acquitter et donc davoir trop de travail par rapport ` a ses capacit es. Lint er et local dun tel agent est donc d etre toujours relativement plus comp etitif puisquil ne tient pas compte des ressources quil aura eectivement ` a engager sur dautres contrats. Cette m ethode est evidemment plus avantageuse que la pr ec edente lorsque le nombre dagents susceptibles denvoyer une proposition est grand, car la probabilit e dattribution est plus r eduite. An de r esoudre certains conits portant sur lattribution des t aches, il est possible de faire en sorte que lorant qui se voit attribuer trop de contrats
372
refuse des t aches dont il a re cu lattribution. Dans ce cas, ladministrateur doit relancer un appel dore ou tout du moins r e evaluer les propositions qui lui ont et e emises et choisir de signer un contrat avec un autre orant. Notre algorithme tient dailleurs compte de cette eventualit e. 3. Il est possible, enn, de trouver une voie m ediane en utilisant les principes de laide a la d ` ecision en d eterminant lesp erance de chaque t ache. Pour cela, il faut associer deux valeurs aux t aches, la probabilit e dattribution et le gain estim e. La probabilit e dattribution correspond ` a la probabilit e de recevoir lattribution de la r ealisation de la t ache. Par exemple, si un agent X estime quune proposition est susceptible d etre prise ` a 20%, il lui associe la probabilit e 0,2. De plus, son evaluation lui permet de lui associer une valeur correspondant aux avantages quils peut envisager. A partir de consid erations de cet ordre, tout un pan de la recherche dans les syst` emes multiagents porte sur lemploi des th eories micro- economiques fond ees sur la notion de march e et dutilit e ainsi que sur la th eorie des jeux (Rosenschein & Zlotkin 1994). Linuence des sous-contractants Un probl` eme qui na jamais et e abord e par les auteurs du r eseau contractuel, et dune mani` ere g en erale par tr` es peu dauteurs, est celui des sous-contractants, ou plus g en eralement de lenr olement des agents1 . Lorsquun orant X ex ecute une t ache T sous contrat avec un administrateur A, il peut etre amen e` a d ecomposer cette t ache en sous-t aches et ne pas etre capable de r ealiser certaines de ces soust aches lui-m eme. Il doit alors se comporter comme un administrateur et relancer un appel dore pour lensemble des sous-t aches {T1 , .., Tn } issues de la t ache T. Un orant confront e` a une telle situation peut neectuer cet appel dore quapr` es avoir re cu le contrat, ou bien demander dabord aux sous-contractants de sengager ` a eectuer ces t aches avant quil ne fasse lui-m eme des propositions ` a ladministrateur A. Evidemment, il sagit dun probl` eme r ecursif, et les sous-contractants peuvent etre amen es ` a faire appel ` a des sous-sous-contractants et ainsi de suite. Prenons lexemple des d em enageurs, dans lequel coexistent deux types dagents. Les robots porteurs, qui savent porter des meubles, et les robots contrema tres, qui composent les equipes de porteurs, passent les contrats avec les administrateurs, coordonnent les actions entre les porteurs et sassurent de la qualit e du travail. Les contrema tres jouent ici le r ole des orants par rapport ` a la t ache de d em enagement et les porteurs celui des sous-contractants dont les t aches sont limit ees ` a celles du port de meubles. Si un administrateur envoie un appel dore pour d em enager une pi` ece, les contrema tres peuvent soit r epondre directement ` a la proposition et ensuite a lappel dore, soit constituer dabord leurs ` equipes et r epondre ensuite. 1. Dans la premi` ere solution que nous appellerons engagement rapide (early committment), il se peut que lorant (le contrema tre de notre exemple) soit coinc e sil ne trouve aucun sous-contractant libre (ouvrier) capable de laider. La gure 7.18 montre le probl` eme auquel peuvent se trouver confront es deux orants qui demandent au m eme sous-contractant. Lorant B qui vient de recevoir lattribution
1 A notre connaissance, le seul auteur ` a avoir parl e explicitement de ces probl` emes denr olement dans le cadre du r eseau contractuel est T. Bouron (Bouron 1992).
373
dun contrat par ladministrateur se trouve incapable de lex ecuter car il na aucun sous-contractant pour laider, alors que A, qui poss` ede des sous-contractants na pas re cu lattribution.
Figure 7.18: Probl` eme de sous-contractance. B na pas de sous-contractant alors quil vient de recevoir lattribution du contrat de ladministrateur. Le probl` eme vient ici de ce que B a emis sa proposition sans savoir sil disposait de ressources susantes pour pouvoir ex ecuter le contrat. Il se trouve donc bloqu e et doit rompre le contrat avec ladministrateur, ce qui entra ne evidemment une forte r eorganisation. Ce type dallocation fonctionne donc bien si les ressources sont abondantes et que le risque de se trouver sans sous-contractant est peu important. 2. La seconde solution semble evidemment etre une r eponse correcte au probl` eme pr ec edent. Pour eviter de se retrouver sans sous-contractant, il sut de faire un sous-appel dore (cest-` a-dire un appel dore pour trouver des sous-contractants) avant de renvoyer une proposition. Si lon ne trouve pas de sous-contractants, on envoie une proposition peu int eressante. Dans le cas contraire, on peut emettre une proposition en toute qui etude. On dit alors que lorant eectue un engagement tardif (late committment) puisquil demande dabord ` a ses sous-contractants de sengager envers lui-m eme avant quil ne sengage ` a son tour envers ladministrateur. Mais h elas, cette solution pose encore plus de probl` emes que la premi` ere car il faut dabord pr evoir un m ecanisme pour la gestion des engagements des souscontractants. En eet, si la proposition nest pas retenue par ladministrateur, il faut dire aux sous-contractants quils sont lib er es de leurs engagements. On est alors confront e ` a des probl` emes semblables ` a ceux que nous avions vus dans la section pr ec edente sur les r eserve de t aches, et les solutions pour les r esoudre sont analogues. De plus, m eme en supposant ces probl` emes r esolus, on se trouve n eanmoins devant un probl` eme classique en gestion de ressources des syst` emes distribu es, lapparition d etreintes fatales (dead lock) entre plusieurs processus qui doivent acc eder ` a plusieurs ressources en m eme temps. Par exemple, sil nexiste que 6 robots porteurs pour 2 contrema tres, Berthold et Chilp eric, et quayant re cu lappel dore, la t ache n ecessite 4 porteurs. Les deux contrema tres peuvent se
374
retrouver avec des propositions de 3 porteurs chacun. Dans ce cas, ni Berthold ni Chilp eric ne peuvent r epondre positivement ` a lappel dore, alors que le nombre douvriers est sup erieur aux besoins de la t ache. La solution dun tel probl` eme passe par lidentication et le d enouement des conits produisant ces etreintes fatales. Nous traiterons de ce probl` eme ` a la section 7.3.4 qui traite du probl` eme g en eral de lengagement des agents. 3. Il existe une troisi` eme solution, qui est loin de fournir un optima, mais qui permet dassurer une certaine stabilit e au syst` eme et surtout d eviter aussi bien les etreintes fatales que les non-ex ecutions de contrats. Elle consiste simplement dans la constitution d equipes relativement permanentes de sous-contractants, ce qui revient pour un agent ` a embaucher les agents dont il a g en eralement besoin et de les lier ` a sa propre personne par un contrat dexclusivit e. Les sous-contractants ne peuvent r epondre quaux demandes dun seul agent, leur patron, et refuser tout travail qui ne proviendrait pas de cet agent. En echange, le patron sengage ` a leur fournir du travail. La constitution de ces equipes est alors plus permanente que dans les situations analys ees ci-dessus, les agents faisant partie dune equipe pour la r ealisation de tout un ensemble de t aches. La gestion d equipe est ` a la fois plus lourde et plus simple quun simple enr olement pour une t ache pr ecise. Elle est dabord plus lourde car il faut g erer lembauche et le d epart des agents en essayant de r epondre aux demandes avec des equipes d ej` a constitu ees. Mais elle est aussi plus l eg` ere, car toutes les modications sont locales ` a une equipe et nont donc pas de cons equences sur les autres equipes. Dans lexemple des d em enageurs, si le nombre douvriers pour la r ealisation dune t ache est relativement constant, il sera plus facile de constituer une equipe de d em enageurs plut ot que de g erer ` a chaque contrat les conits relatifs a la d ` enition de groupes de sous-contractants. De plus, il est relativement facile dadapter les embauches aux t aches requises, si le travail est relativement semblable. Il sut dembaucher des agents suppl ementaires si les besoins sen font sentir et de d ebaucher des agents lorsque les travaux n ecessitent moins de sous-contractants, en utilisant un syst` eme de r egulation assez simple. Ce quil faut retenir du r eseau contractuel Le r eseau contractuel ore un m ecanisme dallocation de t ache qui apporte une grande souplesse dans la mani` ere de g erer laccord entre les clients et les fournisseurs. Il ne sagit cependant pas dun mod` ele de r esolution de probl` emes, mais seulement dun protocole dorganisation et de r epartition dynamique du travail. Comme tous les protocoles, il ne dit rien sur le contenu de ce qui est echang e. En particulier, il suppose quil existe un langage commun pour la description des t aches et des informations ` a transmettre. Si R. Smith a pu nous donner quelques indications sur la mani` ere de constituer un tel langage en sappuyant sur la notion de description dattributs (cf. section 7.3.2), dautres possibilit es sont ouvertes, mais restent de toute mani` ere ` a la charge du concepteur dun syst` eme multi-agent. Avantages Les avantages du r eseau contractuel sont evidents:
375
1. Il sagit dun m ecanisme dallocation simple ` a mettre en uvre, qui peut simpl ementer sur une architecture distribu ee, ` a condition de prendre les pr ecautions que nous avons mentionn ees quant ` a lacc` es aux agents, linuence des administrateurs multiples et la gestion des engagements. 2. Il ore une grande dynamicit e puisquil ne fait absolument pas appel a ` une quelconque gestion daccointances. Il sut quun agent soit capable de sinscrire au r eseau (check-in) et de le quitter (check-out) pour quil soit possible de prendre facilement en compte lapparition de nouveaux agents et la disparition danciens. 3. La correspondance entre t ache et agent est elabor ee ` a partir dun accord bilat eral entre client et fournisseur, ce qui permet de tenir compte dun grand nombre de param` etres tels que les comp etences des agents, la charge de travail, le type de la t ache ` a eectuer, la description des op erations, le type des donn ees a fournir, la dur ` ee dattente maximale autoris ee, le co ut, lurgence, etc. Inconv enients Malheureusement, le r eseau contractuel nest pas exempt dinconv enients: 1. Si la mise en uvre est simple, lex ecution est lourde et produit un grand nombre de messages. En eet le nombre M de messages dun r eseau tel que celui que nous avons donn e en Bric est de lordre de: M = N + 2N = (1 + 2)N o` u repr esente le rapport entre le nombre dorants int eress es par un appel dore et le nombre total dagents du syst` eme. On voit que, d` es que ce rapport est proche de 0,5, ce qui signie que pour chaque ore la moiti e des agents 2 sont int eress es, le nombre total de messages est de lordre de N . De ce fait, le r eseau contractuel nest applicable qu` a de petites soci et es dagents dans lesquelles seules des t aches de haut niveau sont trait ees par appel dore, de telle mani` ere que le temps des transactions ne soit pas trop prohibitif devant celui de leur ex ecution. En eet, qui serait int eress e par un syst` eme dont tout le temps de calcul serait pris par des proc edures de r epartition et qui ne ferait donc rien de productif? 2. Nous avons vu de plus que la simplicit e de mise en uvre nest quapparente et que, si lon veut b en ecier dune allocation relativement performance, il faut soit que le nombre dappels dore soit faible, soit que lon impl emente une structure complexe de gestion des probl` emes li es au parall elisme du processus. Il est dailleurs dommage que tr` es peu d etudes aient et e faites sur des evaluations de performances de ce type dallocation et sur les probl` emes th eoriques et pratiques rencontr es lors dune mise en uvre distribu ee. 3. Enn, lorsque les t aches sont red ecomposables, il est n ecessaire que les agents aient une strat egie de d ecision qui leur permette de choisir entre un engagement rapide, tardif ou par embauche.
376
Le r eseau contractuel ne peut donc sappliquer qu` a des r eseaux de faible importance ex ecutant des t aches de forte granularit e, et dans ce cas il apporte des avantages consid erables en termes de simplicit e et de dynamicit e, comme en t emoigne leur application ` a un contexte industriel On pourra en particulier se r ef erer ` a (Parunak 1990) pour une pr esentation du syst` eme Yams de gestion datelier exible et du Flavor Paint Shop d ecrit bri` evement au chapitre 1.
7.3.3
Variantes et allocations hybrides
Les m ecanismes que nous avons d evelopp es auparavant correspondent ` a des approches pures, quil sagisse de lapproche par syst` eme daccointances ou par r eseau contractuel. Il est evidemment possible soit de modier lune de ces approches an den d enir des variantes, soit de les fusionner pour essayer de cumuler leurs avantages. R eseau contractuel dirig e par les ores La forme classique du r eseau contractuel est dirig ee par les demandes. Ce sont les administrateurs qui demandent aux orants potentiels de faire des propositions concernant les t aches que les administrateurs voudraient voir ex ecuter. Comme nous lavons vu, cette forme dallocation est plus particuli` erement adapt ee ` a des situations de faible charge, de mani` ere ` a diminuer les conits ainsi que le grand nombre de messages n ecessaires aux transactions. Il est possible dinverser ce m ecanisme dappel dore en faisant en sorte que ce soient les fournisseurs qui envoient aux clients potentiels leur capacit e. Dans ce cas, le syst` eme est dirig e par les ores, cest-` a-dire par la disponibilit e des orants. Cette approche, bien qu etant tr` es utilis ee dans le cas de r epartition de t aches dans les syst` emes dexploitation distribu ee, na et e que tr` es peu etudi ee dans le contexte des syst` emes multi-agents. N eanmoins, en faisant en sorte que ce soient les fournisseurs qui informent les clients de leurs comp etences et de leur disponibilit e, cette technique sapparente ensuite ` a des m ecanismes de gestion daccointances directes, puisque ladministrateur conna t alors lensemble des agents susceptibles de lint eresser. Synth` ese du r eseau contractuel et des accointances La gestion des t aches par les accointances ou par un r eseau contractuel proc` edent de la m eme probl ematique: comment faire eectuer une t ache par un agent comp etent et faire en sorte que des transformations de lorganisation, soit par ajout ou par suppression dagent, soit par modication de leurs capacit es, puissent etre prises en compte sans que le concepteur du syst` eme nait ` a dire explicitement qui doit faire quoi. Dans un r eseau daccointances, les informations caract erisant les comp etences ou l etat dun agent sont directement accessibles par les clients, qui peuvent ainsi se d ecider sans avoir ` a diuser des annonces g en erales. Au contraire, dans le r eseau contractuel pur, on suppose que les agents nont aucune connaissance a priori sur
377
les autres agents. Il est donc n ecessaire de demander ` a tous ceux qui sont int eress es de bien vouloir indiquer ce quils savent faire au travers dune proposition. Nous avons vu que le r eseau daccointance est nettement plus rapide (surtout dans lallocation directe) que le r eseau contractuel, puisquil sut de demander aux agents que lon conna t deectuer le travail, sans avoir besoin de lancer un appel dore. Cependant, le r eseau daccointance manque de dynamisme puisque toute modication passe par une phase de r eorganisation du r eseau. Il est possible dessayer de fusionner ces deux approches de plusieurs mani` eres an den tirer le meilleur parti. Il existe de nombreuses mani` eres de combiner accointances et r eseau contractuel.
1. La premi` ere consiste ` a utiliser le syst` eme daccointances pour les petites t aches et le r eseau contractuel pour les grosses t aches. Nous avons vu que le probl` eme num ero 1 du r eseau contractuel porte sur le nombre de messages ainsi que les temps dattente eventuels avant que ladministrateur ne puisse evaluer les propositions et attribuer le contrat. Lorsquil sagit de t aches importantes ces temps dattente sont supportables. Mais il nen est pas de m eme pour des t aches el ementaires dont lex ecution ne prend quun temps limit e. Dans ce cas, on peut utiliser un r eseau daccointances pour toutes les demandes ne n ecessitant pas trop de travail (et un d efaut de r epartition nest pas trop grave puisque les t aches prennent peu de temps) et r eserver les appels dores aux t aches plus importantes.
2. La seconde consiste ` a faire en sorte que lapprentissage dun r eseau daccointances passe par des appels dore chaque fois que cela est n ecessaire. Par exemple, cela peut se produire sil y a un probl` eme dans le r eseau daccointances et quun client ne trouve pas de fournisseur correspondant ` a ce quil d esire, ou encore que de nouveaux agents veuillent entrer dans le r eseau. On a alors recours ` a un appel dore, les relations daccointances etant construites et modi ees lors de cet echange.
Enn, on peut voir aussi un syst` eme daccointances comme une sorte de m emoire tampon du r eseau contractuel ou encore comme une structure compil ee de ce dernier. Les accointances agissent en eet comme une m emoire cache: leur acc` es est plus rapide, puisquil nest plus n ecessaire de poser la question aux int eress es, mais en contrepartie, il faut pouvoir g erer convenablement les incoh erences entre les accointances et les agents, qui peuvent survenir notamment lors des r eorganisations du r eseau. Cest aussi une version compil ee du r eseau contractuel qui permet d eviter lappel dore et les co uts denvois de messages associ es. Dans ce cas, la r eorganisation dun r eseau daccointances peut etre compar ee ` a une recompilation dune structure d ej` a compil ee.
378
7.3.4
Contrats et engagements
Notion de contrat Comme lindique le Code civil, un contrat est une convention par laquelle une ou plusieurs personnes sengagent ` a donner, ` a faire ou ` a ne pas faire quelque chose. Cette d enition sapplique aussi bien aux contrats entre agents. L elaboration dun contrat vise ` a la d enition dun double engagement. Le fournisseur sengage aupr` es dun client ` a tout mettre en uvre pour ex ecuter la t ache dont il a accept e lattribution et le client sengage ` a ne pas proposer la m eme t ache ` a un autre agent (m eme si parfois cet engagement nest pas toujours appliqu e). Un ensemble dengagements, comme nous lavons vu au chapitre 5, forme des structures de d ependances. Le fait que A puisse accomplir son contrat d epend lui-m eme dun autre contrat que B a accept e. Cet ensemble de d ependance constitue un r eseau qui structure laction collective et permet ` a des agents cognitifs daccomplir des t aches en consid erant comme acquis le fait que leurs fournisseurs accompliront bien les t aches pour lesquelles ils se sont engag es. Fin de contrat Un contrat passe par une s erie d etats dont voici les principales: 1. Il se trouve dabord en cours dallocation. Quil sagisse dun r eseau contractuel ou dun syst` eme dallocation par accointances, la t ache nest pas encore attribu ee et le contrat nest dont pas encore conclu. 2. Le fait que le fournisseur accepte deectuer une t ache engage celui-ci ` a laccomplir, et le contrat se trouve donc conclu. 3. Si tout se passe bien, la t ache est ex ecut ee normalement et le fournisseur retourne le fait que la t ache sest bien termin ee, et le contrat se trouve alors dans l etat ex ecut e. 4. Si au contraire, il se passe un ev enement non pr evu au cours de lex ecution du contrat, cela signie que le fournisseur ne peut faire face ` a ses engagements, et le contrat se trouve ainsi rompu. Dans ce cas, lagent envoie un message ImpossibleFaire ` a son client. Que peut faire le client lorsquun contrat est rompu? Plusieurs alternatives se pr esentent ` a lui, et choisir lune plut ot que lautre d epend de ses capacit es et de la nature de la t ache T. Sil sagit dune t ache peu importante, le client de T peut d ecider de labandonner purement et simplement. Si la t ache est importante et quelle entre dans la r ealisation dune t ache T plus importante, le client de T peut (a) essayer de trouver un autre fournisseur, ou bien (b) dire au client de T quil ne pourra pas non plus ex ecuter T, ce qui risque dentra ner toute une cascade de ruptures de contrat.
7.4. INTEGRER LES TACHES ET LES ETATS MENTAUX
379
La rupture de contrat peut aussi provoquer des p enalit es. Cela signie en fait que dans le cas dun r eseau daccointances, le client de T puisse rayer ce fournisseur de ses accointances pour les comp etences n ecessaires ` a la r ealisation de T. Dans un r eseau contractuel, ces p enalit es forceront le fournisseur pour que ses propositions futures concernant lex ecution dune t ache du type de T soit minor ees.
7.4
7.4.1
Int egrer les t aches et les etats mentaux

Le syst` eme SAM
Comment int egrer les etats mentaux, tels que les intentions et les engagements, et les algorithmes dallocation tels que le r eseau contractuel ou la gestion des accointances? An de r epondre ` a cette question, nous etudierons le cas dun syst` eme Sam (Social Agent Model) d evelopp e par Thierry Bouron (Bouron 1992). Lint er et de son travail est davoir montr e limportance des m ecanismes de collaboration pour la performance du groupe. Il a appliqu e son mod` ele ` a lexemple tr` es classique de la poursuite entre des pr edateurs et des proies, dans lequel des pr edateurs doivent entourer des proies qui fuient en se d epla cant au hasard, comme nous lavons pr esent e au chapitre 1. Toute la dicult e porte sur la conception des pr edateurs et, en particulier, sur leur mani` ere de coop erer pour attraper des proies. Il sagit donc de concevoir di erentes strat egies de coop eration et de les evaluer par rapport aux performances de capture. En particulier ses strat egies consistent ` a d enir des associations eph em` eres, qui ne durent que le temps de r ealisation de la t ache globale.
"FEEDBACK " DES ACTIONS PHYSIQUES SIGNAL
MODULE DE PERCEPTION ACTION INTERNE (A.I.) CONDITION DE TRANSITION(C.T.)
MODULE D'ORGANISATION
C.T. A.I.
MODULE DE DECISION
C.T. A.I.
COMMUNICATION MODULE DE COMMUNICATION
ACTION PHYSIQUE
COMMUNICATION
Figure 7.19: Lorganisation dun agent Sam T. Bouron d eveloppe un mod` ele complet de coop eration entre agents fond e sur la notion dactes de langage et dengagement et qui int` egre des m ecanismes de coop eration tels que le r eseau contractuel. Pour cela les agents sorganisent de mani` ere ` a ex ecuter des t aches globales, appel ees t aches sociales par T. Bouron, qui ont comme objectif la capture dune proie. Les agents sont d enis ` a laide
380
dune architecture modulaire (cf. chap. 3) comprenant 4 modules perception, organisation, communication et d ecision comme le montre la gure 7.19. Les deux premiers modules traitent les perceptions et les communications. Le troisi` eme, le module dorganisation, g` ere les engagements tenus par lagent. Il contient une repr esentation de la t ache globale ` a lorigine de ses engagements, une description de la t ache locale attribu ee ` a lagent dans le contexte de lassociation et au moins le nom ou ladresse dun autre agent impliqu e dans cette association. Le module de d ecision est le plus important des quatre, car il d etermine le comportement de lagent, cest-` a-dire les actions physiques et les messages envoy es a dautres agents. Ce module est repr ` esent e sous la forme dun automate ` a etats nis, dans lequel chaque d ecision est repr esent ee sous la forme dune transition qui ne peut etre franchie que si lagent est dans l etat d esir e et que toutes les conditions dapplication de la d ecision sont remplies. L etat dun agent est d etermin e par une fonction bool eenne portant sur un ensemble de variables d etats appel ees statuts. Ces variables, comme les conditions et les actions de transitions, peuvent etre class ees en plusieurs cat egories comme le montre la gure 7.20.
STATUTS
STATUTS SOCIAUX
STATUTS D'ACTIVITE
STATUTS CONVERSATIONNELS
STATUTS ORGANISATIONNELS
(ex, scrutant-lenvironnement)
(ex, interrogatif)
ACTIONS DE TRANSITION
(ex, leader)
EXECUTION DUNE ACTION EXTERNE
EXECUTION D'UNE ACTION PHYSIQUE
ENVOI D'UN ACTE DE LANGAGE
EXECUTION DUNE ACTION INTERNE
(ex, se dplacer)
(ex, informer)
(ex, effacer la base de requtes)
CONDITIONS DE TRANSITION
CONDITIONS DES ENGAGEMENTS
(ex, interruption de lengagement)

RECEPTION D'UN ACTE DE LANGAGE
RECEPTION D'UN SIGNAL
(ex , signal d'un obstacle)

RECEPTION D'UNE RETRO-ACTION ("FEEDBACK")
(ex, informer)
(ex, rtro-action de se-dplacer)
Figure 7.20: Les statuts, actions et conditions de transition dun agent Sam
7.4.2
La hi erarchie des architectures
An danalyser plus nement lecacit e de la coop eration des agents, T. Bouron a d eni une hi erarchie qui distingue entre plusieurs niveaux dagents (g. 7.21). Au premier niveau, les agents sont uniquement mobiles. Ils ne poss` edent quune capacit e de perception et ne peuvent pas communiquer avec les autres. Au niveau suivant, les agents sont capables de se communiquer des informations sur l etat

Agents de type 3 avec la capacit de fusionner des groupes Agents de type 3 pouvant dlguer des tches d'autres agents Agents de type 2 pouvant tablir des "contrats"
381
Agents de type 5
Agents de type 4
Agents de type 3
Agents de type 2
Agents mobiles avec des capacits de perception et de communication Agents mobiles avec des capacits de perception
Agents de type 1
Figure 7.21: Les di erents niveaux de comportements du monde ext erieur et donc daugmenter les capacit es de perception des agents. Le niveau 3 introduit la notion de contrat. Un leader est capable dengager des collaborateurs pour former des groupes de pr edateurs. Par le syst` eme de contrat, il est possible de ne d enir que des groupes qui aient la bonne taille, cest-` adire quil y ait ni trop ni pas assez dagents qui sengagent ` a chasser une proie particuli` ere. La technique d elaboration de contrat est fond ee sur celle du r eseau contractuel, que nous avons pr esent ee pr ec edemment. Au niveau suivant est d eni un processus de d el egation qui autorise les agents non leader ` a d el eguer leur contrat a un autre agent sils d ` ecouvrent une proie qui nest pas encore poursuivie. Dans ce cas, lagent se d esengage de son groupe et devient leader dun nouveau groupe lorsque la d el egation de sa t ache courante est achev ee. Ce m ecanisme permet daugmenter le nombre de t aches prises en compte en utilisant les agents engag es comme des leaders potentiels de nouveaux groupes. Enn, au dernier niveau, un processus de regroupement permet ` a plusieurs petits groupes ne disposant pas dassez dagents pour accomplir leur t ache de sassocier et dunir leurs forces. Ce processus est une r eponse au probl` eme de la sous-contractance, d ecrit ` a la section 7.3.2, qui laisse des groupes incapables de r ealiser la t ache pour laquelle ils se sont engag es.
7.4.3
Les r esultats
Lint er et de cette etude r eside non seulement dans la d enition de cet ensemble darchitectures embo t ees, mais aussi dans lensemble des exp erimentations ayant pour but danalyser la performance de ces syst` emes. La gure 7.22 pr esente les r esultats obtenus avec ces di erentes architectures pour une densit e dagents (nombre de pr edateurs/nombre de proies) de 2. On peut constater que, pour cette densit e, les agents les plus elabor es sont plus performants
382

100 90 80 70 60 50 40 30 20 10 TEMPS SIMUL 100 types de prdateurs 200 type-1 300 type-2 400 type-3 500 type-4 600 type-5 700 (53) % TACHES EFFECTUES (96) (95) (89) (80)
Figure 7.22: Les performances des groupes de pr edateurs en fonction des types dagents Sam que les agents de type 1 et 2 puisquils peuvent attraper un plus grand nombre de proies en un temps moindre. Il faut n eanmoins remarquer que les agents de type 3, qui ne comprennent que des capacit es contractuelles sans m ecanismes de d el egation ni de r eorganisation des groupes, sont plus performants ici, car la densit e des pr edateurs est relativement importante. Pour des densit e tr` es faible, les agents de type sup erieur sav` erent plus performants, le fait de pouvoir d el eguer des t aches ou de se regrouper constituant alors un int er et appr eciable par rapport ` a un simple r eseau contractuel. On peut noter cependant que le ph enom` ene de regroupement est surtout int eressant si le temps imparti nest pas trop important (en dessous de 500 unit es de temps dans les simulations). En revanche, les ph enom` enes de d el egations, qui ralentissent laccomplissement des t aches, deviennent plus favorables au-del` a par leur capacit e ` a recouvrir une plus grande portion de territoire. Les graphes
ACTIONS DE DPLACEMENT 600 500 400 300 200 100 1 2 3 4 6 8 DENSIT DAGENTS 1 2 3 4 6 8 DENSIT DAGENTS
COMMUNICATIONS 1200 1000 800 600 400 200
types de prdateurs
type-1
type-2
type-3
type-4
type-5
Figure 7.23: Le co ut des communications et des actions physiques dans Sam
383
de la gure 7.23 donnent le nombre moyen dactions de d eplacements ex ecut ees et le nombre de communications envoy ees en fonction de la densit e des agents. On peut constater que les techniques de collaborations evolu ees sont plus co uteuses en communication, mais quelles am eliorent le nombre de d eplacements eectu es par les agents, ce qui est une parfaite illustration de lint er et de la coop eration pour am eliorer les performances et diminuer les co uts, si lon suppose bien s ur quil est plus co uteux de se d eplacer que de communiquer.
7.4.4
Limpl ementation des architectures
Dans le syst` eme Sam de T. Bouron, les comportements de ces di erents agents sont d enis sous la forme dautomates ` a etats nis, les etats etant donn es par les fonctions bool eennes des statuts. Malheureusement, comme nous lavions signal e au chapitre 4, les automates ` a etats nis ne sont pas facilement composables et ils ne permettent pas de d enir de mani` ere modulable les comportements des agents. De ce fait, la lecture des comportements d enis par T. Bouron est assez dicile. An den simplier la compr ehension, nous en donnerons ici une repr esentation en termes de Bric, ce qui permettra de les int egrer aux m ecanismes dallocation vus pr ec edemment. Nous ne pr esenterons ici que les trois premiers niveaux de Sam.
Figure 7.24: Le comportement dun agent de niveau 1 se contente daller vers la proie la plus proche.
7.4.5
Le niveau 1
Larchitecture de niveau 1 est extr emement simple, puisque lagent se borne a ` s electionner la proie qui lui semble la plus proche de toutes celles quil per coit et ` a aller dans sa direction (g. 7.24). Les entr ees de synchronisation servent a ` la mod elisation des actions. Nous en avions parl e au chapitre 4 concernant la mod elisation des architectures dagents en Bric.
384
7.4.6
Le niveau 2
Au niveau 2, les agents communiquent leurs informations ` a tous les autres agents. Dans la version que nous pr esentons ici, nous supposons que les agents peuvent sabonner sils veulent recevoir des informations dautres agents.
Figure 7.25: Le comportement dun agent de niveau 2 peut etre d ecompos e en un module de contr ole (qui impl emente la fonction conative) et deux modules de gestion des abonnements. La gure 7.25 pr esente une architecture de niveau 2 dans laquelle on a omis de faire mention des bornes de synchronisation. Le syst` eme organisationnel est d ecompos e en deux modules: un pour la gestion des abonnements (g. 7.26.A) et un autre pour la demande dabonnement (g. 7.26.B).
Figure 7.26: Les deux modules de gestion (A) et de demande dabonnement (B) Le module de contr ole impl emente la fonction conative et se contente de recevoir les informations des agents aupr` es desquels il est abonn e et les percepts (g. 7.27) et de d eclencher les actions correspondantes. Lagent demande un abonnement sil ne per coit aucune proie et se d esabonne lorsquil en per coit une.

pos(x,p) Info(x,p) Informer(x,p) pos(x,p) pos(x,p) TOUS S'abonner TOUS pos(y,q) avec y = PlusProche({pos(x,p)}) & dist(self,y) > d SeDsabonner AllerVers(q)
385
y, dist(self,y) < d
pos(x,p) Perception
Figure 7.27: Le module de contr ole (syst` eme conatif) dun agent de niveau 2
7.4.7
Le niveau 3
Le niveau 3 fait intervenir la notion dappel dore en plus de la gestion des abonnements aux informations du niveau 2. Si un agent aper coit une proie, il se dirige vers elle, devient leader et envoie un appel dore pour constituer une equipe. Les agents int eress es et qui nont pas d ej` a et e recrut es sengagent dans une telle equipe. Cest le leader qui se charge de donner en permanence la position de la proie et, lorsquelle est attrap ee, il pr evient tous les agents de l equipe que la t ache est termin ee, ce qui les d elie de leur engagement. Larchitecture dun agent de niveau 3 est donn ee gure 7.28. Il se compose de cinq modules: un module de contr ole qui impl emente la fonction conative de lagent, deux modules pour traiter lappel dore (modules dadministrateur et dorant) et deux modules pour g erer respectivement l equipe et lengagement aupr` es dune equipe. Ces deux derniers modules sont particuli` erement simples (g. 7.29). Le gestionnaire de lengagement se contente de m emoriser sil est engag e ou non, les modules de contr ole et dorant pouvant y avoir acc` es pour savoir si lagent est engag e ou non. Le module de gestion de l equipe transmet la position de la proie en cours de capture ` a tous les membres de l equipe ainsi que lindication de n de t ache. Dans ce cas, l equipe est d emantel ee. La d enition de l equipe provient des modules dappel dore. Ces derniers, qui ne sont pas repr esent es ici, ne di` erent des modules que nous avons examin es pr ec edemment que par les points suivants: la s election des candidats ne conduit pas ` a recruter un seul pr edateur, mais trois pour constituer une equipe; le r esultat est donn e sous la forme dun ensemble dagents qui sengagent a poursuivre une proie; enn le test peutFaire qui indique si un orant est int ` eress e par lappel dore est remplac e ici par un test sur la distance de lorant ` a la proie dune part et par une requ ete au module dengagement pour savoir si lagent est engag e ou non, car seul un agent libre peut sengager dans une equipe. Le module de contr ole (g. 7.30) re coit les perceptions des proies ainsi que des informations provenant de son leader sil sest engag e dans une equipe. Il prend ses
386
Figure 7.28: Diagramme g en eral dune architecture dagent de niveau 3 qui comprend un syst` eme dappel dore et une gestion dengagement dans une equipe
Gestion de l'engagement eng(z) eng(F) P1 eng(V) eng(F) eng(V) Gestion info(x,p) de l'quipe termin(x) a E, a << Informer(x,p) a E, a << TacheTermine(x,self) quipe(x,E) q(x,E)
q(x,E)P2 engag dsengag eng(z) engag?
Figure 7.29: Les modules de gestion de lengagement aupr` es dun leader et de gestion dune equipe d ecisions ` a partir des r` egles suivantes: 1. Si lagent est leader (et engag e, on suppose que les leaders sengagent aupr` es de leur propre equipe) et sil per coit une proie libre, alors il se dirige vers elle et envoie aux membres de son equipe linformation de sa position. 2. Si lagent nest pas leader, mais quil est engag e et re coit des informations concernant la position de la proie, alors il se dirige vers cette position, n egligeant les perceptions concernant dautres proies quil pourrait apercevoir en chemin. 3. Si lagent nest pas engag e et sil per coit une proie libre, alors il devient leader et cherche ` a constituer une equipe en envoyant un appel dore. 4. Si lagent est leader et sil per coit une proie captur ee, alors il envoie un message indiquant que la t ache est termin ee et il se d esengage.
387
TacheTermine(x,b)
dsengag
engag Informer(x,p)
leader s = captur
termin(x)
allouer(x) pos(x,p) engag s = libre & engag & dist(self,x) < d
s = libre & engag pos(x,p) AllerVers(p) perception
proie(x,s,p)
engag
proie(x,s,p) avec x = PlusProche({proie(y,r,q)}) proie(y,r,q)
info(x,p)
Figure 7.30: Le module de contr ole dun agent de niveau 3 Ces r` egles, impl ement ees dans le module de contr ole Bric, sont susantes pour g erer le comportement des agents pr edateurs de niveau 3. N eanmoins, un certain nombre de simplications ont et e gliss ees dans la d enition de ce comportement: 1. On na pas pris en compte les d esengagements eventuels dun membre dune equipe de son propre chef. La seule mani` ere pour une equipe de se dissoudre est de parvenir ` a capturer la proie an que le leader sen aper coive et dissolve l equipe ainsi constitu ee. De ce fait, lorsquun agent sest engag e aupr` es dun leader, il ne peut pas revenir sur ses engagements. 2. Un agent orant (cest-` a-dire non-leader) devient aveugle une fois engag e, et les informations quil pourrait percevoir ne sont pas disponibles pour les autres pr edateurs. Cest pourquoi les agents de niveau sup erieur d el` eguent leurs informations ` a tous les agents qui ne sont pas engag es pour quils disposent dun plus grand nombre dinformations et am eliorent leur performance de capture. 3. Les leaders, sils ne peuvent recruter le bon nombre dagents, demeurent bloqu es jusqu` a ce quune equipe soit constitu ee. Pour supprimer ce blocage, les agents Sam de niveau sup erieur peuvent soit dissoudre une equipe insusante, soit n egocier avec dautres leaders ne disposant pas dune equipe compl` ete pour fusionner leurs equipes. Ce travail permet cependant de comprendre comment des techniques dappel dore peuvent sincorporer ` a des m ecanismes dengagement et d enir ainsi des agents capables de r epartir leur travail et de demander ` a dautres de les aider. De plus, on peut constater que la modularit e est relativement bien assur ee: il serait tr` es facile de modier larchitecture dagents de niveau 3 pour quils g` erent un r eseau daccointances. Il sut de changer les modules dadministrateur et dorant pour les remplacer par des modules de client et fournisseur dun syst` eme daccointances
388
pour que le comportement global de lagent soit remani e sans devoir remettre larchitecture g en erale et les autre modules.
7.5
Allocation emergente
Jusqu` a maintenant nous ne nous sommes int eress es qu` a lallocation de t aches par agents cognitifs, capables de communiquer intentionnellement entre eux. Cette activit e prend la forme de dialogues que s echangent les agents pour parvenir ` a ce que le travail soit eectu e par un agent comp etent. On peut etre surpris de penser quil est aussi possible de parler dallocation de t aches dans le cas dagents r eactifs. En eet, on pourrait supposer que leurs capacit es limit ees ne leur permettraient pas de mettre en uvre des m ecanismes aussi complexes que les algorithmes que nous venons danalyser. Et pourtant, il est possible de faire en sorte, dune part, que les t aches soient distribu ees aux agents et, dautre part, que les agents eux-m emes se sp ecialisent dans laccomplissement de telle ou telle t ache. Lallocation r eactive fait appel ` a la notion de signal et non ` a celle de message. Les signaux, comme nous lavons vu au chapitre 6, sont des formes non intentionnelles de communication, transmises par diusion et propagation dans lenvironnement, le signal d ecroissant g en eralement dintensit e avec la distance. Ces signaux sont donc des formes de communication el ementaires pour lesquelles il nexiste pas une s emantique unique: un m eme signal pourra induire deux comportements di erents dans deux agents di erents. Lexemple le plus caract eristique est le cri dun jeune animal: pour ses cong en` eres il pourra d eclencher (en fonction de lesp` ece) un comportement de protection, alors que pour un pr edateur il donnera lieu au contraire ` a un comportement de poursuite et de chasse. Lun des int er ets majeurs de ces signaux pour lallocation de t aches vient de ce que leur intensit e d ecro t avec la distance ` a la source. En eet lintensit e dun signal qui se propage instantan ement est g en eralement donn ee par l equation: I (x) = k k ou I ( x ) = dist(x, x0 )2 dist(x, x0 )
o` u k est une constante qui repr esente lintensit e maximale du signal ` a la source, et dist est la fonction de calcul de la distance entre deux points. Bien que la deuxi` eme equation, qui stipule que lintensit e dun signal d ecro t lin eairement avec la distance, nait pas de r epondant physique imm ediat, elle est souvent utilis ee en pratique du fait de sa simplicit e de mise en uvre. La d egradation de lintensit e des signaux en fonction de la distance introduit une di erence dans les agents qui per coivent ce signal. Il y a ceux qui se trouvent proches de la source et pour lesquels le signal sera fort, et ceux qui se trouveront plus eloign e et qui donc ne recevront quun signal att enu e. Le principe de lallocation de t ache repose alors sur le d eclenchement di erenci e dun comportement en fonction de lintensit e du signal quun agent re coit. Par exemple si un agent peut eectuer lune des deux t aches T1 ou T2 et qu` a ces t aches soient associ ees respectivement les signaux S1 et S2 , il ex ecutera la t ache
7.5. ALLOCATION EMERGENTE
389
pour laquelle le stimulus (calcul e comme le produit de lintensit e du signal par un coecient interne correspondant ` a la tendance quun agent a de faire une t ache) est le plus fort: ex ecuter(T1 ) si S1 S2 ex ecuter(T2 ) si S2 < S1 Lorsque les intensit es sont identiques, et pour eviter le c el` ebre blocage de l ane de Buridan qui ne pouvait choisir entre deux tas de foin sil se trouve ` a egale distance des deux tas, on tire al eatoirement entre les deux actions. On peut aussi d eclencher les t aches de mani` ere al eatoire, lintensit e des stimuli Si d enissant la probabilit e de d eclenchement des t aches Ti . Ce d eclenchement di erentiel introduit dans les syst` emes multi-agents deux formes de comp etition. 1. La premi` ere correspond ` a une comp etition intra-agent qui porte sur lensemble des t aches quun agent peut accomplir. La prise de d ecision dun agent r eactif d epend de trois facteurs: lintensit e initiale du signal, la tendance ` a accomplir telle ou telle t ache, la distance ` a la source et la capacit e de perception de lagent. Deux signaux qui ont m eme intensit e pourront etre di erenci es par un m eme agent en fonction de ses propres tendances. Par exemple, un pr edateur ne portera pas le m eme int er et ` a un signal lui indiquant la position dune proie sil a le ventre creux ou sil vient de manger. Ces quatre facteurs se combinent pour donner un stimulus dont lintensit e d ecide du choix de la t ache ` a d eclencher, la t ache ayant le plus fort stimulus remportant la comp etition (cf. section 3.6.5). 2. La seconde concerne la relation respective des agents vis-` a-vis de la source du signal. Comme lintensit e relative est plus forte lorsquon se trouve pr` es de la source, les agents les plus proches auront plus tendance ` a accomplir les t aches li ees ` a ce stimulus que les plus eloign es. Cette comp etition nest cependant pas sans poser des probl` emes: que se passe-t-il en eet lorsque deux agents d ecident de r epondre ` a ce stimulus et quun seul agent sut pour r epondre ` a la demande? Dans lexemple des robots explorateurs, supposons quun robot foreur ait besoin de faire transporter son minerai jusqu` a la base. Pour ce faire, il envoie un signal DemandeTransport qui se propage et diminue dintensit e avec la distance. Si plusieurs transporteurs re coivent le signal et d ecident de se d eplacer jusqu` a la source, lequel aura eectivement la possibilit e de transporter le minerai? La solution evidente consiste ` a servir le premier arriv e. Si les transporteurs ont la m eme capacit e de locomotion, le plus proche de la source arrivera normalement le premier et aura donc le b en ece de lex ecution de la t ache. Mais tous les probl` emes ne sont pas r esolus pour autant. Les techniques de comp etition noptimisent pas toujours le comportement des agents. Par exemple, supposons quil existe deux zones de forage relativement eloign ees lune de lautre, et que les deux robots foreurs F1 et F2 plac es dans ces zones aient besoin dun transporteur en m eme temps (g. 7.31). Si les transporteurs A1 et A2 sont situ es plus pr` es de F1 que
390
de F2 , ils r epondront tous deux favorablement ` a la demande de F1 et se dirigeront vers F1 (1). Mais comme A1 est plus pr` es de F1 que A2 cest lui qui transportera le minerai de F1 ; A2 se sera d eplac e pour rien (2). Mais si F2 a toujours besoin dun transporteur, A2 sera maintenant sensible ` a son appel et se dirigera vers lui (3 et 4).
Figure 7.31: Les di erentes phases dun syst` eme dallocation r eactive de t aches On voit que dans cette situation, le transporteur A2 a dabord et e vers F1 pour se rendre compte quil etait d ej` a aid e par A1 et quil navait pas besoin de lui. Il a donc eectu e le chemin A20 F1 puis le parcours F1 F2 , au lieu du simple trajet A20 F2 , ce qui peut sav erer co uteux si les agents A1 et A2 sont susamment loin. Le fait que le trajet soit non optimis e fait malheureusement parti des techniques r eactives qui ne tendent g en eralement pas vers loptimum, mais qui compensent cette perte par une grande capacit e dadaptabilit e. Il est clair en eet que cette technique est totalement ind ependante du nombre dagents mis en uvre et, mieux encore, plus le nombre dagent est important plus on a de chance de r epondre aux demandes de r ealisation de t aches. Que lon supprime un agent et le syst` eme continue ` a fonctionner comme sil ne s etait rien pass e. Nul besoin de protocoles complexes, ni de v erication de terminaison, ni dune mani` ere g en erale de tout lattirail algorithmique que nous avons examin e pr ec edemment. Il existe un deuxi` eme probl` eme: les agents r eactifs peuvent etre pi eg es dans des zones dombre pour des signaux provenant dautres demandes. Dans ce cas, lagent devient sourd aux appels dautres agents. On peut r esoudre cette dicult e de plusieurs mani` eres: la premi` ere porte sur le nombre dagents. Plus celui-ci est grand plus la probabilit e que certains agents puissent r epondre ` a ces besoins devient importante. On peut aussi eliminer cette dicult e en augmentant continuellement les intensit es des sources des signaux tant que les sources nont pas re cu de satisfaction. Si lon peut faire cro tre lintensit e ind eniment, toutes les zones dombre seront un jour recouvertes et les agents qui sy trouvent pourront recevoir ces stimuli.
` 7.6. UN EXEMPLE: LE SYSTEME MANTA
391
7.6
Un exemple: le syst` eme Manta
De mani` ere g en erale, les techniques r eactives sont surtout utilis ees pour lavantage quelles conf` erent en termes de simplicit e et dadaptabilit e ` a des conditions qui evoluent souvent. En eet, elles assurent une bonne r epartition des t aches en fonction des besoins au prix n eanmoins dune certaine redondance de moyens. Le syst` eme Manta de mod elisation dun nid de fourmis en est un bon exemple.
7.6.1
Description g en erale
Le syst` eme Manta est caract eristique dune approche r eactive dans laquelle linformatique et les sciences de la vie sapportent mutuellement de leurs apports. En eet ce projet, qui porte sur la mod elisation par syst` emes multi-agents dune colonie de fourmis Ectatomma ruidum au cours de son evolution, est n e de la rencontre de deux domaines de recherches: l ethologie et les syst` emes multi-agents. Les exp erimentations ont port e notamment sur sa sociogen` ese, cest-` a-dire sur la constitution dune colonie mature ` a partir dune (ou plusieurs) reine(s), sur ladaptation dune colonie a ` son environnement et, en particulier, sur la division des t aches (poly ethisme) et la sp ecialisation des ouvri` eres, et enn sur la polygynie (Drogoul et al. 1992). Il sagissait en particulier de tester une hypoth` ese ethologique concernant laspect distribu e de la prise de d ecision dans une colonie de fourmis. Le comportement des individus sut-il ` a expliquer la g en eration et la stabilit e des formes sociales observ ees (division du travail, poly ethisme d age, dynamique de la fondation de la soci et e, etc.)? Peut-on montrer quune soci et e dagents peut survivre sans faire appel ` a un syst` eme de contr ole centralis e ni ` a une quelconque organisation hi erarchique? Cest pour r epondre ` a ce type de questions que le syst` eme Manta fut r ealis e. Il mit en evidence que lorganisation du travail dans une colonie de fourmis peut r esulter dun ensemble dinteractions et de contr oles locaux, sans quil soit n ecessaire de faire intervenir une quelconque entit e centrale de r egulation, les performances adaptatives de la soci et e etant le r esultat des comportements, forc ement el ementaires, de chacun de ses membres. Dans un syst` eme de simulation multi-agent tel que Manta, il sagit de mod eliser les di erentes entit es qui interviennent dans un nid de fourmis sous formes dagents r eactifs sans faire appel ` a une organisation pr ed enie ni ` a des sp ecialisation pr e etablies. On ne pr esentera ici que quelques-uns des traits saillants de cette etude. Le lecteur int eress e pourra se r ef erer ` a (Drogoul 1993) qui pr esente la probl ematique, le syst` eme et les exp eriences avec toute la pr ecision n ecessaire.
7.6.2
Larchitecture du syst` eme
Les agents Une colonie de fourmis peut etre divis ee en trois groupes dagents: le groupe des assist es qui comprend les ufs, les larves et les cocons, celui des assistants qui inclut la reine, les ouvri` eres et les m ales, et celui des divers qui regroupe toutes les autres entit es actives du nid, avec en particulier la nourriture, les cadavres de fourmis ainsi que les sources de lumi` ere et dhumidit e. Lenvironnement de Manta
392
est directement accessible ` a l ecran et repr esente un nid de fourmis semblable ` a ceux qui sont quotidiennement employ es dans des laboratoires. La gure 7.32 montre l ecran servant ` a la d enition du nid et ` a lobservation directe du comportement de la fourmili` ere. Les boutons de contr ole sur la droite permettent de modier la topologie du nid, de rajouter des fourmis ou dautres agents, et de modier ou dinspecter l etat de lenvironnement et des agents qui y circulent ` a tout instant. Chaque agent est
Figure 7.32: Un nid de fourmis tel quil est visualis e par Manta (dapr` es (Drogoul 1993)) repr esent e sous la forme dun petit automate qui poss` ede la capacit e de choisir parmi un ensemble de t aches en comp etition, chaque t ache sexprimant sous la forme dune s equence de primitives de comportement, cest-` a-dire dune suite dactions atomiques ex ecutables par lagent. A chaque stimulus de lenvironnement est associ e une t ache et une seule, et un agent ne per coit que les stimuli associ es ` a ses propres t aches. Les stimuli sont caract eris es par leur intensit e, cest-` a-dire par le niveau du signal correspondant au stimulus ` a la position o` u se trouve lagent. Dun point de vue ethologique, les t aches repr esentent des cha nes daction g ees (xed action patterns). Chaque t ache est caract eris ee par le stimulus permettant de la s electionner, par son poids qui pr ecise limportance relative de la t ache par rapport aux autres, par son seuil de d eclenchement et son niveau dactivit e. Le niveau dactivit e est donn e par la formule: ai (t) = wi (t) xi (t) n j =1 wj (t)
o` u wi est le poids de la t ache, xi est lintensit e du stimulus d eclencheur. Pour quune nouvelle t ache soit s electionn ee, il faut que son niveau dactivit e soit sup erieur au
393
seuil de d eclenchement de la t ache et au niveau dactivit e de la t ache courante, cesta-dire que ai (t) > i et ai (t) > ac (t) o` ` u i est le seuil de d eclenchement et ac (t) le niveau dactivit e de la t ache courante. Les t aches sont donc en comp etition: si plusieurs t aches sont s electionnables, le contr oleur choisit celle dont le niveau dactivation est le plus grand. La gure 7.33 montre larchitecture g en erale dun tel agent. Cest le m ecanisme que nous avions d ecrit au chapitre 3 sur les architectures ` a base de t aches comp etitives.
Figure 7.33: Architecture g en erale dun agent Manta Lorsquune t ache est s electionn ee, elle devient la t ache courante, elle ex ecute son comportement dactivation et son niveau dactivit e prend la valeur de son niveau dactivation. Au contraire lorsquune t ache est d esactiv ee, elle ex ecute son comportement de d esactivation. Chaque agent dispose dune t ache sp eciale qui est choisie lorsquaucune t ache nest s electionnable et lorsque le niveau dactivit e de la t ache courante devient nul. Cette t ache, appel ee d efaut, sp ecie le comportement par d efaut dun agent lorsque son environnement est peu attractif, cest-` a-dire pauvre en stimuli. Les processus de r etroaction positive Chaque agent voit son comportement renforc e. Le poids de chaque t ache est en eet augment e dune valeur chaque fois quune t ache wi est s electionn ee: wi (t + 1) = wi (t) + si wi est s electionn ee wi (t + 1) = wi (t) sinon Ce m ecanisme de renforcement constitue une v eritable r etroaction positive exprim ee au niveau de chaque agent, en rendant lagent plus sensible aux stimuli de lenvironnement correspondant aux t aches quil a d ej` a ex ecut ees. De ce fait, plus un agent accomplit une t ache, plus il aura tendance ` a laccomplir de nouveau. Lenvironnement et les communications Les communications sont eectu ees par diusion de signaux dans lenvironnement. Chaque agent dispose dun ensemble de signaux quil peut emettre en fonction
394
de son etat interne. Par exemple, une larve qui a faim va propager un signal de LarveAffam ee qui pourra etre per cu par une ouvri` ere et eventuellement d eclencher sa t ache nourrirLarve. Les signaux se propagent dans lenvironnement en perdant de lintensit e avec la distance, comme nous lavons vu ci-dessus. Les processus de r etroaction n egative Les actions des ouvri` eres peuvent etre consid er ees comme des actions de r egulations visant ` a maintenir lhom eostasie du nid. En eet, la plupart dentre elles servent a satisfaire les besoins exprim ` es par des agents tels que les ufs, les larves ou les cocons qui n ecessitent des soins r ep et es et de la nourriture en quantit e (surtout pour les larves). Chaque fois quune ouvri` ere satisfait une demande, la demande diminue et le signal correspondant ` a cette demande est lui aussi diminu e. Prenons un exemple, en produisant le signal LarveAffam ee une larve exprime son besoin de nourriture. Mais si une ouvri` ere parvient eectivement ` a lui fournir de la nourriture (en ex ecutant sa t ache nourrirLarve), alors son besoin de nourriture diminuera et lintensit e du signal LarveAffam ee sera plus faible. De ce fait les actions tendent ` a r eduire lintensit e des demandes et donc ` a r eguler leur niveau.
7.6.3
Les exp erimentations
Lallocation des t aches et la division du travail Dans les premi` eres versions de Manta (Drogoul & Ferber 1994a; Drogoul & Ferber 1994b; Drogoul et al. 1992), laccent fut mis sur les probl` emes de di erenciation sociale en etudiant lapparition dune organisation sociale caract eris ee par une division du travail au sein douvri` eres initialement identiques. Ces exp eriences port` erent sur une population de 30 fourmis, 50 larves, 50 ufs et 50 morceaux de nourriture al eatoirement r eparties dans le nid. Les fourmis nont que 3 t aches possibles: soccuper des ufs, des larves et de la nourriture, en regroupant en tas de la m eme esp` ece ces di erentes entit es. Voici le code correspondant ` a la t ache soinsAuxOeufs qui est d eclench ee lorsquune fourmi per coit le signal Oeuf avec un niveau susant: soinsAuxOeufs suivreGradient(Oeuf) si il y a un tas doeuf alors prendre ce tas faire suivreGradient(Oeuf) et fuirGradient(humidit e) d eposer le tas sinon arr^ eter soinsAuxOeufs Dans ce programme, la primitive suivreGradient fait suivre ` a la fourmi le chemin de plus grande pente pour la conduire ` a la source du signal correspondant (ici uf) alors que la primitive fuirGradient travaille dans le sens contraire en faisant en sorte que la fourmi s eloigne le plus possible de la source du signal. Les primitives prendre et d eposer sont utilis ees pour prendre et d eposer quelque chose l` a o` u se trouve lagent. La simulation sarr ete lorsque tous ces el ements sont totalement tri es
395
et quil ne reste plus que trois tas. Bien que cet exemple nait pas pour objectif de simuler un v eritable nid, deux le cons peuvent en etre tir ees: 1. La distribution moyenne du temps de travail global entre les trois t aches correspond bien ` a la r epartition initiale de la quantit e dufs, de larves et de nourriture, ce qui indique que la soci et e globale adapte ses moyens ` a la demande et agit comme un syst` eme de r egulation distribu e. 2. La division du travail qui appara t au sein du nid est caract eris ee par plusieurs groupes fonctionnels (g. 7.34): a) Les nounous des ufs (groupe 1, 8 fourmis) caract eris ees par un haut niveau de soins aux ufs et un faible niveau dinactivit e. b) Les fourmis non sp ecialis ees (groupe 2, 8 fourmis) caract eris ees par un fort degr e dinactivit e, bien quelles contribuent globalement aux autres activit es du nid. c) Les fourmis nourrici` eres (groupe 3, 7 membres) caract eris ees par un haut niveau de traitement de la nourriture. Les membres de ce groupes montrent aussi un fort niveau dinactivit e. d) Les sp ecialistes des larves/inactifs (groupe 4, 3 fourmis) caract eris es par un haut niveau de soin aux larves et aussi un niveau elev e dinactivit e et un tr` es faible niveau de soins aux ufs. e) Enn, les nounous des larves (groupe 5, 4 fourmis) qui pr esentent une grande sp ecialisation dans le soin aux larves et un tr` es faible niveau dactivit e dans les autres domaines. Cette division du travail est evidemment plus simple que celle que lon observe dans un nid r eel, du fait de la simplication du comportement des fourmis. N eanmoins, la structure est tr` es stable au travers de lensemble des exp eriences r ealis ees, ce qui conrme le fonctionnement de la r etroaction n egative dont nous avons parl e plus haut: les demandes provenant des ufs et des larves en particulier sont diminu ees par le travail accompli par les ouvri` eres dans ce petit march e du travail que repr esente un nid de fourmis. Sociogen` ese La sociogen` ese est le processus fondateur par lequel un simple individu (une reine) evolue vers une soci et e compl` ete en produisant de nouveaux individus (ufs, larves, cocons et ouvri` eres), en allant chercher de la nourriture et en soccupant du couvain. Drogoul, Corbara et Fresneau (Corbara et al. 1993; Drogoul et al. 1993) ont montr e quil etait possible de reproduire articiellement les conditions de r eelles sociogen` eses telles quelles ont pu etre etudi ees en laboratoire avec des fourmis Ectatomma ruidum. Une quantit e variable de nourriture, qui d epend de la taille de la colonie, est fournie chaque jour ` a lentr ee du nid. Chaque fourmi (dont la reine) peut accomplir une vingtaine de t aches environ.
396
Figure 7.34: Sociogramme dun nid de fourmis, montrant la di erenciation comportementale des fourmis. Les lignes donnent les t aches eectu ees et les colonnes indiquent le temps (en pourcentage) pass e par les di erents groupes de fourmis ` a accomplir ces t aches (dapr` es (Drogoul et al. 1992)). Une exp erimentation commence en pla cant une reine seule dans un nid vide et en laissant le syst` eme evoluer par lui-m eme. Elle sarr ete lorsque lune des conditions suivantes est v eri ee: la reine meurt de faim, ce qui signie la n de la colonie, ou la population du nid d epasse 20 ouvri` eres ou plus, ce qui indique que le processus de sociogen` ese a et e men e ` a bien. Environ 78% des sociogen` eses echouent, ce qui est assez proche des r esultats r eels o` u environ 86% de colonies natteignent jamais l etape des 10 travailleuses. De plus, la dynamique dune soci et e articielle est tr` es semblable ` a celle que lon observe dans la r ealit e. La gure 7.35 montre le processus de sociogen` ese dune v eritable colonie caract eris ee par un fort d ecalage entre la population des ufs et celle des larves. Bien que les courbes dune colonie simul ee soit plus r eguli` eres (g. 7.36), elles montrent une grande similarit e avec la pr ec edente. Ces exp erimentations ont pu montrer en premier lieu que la dynamique dune soci et e simul ee correspond assez bien ` a celle que lon observe dans la r ealit e et montre quil est possible de faire evoluer et de stabiliser lorganisation sociale dune soci et e dagents r eactifs ` a partir de comportements simples ne comprenant quun petit nombre de primitives. Il est ainsi possible de se passer dun contr ole centralis e pour r eguler lactivit e et l evolution dune soci et e dagents autonomes. Ce type de r egulation des naissances emerge uniquement des interactions locales entre les agents et est conditionn e uniquement par les contraintes environnementales auxquelles sont soumis les agents, telles que la restriction de nourriture. En second lieu, cela a permis de corroborer lanalyse th eorique correspondant au m ecanisme de la double r etroaction: une r etroaction positive qui agit au niveau des agents et provoque une di erenciation comportementale et une r etroaction n egative qui agit globalement par un m ecanisme dore et de demande semblable ` a celui dun
397
Figure 7.35: L evolution du couvain dans une colonie naturelle (dapr` es (Corbara 1991))
Figure 7.36: L evolution dune colonie simul ee (dapr` es (Drogoul 1993)) march e. Enn, la composante spatiale ne doit pas etre n eglig ee. Elle est en grande partie responsable du succ` es et de la stabilisation de la soci et e et agit comme un coecient damortissement dans la dynamique globale de la soci et e.
7.6.4
Des fourmis aux robots fourmis
Des robots r eactifs peuvent faire preuve dune grande souplesse dans l elaboration de t aches complexes et montrer des comportements collectifs emergents relativement spectaculaires ` a partir de quelques principes el ementaires. Mais peut-on les utiliser eectivement dans la r ealisation de t aches utiles pour l etre humain? Cest ` a cette t ache que sest consacr ee Lynne Parker (Parker 1994). A partir des travaux de R. Brooks sur larchitecture de subsomption, elle a d evelopp e un syst` eme de robots coop eratifs, Alliance, dont elle a v eri e lint er et ` a la fois sur une simulation et sur de v eritables robots. Dans lun de ses exemples, plusieurs robots doivent nettoyer un terrain vague en le d ebarrassant de ses d echets, sachant quun ensemble de boites de conserves ont et e d evers ees ` a un endroit du terrain. Dans un autre, ils doivent enlever la poussi` ere de meubles (simul es) et nettoyer le sol.
398
Chaque agent poss` ede une architecture qui semble issue dune combinaison de subsomption et de t aches en comp etitions similaire ` a celle du syst` eme Manta. Comme dans ce dernier, les t aches de haut niveau sont en comp etition et mutuellement incompatibles. Les robots peuvent senvoyer des signaux qui indiquent leur etat et la t ache quils sont en train daccomplir, an eventuellement de ne pas accomplir les t aches eectu ees par les autres. Les t aches sont ensuite d enies sous la forme dune structure de subsomption compos ee dun ensemble de modules connect es par des dispositifs dinhibition. Les t aches sont s electionn ees par ce que L. Parker appelle un syst` eme motivationnel, qui se r esume en fait ` a un syst` eme de d eclenchement par stimuli comme nous lavons vu avec Manta. Elle a dailleurs d evelopp e des m ecanismes dadaptation consistant essentiellement ` a faire varier le seuil de d eclenchement des t aches en fonction des agents, cest-` a-dire ` a reproduire une division du travail semblable ` a celle des fourmis. M eme si ce travail ne semble pas tr` es performant en termes organisationnels par rapport ` a ladaptation sociale obtenue avec Manta, il faut reconna tre que lutilisation de v eritables robots entra ne une d egradation g en erale des ph enom` enes observ es ` a cause essentiellement des informations erron ees et incompl` etes obtenues par leurs capteurs. Ce travail permet de valider dans un environnement r eel les hypoth` eses que nous avions v eri ees sous la forme de simulations avec Manta, ` a savoir la possibilit e pour un ensemble dagents r eactifs de sorganiser globalement et de se r epartir le travail sans requ erir de coordinateur centralis e.
Chapter 8 Coordination dactions

Lorsque Sigebert, robot r eparateur, re coit de la part du robot foreur Theodoric une demande de r eparation de sa t ete de foreuse, il sait que cela lui prendra du temps et lui demandera beaucoup deorts. En eet, une foreuse, cela ne se change pas comme ca. Il va falloir quil demande ` a un robot de laider ` a porter une foreuse neuve de la soute jusqu` a latelier de r eparation. Mais les robots transporteurs lourds sont tr` es occup es ` a cette heure. Il faudra demander ` a Fr ed egonde, qui organise les tourn ees, de le mettre en liste dattente pour la demande de robots lourds et, en attendant, aller chercher Theodoric pour lamener ` a latelier. Quelques robots sont en train de d em enager une pi` ece qui servait de remise pour un ensemble de petits mat eriels. Mais la porte et le couloir qui permet datteindre cette remise ne sont pas tr` es larges et deux robots ne peuvent se croiser de front. Il faut donc que l equipe sorganise. Pourquoi ne pas faire la cha ne et se passer les objets de robots en robots? Dans ces deux cas, issus du m eme contexte, la gestion des t aches est probl ematique. Dans le premier cas, il faut g erer les tourn ees et les listes dattente des demandes de robots transporteurs lourds. Dans le second, les actions des robots doivent etre coordonn ees pour que les objets soient pass es de main en main sans quils se cassent et sans provoquer dembouteillage. Mais comment? Cest ` a la r esolution de ces probl` emes que ce chapitre est consacr e.
8.1
Quest-ce que la coordination dactions?
Lorsque plusieurs agents travaillent ensemble, il faut g erer un certain nombre de t aches suppl ementaires qui ne sont pas directement productives mais servent a ` am eliorer laccomplissement des activit es qui le sont. Ces t aches suppl ementaires font partie du syst` eme organisationnel, et on les appelle t aches de coordination. Cellesci sont indispensables d` es que lon se trouve en pr esence dun ensemble dagents autonomes qui poursuivent leurs propres buts, la r ealisation de t aches productives entra nant avec elles tout un cort` ege de t aches de coordination sans lesquelles les premi` eres ne peuvent etre accomplies.
400
CHAPTER 8. COORDINATION DACTIONS
8.1.1
D enitions
La coordination dactions a ainsi et e d ecrite par Thomas W. Malone (Malone 1988) comme lensemble des activit es suppl ementaires quil est n ecessaire daccomplir dans un environnement multi-agents et quun seul agent poursuivant les m eme buts 1 naccomplirait pas . Par exemple, dans un a ero-club o` u seuls quelques avions atterrissent par jour, le contr ole de trac est presque inexistant. Au contraire, la eroport Charles de Gaule, o` u un avion d ecolle ou se pose toutes les minutes, le contr ole a erien est une activit e fondamentale assur ee par des techniciens sp ecialement form es pour eviter que les avions nentrent en collision. Lactivit e de coordination devient fondamentale et contraint m eme le probl` eme initial, le transport de passagers, en limitant le nombre dappareils en circulation. Que le trac diminue et toute cette activit e devient inutile. Quil augmente et les probl` emes de coordination deviennent encore plus cruciaux. La coordination des actions, dans le cadre de la coop eration, peut donc etre d enie comme larticulation des actions individuelles accomplies par chacun des agents de mani` ere ` a ce que lensemble aboutisse ` a un tout coh erent et performant. Il sagit ainsi de disposer dans lespace et le temps les comportements des agents de telle mani` ere que laction du groupe soit am elior ee soit par une augmentation des performances, soit par une diminution des conits. La coordination des actions est donc lune des principales m ethodes pour assurer la coop eration entre agents autonomes (cf. chap. 2). Les exemples de coordination dactions sont multiples et se rencontrent dans tous les domaines dactivit es. Deux v ehicules qui se croisent ` a un carrefour doivent adapter leurs actions les uns par rapport aux autres de mani` ere ` a eviter les collisions. Un trap eziste qui doit agripper les poignets de son partenaire ` a la n de son envol doit calculer tr` es pr ecis ement le moment o` u il se lance en lair. Les avions de la patrouille de France lorsquils eectuent des voltiges a eriennes doivent aussi coordonner leurs actions avec une tr` es grande justesse. Des d em enageurs qui d eplacent un piano ou des ouvriers du b atiment qui construisent une maison doivent aussi coordonner leurs actions de mani` ere ` a venir ` a bout de leur t ache. Il en est de m eme des musiciens dans un orchestre de jazz ou de musique de chambre qui doivent faire en sorte que leur di erentes parties se coordonnent les unes aux autres, dans un ordre pr ecis et rigoureux an que le r esultat soit agr eable ` a loreille2 . Enn, des processus informatiques doivent eux aussi synchroniser leurs actions lorsquils acc` edent ` a des ressources communes de mani` ere ` a ce que le syst` eme reste dans un etat coh erent. La coordination dactions est n ecessaire pour quatre raisons principales: 1. Les agents ont besoin dinformations et de r esultats que seuls dautres agents peuvent fournir. Par exemple, un agent qui construit des murs aura besoin d etre approvisionn e en briques, un agent qui surveille lactivit e dun proc ed e
1 T. Malone place dans les t aches de coordination toutes les t aches non productives et donc aussi celles que nous avons li ees ` a la notion de collaboration, en particulier ` a lallocation de t aches (cf. chap. 7) 2 Linterpr etation dun morceau de musique, en particulier quand il sagit dimproviser sur un th` eme, met dailleurs en uvre les quatre formes de coordination qui sont examin ees plus loin.
8.1. QUEST-CE QUE LA COORDINATION DACTIONS?
401
industriel en un point donn e aura besoin dinformations sur l etat de ce proc ed e en dautres endroits. Un agent logiciel qui apporte de la valeur ajout ee ` a un r eseau de communication, tel quun service dagence de voyage par exemple, n ecessite les services dautres agents, comme ceux de r eservation de chambres et de places davions. 2. Les ressources sont limit ees. On ne fait parfois attention aux actions des autres que parce que les ressources dont on dispose sont r eduites et quon se retrouve ` a plusieurs ` a les utiliser. Quil sagisse de temps, despace, d energie, dargent ou doutils, les actions pour etre accomplies ont besoin de ressources qui nexistent pas en quantit e innie (cest parce que lespace est limit e que des v ehicules sont oblig es de se coordonner pour s eviter). Et la coordination est dautant plus importante que les ressources sont faibles (pour des d em enageurs, plus les objets ` a d eplacer sont lourds et encombrants, plus ils doivent faire attention en accordant leur conduite). Il faut donc partager ces ressources de mani` ere a optimiser les actions ` ` a eectuer ( eliminer les actions inutiles, am eliorer le temps de r eponse, diminuer les co uts, etc.) tout en essayant d eviter les conits eventuels (conits dacc` es, collisions, actions contradictoires, etc.). 3. On cherche ` a optimiser les co uts. Coordonner des actions permet aussi de diminuer les co uts en eliminant les actions inutiles et en evitant les redondances daction. Par exemple, si Sigebert re coit deux demandes di erentes pour aller chercher des pi` eces d etach ees, il sera plus rentable de combiner ces demandes et de ne faire quun voyage pour aller chercher ces pi` eces. De m eme, si deux personnes doivent se rendre au m eme endroit, elles pourront nutiliser quune voiture et economiser ainsi lessence correspondant ` a un trajet suppl ementaire. 4. On veut permettre ` a des agents ayant des objectifs distincts mais d ependants les uns des autres de satisfaire ces objectifs et daccomplir leur travail en tirant eventuellement parti de cette d ependance. La gure 8.1 illustre cette situation dans le monde des cubes. Deux agents doivent transformer un empilement de cubes en un autre en ne d epla cant ` a chaque fois quun seul cube. Plusieurs cas peuvent se pr esenter: a) Si les objectifs sont compatibles et si les empilements initiaux et naux sont totalement ind ependant (g. 8.1.a), on se trouve dans une situation neutre ou dind ependance (cf. chap. 2), les deux agents ayant la possibilit e daccomplir leurs actions de mani` ere totalement autonome. a) Si les objectifs sont compatibles mais les cubes plac es de telle fa con que les agents aient ` a tenir compte de leurs actions r eciproques. Dans ce cas, les agents doivent eviter de se g ener et si possible saider mutuellement pour que chacun satisfasse ses buts (g. 8.1.b). Il sagit alors dune situation de coop eration, que nous avons appel ee collaboration coordonn ee, n ecessitant une coordination des actions. a) Si, enn, les objectifs sont incompatibles, cest-` a-dire que les buts de lun viennent en contradiction avec ceux de lautre (g. 8.1.c), alors soit on
402
CHAPTER 8. COORDINATION DACTIONS estime que le syst` eme est incoh erent, soit on se situe dans le cadre dune situation de comp etition (cf. chap. 2).
Dans ce chapitre, nous ne nous int eresserons quaux situations de coop eration n ecessitant une coordination daction, laissant de c ot e les situations neutres, du fait quelles ne posent aucun probl` eme, et les situations de comp etition qui n ecessiteraient une etude dun autre ordre.
C E D
F B A
(a) Situation neutre
C A B
F E D
E D C
B A F
(b) Situation de coopration avec coordination d'actions
C A D
B D C
(c) Situation de comptition
Figure 8.1: Quelques situations dinteraction. Seule la situation (b) est ` a la fois coop erative et n ecessite une coordination des actions des deux agents.
8.1.2
La coordination comme r esolution de probl` eme
Le probl` eme de la coordination daction soul` eve plusieurs questions. Elles portent sur les agents avec lesquels un agent doit coordonner ses actions, sur le moment et le lieu daccomplissement de ces actions coordinatrices, sur la d etection des conits ou synergies eventuelles et enn sur la mani` ere deectuer cette coordination.
8.1. QUEST-CE QUE LA COORDINATION DACTIONS? Avec qui coordonner ses actions?
403
La premi` ere dicult e consiste ` a d eterminer avec qui un agent doit coordonner ses actions. Dans certains cas la r eponse est simple. Par exemple, dans le contr ole a erien, un appareil qui se rend dun point ` a un autre doit tenir compte des actions de tous les avions qui trouvent trop pr` es de lui et avec lesquels il risque dentrer en collision. Identier ces agents revient alors ` a d eterminer tous ceux qui se trouvent ` a proximit e, cest-` a-dire ` a percevoir les appareils qui se situent au voisinage de lavion et ` a etablir leur position et leur vitesse avec pr ecision. Le cas du trac a erien nest pas unique. Au contraire il sagit dune situation typique que lon retrouve avec tous les robots mobiles en g en eral et dans les syst` emes anti-collision en particulier. La coordination repose alors sur la relation que les agents entretiennent avec lespace et notamment sur la perception de leurs distances et vitesses relatives. N eanmoins, la d enition des agents avec lesquels on doit se coordonner est souvent donn ee par le probl` eme lui-m eme. Par exemple, deux d em enageurs, qui doivent synchroniser leurs gestes pour eviter de faire tomber les meubles quils portent, nont pas ` a se poser la question de savoir avec qui ils doivent coordonner leurs action, car cest de toute evidence avec lautre porteur. Les d ependances mutuelles entre actions Percevoir et d eterminer les agents avec lesquels on doit coordonner ses actions ne sut pas. Il faut pouvoir aussi g erer les interd ependances qui existent entre les actions dun ensemble dagents. Trois agents doivent tenir compte de contraintes et de d ependances mutuelles que deux agents peuvent ignorer. Par exemple, si trois agents A1 , A2 et A3 doivent coordonner leurs actions, cela signie non seulement que A1 doit organiser ses mouvements avec A2 mais quil doit aussi les coordonner avec A3 , qui lui-m eme doit tenir compte du comportement de A2 . Par exemple, supposons que trois bateaux doivent se croiser en mer, comme le montre la gure 8.2. Si le bateau A1 ne prend en compte que le bateau A2 , il peut aller sur sa droite, mais se faisant il risque dentrer en collision avec le bateau A3 . Or A3 ne peut pas changer sa route pour eviter A1 sous peine de s echouer sur la petite le. De ce fait, il lui faut tenir son cap, et cest ` a A2 et A1 de l eviter.
Figure 8.2: Evitement de collision entre bateaux Dune mani` ere g en erale, sil existe une action coordonn ee, toute action dun agent
404
Ai d epend des actions de tous les autres agents {A1 , .., An }, sachant que leurs actions d ependent elles aussi des actions de tous les autres agents. Il est alors possible de consid erer que coordonner les actions dun ensemble dagents revient ` a r esoudre le syst` eme ` a n- equations et n-inconnues suivant: 1 (t + 1) = 1 (React(Exec(o1 (t)||..||on (t)))) ... n (t + 1) = n (React(Exec(o1 (t)||..||on (t)))) o` u oi (t) repr esente lop eration que lagent Ai ex ecute au temps t, et les 1 , .., n les d ependances entre les actions des agents. Ce syst` eme peut encore sexprimer par la simple equation: O(t + 1) = (React(Exec(O(t)))) o` u O(t) repr esente le vecteur < o1 (t), .., on (t) > des op erations choisies par les agents < A1 , .., An > ` a linstant t, et repr esente le vecteur des fonctions de d ependances. R esoudre cette equation, revient donc ` a d eterminer lensemble des fonctions comportementales (la suite des choix des op erations ` a appliquer) qui sont des solutions de cette equation. La dicult e r eside dans le fait que lon ne sait pas r esoudre ces equations dans le cas g en eral et donc que, sauf dans des cas particuliers (et notamment ceux mettant en jeu des agents mobiles, et dans lesquelles les actions sont des d eplacements dans un espace euclidien), il faut sen remettre ` a des techniques heuristiques. Une th eorie de la coordination reste donc ` a faire3 . Celle-ci pourra se faire sur lid ee que les comportements sont contraints et, lheuristique g en erale pourrait etre de ne modier que les comportements les moins contraints. Cest dailleurs ce que nous avons expliqu e avec lexemple de la gure 8.2. Lorsquil y a un conit d u ` a une limitation des ressources, on modie le moins possible le comportement des agents les plus contraints et au contraire on demande aux agents les moins contraints de tenir compte des actions des autres agents et dagir en cons equence. Relations entre actions Lorsque les agents accomplissent leurs actions, certaines actions sont particuli` erement sensibles, soit parce que leur ex ecution simultan ee entra ne des conits, soit, contraire, parce quelles conduisent ` a une am elioration des performances. F. von Martial (von Martial 1992) a class e en deux grandes cat egories les relations pouvant exister entre les actions lorsquelles sont accomplies simultan ement par plusieurs agents, cest-` a-dire ce que nous avions appel e relations op eratoires au chapitre 3. Les relations n egatives ou conictuelles sont celles qui g enent ou emp echent plusieurs actions de saccomplir simultan ement. Cet aspect n egatif peut evidemment etre d u soit ` a lincompatibilit e des objectifs, soit ` a la limitation des ressources, comme nous lavons vu au chapitre 2. Au contraire, les relations positives, ou synergiques, sont celles qui favorisent les actions en les faisant b en ecier les
3 Lorsque les op erations peuvent se traduire sous la forme de vecteurs (vitesses, acc el eration) dans un espace g eom etrique, K. Zeghal propose des pr emisses de cette th eorie dans (Zeghal 1993).
405
unes des autres et donc tendent ` a une plus grande ecacit e que si les actions etaient r ealis ees de mani` ere ind ependante. La gure 8.3 montre cette classication des relations. La relation d egalit e signie que certaines actions ne sont pas li ees a un agent particulier et peuvent ` etre r ealis ees par un autre agent. La relation de subsomption4 indique que laction a dun agent A fait partie des actions b dun agent B, et donc quen accomplissant b, B r ealise du m eme coup a. La relation de faveur pr ecise quune action, en saccomplissant, favorise la possibilit e daccomplir une autre action.
Incompatibilit des buts
Relations ngatives Conflits de ressources
Resources consommables
Resources non consommables Relation entre actions
Relation dgalit
Relations positives
Relation de faveur
Relation de subsomption
Figure 8.3: Les types de relations entre actions D etecter quune relation existe entre deux actions constitue un enjeu majeur de lorganisation dun ensemble dactions, mais aussi un probl` eme crucial pour lorganisation et lam elioration de la coordination des actions. Parfois, surtout si la coordination dactions est eectu ee de mani` ere centralis ee et sil sagit de formes conictuelles, les relations apparaissent facilement. En revanche, si la coordination est totalement distribu ee, la plupart des relations deviennent dicile ` a reconna tre avant que laction nait eu lieu, et la dicult e de mettre en uvre de v eritables m ethodes de planication distribu ee provient en grande partie de cette peine.
8.1.3
Caract eristiques des syst` emes de coordination
Il existe plusieurs param` etres pour caract eriser les di erentes formes de coordination daction. Alors que Durfee, Lesser et Corkill (Durfee et al. 1989) nen retiennent que trois (la r eactivit e, la pr edictivit e et le nombre de messages communiqu es),
4 Ce terme est malheureux, puisquon parle aussi darchitecture de subsomption (cf. chap. 3). Je lai reproduit n eanmoins tel quel puisquil fait partie du bagage des concepts de von Martial.
406
jen propose ici onze, qui sont class ees en quatre cat egories: les caract eristiques temporelles, organisationnelles, de r ealisation et de g en eralisation. Leur etude assure une meilleure compr ehension de lint er et de tel ou tel mode de coordination. A. Caract eristiques temporelles La rapidit e, ladaptabilit e et la pr edictivit e caract erisent le rapport du syst` eme de coordination avec le temps. A.1. La rapidit e porte sur la capacit e dun syst` eme ` a agir plus ou moins promptement ` a un ev enement, que cet ev enement soit pr evu ou impr evu. Moins un syst` eme raisonne, plus il est c abl e et plus il est rapide. Le temps de r eaction dun syst` eme d epend evidemment de la complexit e du calcul, mais aussi dautres param` etres tels que le nombre dagents, le nombre de t aches, etc. A.2. Ladaptabilit e concerne la capacit e du syst` eme ` a prendre en compte des ev enements inattendus. Plus un syst` eme est adaptable, plus il peut r eagir ` a des ev enements ou des situations non pr evues, et donc plus il pourra etre mis en uvre dans des contextes evolutifs. A linverse les syst` emes moins adaptables sont souvent plus ecaces dans des contextes dans lesquels toutes les donn ees sont connues ` a lavance. A.3. La pr edictivit e se rapporte ` a la facult e danticiper sur lavenir, cest-` a-dire a d ` eterminer avec plus ou moins de pr ecision l etat du monde et des autres agents dans le futur. Plus un syst` eme est pr edictif, moins il a tendance ` a etre rapide et adaptable. Les syst` emes pr edictifs sont particuli` erement ecaces dans des contextes o` u lon a beaucoup dinformations sur les ev enements futurs et sur la mani` ere dont il faudra les prendre en charge. Inversement, les syst` emes peu pr edictifs sav` erent plus int eressants dans des contextes qui evoluent tr` es vite ou lorsquon dispose de peu dinformations sur ce qui va se passer. Essentiellement, on distingue les modes anticipatifs, qui cherchent a d ` eterminer la mani` ere dont les actions doivent etre coordonn ees avant de les ex ecuter (planication), et les modes r eactifs qui d eterminent lordre et la mani` ere dagir au moment m eme o` u les actions sont ex ecut ees (coordination r eactive, synchronisation). Evidemment, ces modes ne sont que des extr emes et toutes les hybridations interm ediaires sont possibles. B. Caract eristiques organisationnelles Ces caract eristiques portent sur la mani` ere dont est organis ee la coordination dactions et sur sa centralisation. B.1. La structure organisationnelle peut etre d ecrite le long dun axe de centralisation/distribution, les organisations les plus centralis ees etant g en eralement les plus simples ` a mettre en uvre et les plus coh erentes, les organisations distribu ees pouvant plus facilement sadapter aux modications impr evues de lenvironnement et en particulier aux dysfonctionnements eventuels de certains
407
agents. On retrouve ici les caract eristiques organisationnelles que nous avions d evelopp ees au chapitre 3. B.2. Le mode de communication d enit la mani` ere dont les agents prennent connaissance des actions des autres agents. Si les agents sont situ es dans un environnement, ils pourront percevoir les actions des autres agents, soit directement en identiant leur comportement, soit indirectement par linterm ediaire de traces et de propagation de signaux. Puisque toute coordination passe n ecessairement par des communications, il est certain que les modes de communication jouent un r ole d eterminant dans la mani` ere de faire interagir des agents entre eux et, comme dhabitude, nous retrouverons limportance de la dichotomie cognitif/r eactif dans les communications et donc dans la mani` ere de coordonner les actions. B.3. La libert e de manuvre laiss ee ` a un agent caract erise le degr e dind ependance du comportement dun agent vis-` a-vis des consignes quil peut recevoir dun coordinateur ou ` a l egard du protocole de coordination. Plus les agents sont libres dagir comme bon leur semble, plus ils peuvent sadapter ` a des circonstances particuli` eres mais aussi plus ils sont ` a m eme de cr eer des pi` eges, cest-` a-dire des situations bloqu ees localement, et dont il sav` ere souvent dicile de sortir (cf. les caract eristiques de qualit e). C. Caract eristiques de qualit e et decacit e La qualit e et lecacit e des r esultats obtenus sont certainement les deux principales propri et es que lon attend dune m ethode de coordination. C.1. La qualit e de la coordination est evidemment lenjeu principal dun syst` eme de coordination. Les comportements sont-ils optimaux ou simplement corrects? Utilisent-ils au mieux les ressources disponibles? Sont-ils capables de trouver des synergies ou bien s epuisent-ils dans des actions inutiles et redondantes? On peut aussi se demander si les techniques de coordination d egradent ou am eliorent les performances du syst` eme. Par exemple, en quoi les feux de signalisation, n ecessaires pour r egler le trac et eviter les collisions entre voitures, modient-ils la circulation? Am eliorent-ils le trac ou, au contraire, sont-ils perturbateurs et cr eateurs de bouchons? C.2. Evitement de conits. La qualit e dune m ethode de coordination porte aussi sur sa capacit e` a eviter et ` a sortir des conits eventuels. Certaines techniques ont malheureusement linconv enient de tomber parfois dans des pi` eges, cesta-dire des situations dans lesquels les agents ont bien du mal ` ` a se sortir par eux-m emes. Par exemple, un bouchon de voitures ` a un carrefour peut devenir si dense quil devient quasiment impossible de l eliminer. Il sagit dun pi` ege correspondant ` a une etreinte fatale (dead-lock), chaque v ehicule ayant besoin que lautre bouge pour pouvoir se d egager. Il est donc pr ef erable d eviter autant que possible ces situations en utilisant des techniques appropri ees. Par exemple, la priorit e` a droite lorsque lon circule ` a droite favorise lapparition
408
CHAPTER 8. COORDINATION DACTIONS de ces etreintes fatales, alors que la priorit e` a gauche permettrait d eliminer un grand nombre de ces pi` eges n efastes.
C.3. Nombre dagents. La qualit e dune technique de coordination se mesure aussi au nombre dagents que lon est capable de coordonner ensemble. Certaines ne permettent pas de d epasser quelques unit es alors que dautres peuvent ais ement ordonner les actions de plusieurs centaines dagents. D. Caract eristiques de r ealisation Ces caract eristiques se rapportent aux moyens n ecessaires ` a la r ealisation dun syst` eme de coordination. D.1. Degr e et quantit e dinformations. Cette caract eristique concerne la quantit e dinformations que les agents doivent echanger pour coordonner leurs actions. Ces echanges peuvent se faire ` a deux moments di erents, soit dans l elaboration pr ealable des plans daction, si les agents sont capables demployer des techniques anticipatrices, soit au cours de lex ecution. On privil egie g en eralement les modes de coordination permettant de diminuer le nombre de communications n ecessaires pour eviter leur possible engorgement. D.2. Le degr e de repr esentation mutuelle requis est lui aussi un crit` ere de performances. En eet, plus il est n ecessaire davoir des informations sur le monde et sur autrui, plus il en co ute pour mettre ` a jour cette connaissance et plus il est donc dicile quelle soit en ad equation avec l etat de lenvironnement et celui des autres agents. Inversement, plus on dispose dinformations sur les autres plus on est ` a m eme de pr evoir l evolution du syst` eme et donc de r epondre de mani` ere adapt ee aux actions des di erents agents. D.3. La dicult e de mise en uvre. Certaines techniques supposent lexistence de m ecanismes complexes et sont diciles ` a programmer et ` a mettre au point. Dautres au contraire sav` erent tr` es simples. Toutes choses egales par ailleurs, il est toujours pr ef erable de sen tenir aux m ethodes les plus simples, ne serait-ce que pour des raisons de facilit e de conception, de r ealisation et de maintenance. E. Caract eristiques de g en eralisation Celles-ci indiquent dans quelle mesure une m ethode de coordination est g en erale, en autorisant une certaine h et erog en eit e des agents ou en sappliquant ` a di erents domaines. E.1. Lh et erog en eit e de lapproche, cest-` a-dire laptitude ` a d enir des syst` emes de coordination qui sachent prendre en compte des agents qui di` erent par leurs capacit es de perception, de raisonnement et de communication, et donc de pouvoir interconnecter des agents qui ne disposent pas des m emes m ecanismes de coordination.
409
E.2. La g en eralit e de la m ethode. Certaines techniques sont souvent plus adapt ees a ` certains domaines (par exemple la coordination de d eplacements de v ehicules autonomes) que dautres. Sil est pr ef erable de disposer de m ethodes g en erales qui peuvent sadapter ` a nimporte quel domaine, il faut savoir que g en eralement plus une m ethode est g en erale moins elle a tendance ` a etre ecace. Evidemment, ces crit` eres ne sont pas totalement ind ependants. Un syst` eme tr` es rapide et capable de faire face ` a nimporte quelle situation ne permettra g en eralement pas de donner de bonnes pr evisions ` a long ou moyen terme. De m eme, des m ethodes r eclamant une forte communication entre les agents et des capacit es de repr esentation mutuelle auront du mal ` a prendre en compte des agents fortement h et erog` enes.
8.1.4
Formes de coordination daction
A partir des crit` eres pr ec edents, il est possible de d egager quatre formes principales de coordination dactions, chacune pouvant donner lieu ` a plusieurs variantes (cf. tableau 8.1): 1. Coordination par synchronisation. Il sagit l` a de la forme la plus el ementaire et bas niveau de la coordination. Toute coordination daction doit d ecrire pr ecis ement lencha nement des actions, ce qui induit une n ecessaire synchronisation de leur ex ecution. On parle g en eralement de synchronisation lorsquil sagit de g erer la simultan eit e de plusieurs actions et de v erier que le r esultat des op erations soit coh erent. Les principaux probl` emes et algorithmes de synchronisation sont issus des syst` emes distribu es et sont utilis es tels quels dans le contexte des syst` emes multi-agents. Nous nen parlerons donc que tr` es peu. 2. Coordination par planication. Cette technique, qui est la plus traditionnelle en IA, repose sur un d ecoupage de laction en deux phases: Dans la premi` ere, on r e echit sur lensemble des actions ` a eectuer pour atteindre un but en produisant un ensemble de plans. Dans la seconde, on choisit lun de ces plans que lon ex ecute. Du fait que lenvironnement peut evoluer, les plans peuvent etre amen es ` a etre r evis es au cours de leur ex ecution, ce qui n ecessite alors des possibilit es de replanication dynamique. De plus, dans les syst` emes multiagents, les di erents plans elabor es par les agents peuvent entra ner des conits dobjectifs ou dacc` es ` a des ressources. Il faut alors coordonner les plans de mani` ere ` a r esoudre ces conits et satisfaire ainsi les buts des di erents agents. Dune mani` ere g en erale les techniques de planication assurent une bonne qualit e de coordination, mais se r ev` elent incapables de prendre en compte des situations impr evues ou trop complexes. 3. Coordination r eactive. Cette technique, qui est plus r ecente, consid` ere quil est souvent plus facile de mettre en uvre des m ecanismes de coordination fond es sur des agents r eactifs que de planier lensemble des actions et de leurs interactions avant dagir. Dune mani` ere g en erale ces techniques font surtout appel
410
Synchro. Rapidit Adaptabilit Prdictivit Centralisation/ distribution Mode de communication Libert de manoeuvre Qualit de la coordination Evitement de conits Nombre d'agents Quantit d'changes Reprsentations mutuelles Difcult de mise en oeuvre Htrognit Gnralisation trs bonne trs faible faible indiffrent messages trs faible assez bonne bon grand moyenne faible moyenne faible faible

Planication faible faible trs bonne indiffrent messages faible trs bonne bon faible lev lev leve trs faible moyenne Ractive trs bonne trs bonne faible indiffrent stimuli/ marques grande assez bonne faible trs grand faible faible faible leve moyenne Rglement. bonne bonne moyenne centralis indiffrent assez faible assez bonne bon grand faible faible moyenne moyenne moyenne
Table 8.1: Valeurs des param` etres en fonction des formes de coordination ` la liaison perception-action dun agent, cest-` a a-dire quelles saccomplissent in situ, et non a priori comme les pr ec edentes. On peut di erencier plusieurs m ethodes de coordination r eactive qui di` erent par leur usage de champs ou de routines (r eexes), par leur usage ou non de repr esentations limit ees des autres et par lemploi ou non de contraintes et de d ependances. Les approches tr` es r eactives nassurent pas n ecessairement une tr` es grande optimisation de lensemble des r esultats mais sont capables dintervenir dans des contextes evolutifs et dune mani` ere g en erale dans des situations o` u il est difcile danticiper ce qui va se passer. 4. Coordination par r eglementation. Il sagit dune m ethode rarement d ecrite dans la litt erature, mais souvent mise en pratique dans les syst` emes n ecessitant une coordination limit ee. Le principe est de donner des r` egles de comportement qui visent ` a eliminer les conits possibles. Par exemple, on attribuera des r` egles de priorit es ` a des v ehicules ` a un croisement de mani` ere ` a eviter le conit. Cette technique est evidemment inspir ee du code de la route et dune mani` ere
8.2. SYNCHRONISATION DACTIONS
411
g en erale de toutes les r eglementations utilis ees pour d enir ce quest un bon comportement et eviter les conits autant que possible.
8.2
Synchronisation dactions
Synchroniser plusieurs actions, cest d enir la fa con dont sencha nent les actions de mani` ere ` a ce que leur d eroulement dans le temps concorde et quelles puissent etre accomplies juste au bon moment. On parle aussi de synchronisation si lobjectif est dassurer une certaine coh erence dans le syst` eme et demp echer que le r esultat des actions des uns ne viennent perturber celles des autres. Le probl` eme de la synchronisation dactions a surtout et e etudi ee dans le domaine des automatismes industriels ou celui des syst` emes dexploitation r epartis. La synchronisation constitue le bas niveau de la coordination daction, lendroit o` u sont impl ement es les m ecanismes de base permettant aux di erentes actions de sarticuler correctement.
8.2.1
Synchronisation de mouvements
D` es que plusieurs el ements doivent se mouvoir ensemble, il est n ecessaire de synchroniser leur d eplacement. Par exemple, un cycliste doit faire attention que lorsque sa jambe droite appuie sur la p edale de droite, la gauche se rel ache et vice-versa. La coordination est alors aaire de rythme et de positionnement dans le temps des actions en fonction des ev enements. Si lon consid` ere chacune des jambes du cycliste comme un agent, il faut donc synchroniser la pouss ee de chaque jambe de mani` ere a ` ce quelle ne puisse seectuer que si la p edale correspondante se trouve en position haute. De nombreux formalismes ont et e d evelopp es pour d ecrire et r esoudre les probl` emes de synchronisation, mais les plus connus et les plus employ es sont issus des r eseaux de Petri (cf. chap. 4). Par exemple, la synchronisation des jambes du cycliste sexpriment tr` es simplement sous la forme dun tel r eseau (g. 8.4). Chaque jambe est repr esent ee sous la forme dune place et dune transition, la place repr esentant la jambe dans l etat haut, et la transition correspondant ` a laction dappuyer sur la p edale. A l etat initial on suppose quune seule des places est marqu ee.
Agent pdale gauche Agent pdale droite
Pdale gauche en haut
pdale droite en haut
appuyer sur pdale gauche
appuyer sur pdale droite
Figure 8.4: Synchronisation des actions des deux jambes dun cycliste
412
8.2.2
Synchronisation dacc` es ` a une ressource
Lorsque plusieurs agents doivent partager une ressource, ils doivent synchroniser leurs actions et eviter ainsi que leurs actions deviennent incoh erentes. Supposons, comme dans (George 1983) que deux robots, Clotaire et Chilp eric, aient ` a utiliser la m eme machine pour construire le premier des ecrous, le second des boulons (g. 8.5). Le comportement de Clotaire consiste ` a r ep eter ind eniment la suite des actions
But: faire des boulons
But: faire des crous
Chilpric
Clotaire
Figure 8.5: Clotaire et Chilp eric doivent partager la machine pour faire des ecrous et des boulons. suivantes: Comportement Clotaire Aller jusqu` a la machine Placer un morceau de m etal sur la machine Faire un ecrou Porter l ecrou dans le stock des ecrous Celui de Chilp eric ne di` ere pas beaucoup du pr ec edent: Comportement Chilp eric Aller jusqu` a la machine Placer un morceau de m etal sur la machine Faire un boulon Porter le boulon dans le stock des boulons Les actions de lun peuvent evidemment interf erer avec celles de lautre. Lorsque Clotaire utilise la machine, il ne faut pas que Chilp eric vienne toucher ses boutons et d er egler le travail de lautre robot. De ce fait, il est n ecessaire dintroduire des m ecanismes de synchronisation qui auront pour but de placer lutilisateur de la machine en section critique et dobliger lautre ` a attendre son tour. Le concept de section critique, et les techniques associ ees, est utilis e par les sp ecialistes de syst` emes dexploitation pour indiquer quun processus utilise des ressources et quil ne doit pas etre d erang e pendant son travail. Pour r esoudre ce probl` eme, il faut faire en
8.2. SYNCHRONISATION DACTIONS
413
sorte que chaque robot, tant quil na pas re cu un feu vert pour utiliser la machine, se mette en attente. La gure 8.6 montre une mod elisation de ce syst` eme ` a laide de r eseaux de Petri. Le comportement de chacun des agents est mod elis e sous la forme dune boucle sans n, alors que loccupation de la machine est gur ee sous la forme dune simple place. Lorsquun robot veut travailler sur la machine et que cette derni` ere est disponible, il consomme le jeton et commence ` a travailler. Lorsquil termine la r ealisation de sa pi` ece, il franchit la transition T3 , ce qui redonne le jeton a la place E4 . `
T1
T1
E1 E3 T2
E1 T2 E2 E4 E3
E2 T3
T3
Clotaire T1: aller vers la machine E1: T2: placer un morceau de mtal E2: T3: fin de ralisation de la pice et stockage de la pice E3: E4:
Chilpric en attente de la machine en cours de ralisation de la pice en cours de stockage de la pice machine occupe
Figure 8.6: Mod elisation de la synchronisation des actions de Clotaire et Chilp eric pour faire des ecrous et des boulons
Mais comment impl ementer cette structure sous la forme dagents? La solution la plus simple consiste ` a consid erer la machine comme un agent qui r epond aux demandes des robots et leur indique lorsquils peuvent travailler. Lorsquun robot sapproche de la machine, il envoie une demande dutilisation ` a la machine, laquelle r epond par un acquittement (message Ok), ce qui permet au robot de r ealiser sa pi` ece. Lorsquil a termin e, il envoie un message Fin, qui lib` ere la machine et permet a un autre robot de travailler. La gure 8.7 repr ` esente le comportement des agents Robot et Machine. La solution donn ee dans (George 1983) est un peu di erente, car elle met en uvre des m ecanismes de communication tir es du syst` eme CSP (Hoare 1985) mais qui pr esentent linconv enient de ne pas pouvoir etre g en eralis es ` a plus de deux agents, alors que la solution que nous venons de pr esenter se g en eralise sans aucune dicult e.
414
T1
mahine << demande(X)
demande(X) <X>
E1 E3 T2 E2 T3 machine << fin fin OK X << OK libre
Robot
Machine
Figure 8.7: Description du comportement des agents de type Robot et Machine permettant de synchroniser lacc` es ` a la machine
8.3
Coordination dactions par planication
De loin le plus classique en IAD, la coordination dactions par planication utilise les r esultats de la planication mono-agent, elabor ee dans le cadre de lintelligence articielle, et les etend aux situations dans lesquelles interviennent plusieurs agents. Avant de d ecrire la probl ematique de la planication multi-agent, nous ferons un petit rappel des techniques classiques de planication mono-agent.
8.3.1
Planication multi-agent
Les syst` emes multi-agents nont pas simpli e la probl ematique de la planication, au contraire. Sil est d ej` a dicile pour un agent unique de d eterminer la suite des actions quil doit accomplir, lintroduction dagents suppl ementaires na fait quaggraver les choses. En premier lieu, la multitude ne peut quaggraver le risque de modications non pr evues par le syst` eme de planication, ce qui r eclame une plus grande r eactivit e de lorgane dex ecution et peut n ecessiter de nombreuses replanications. Pour les m emes raisons, linterd ependance entre actions ne peut aller quen sampliant, ce qui augmente les dicult es dobtenir un ordre convenable pour lapplication des op erations, dicult es que nous avons d ej` a d ecrites au chapitre 4. Enn, lintroduction de plusieurs agents qui accomplissent leurs actions en parall` ele contredit lhypoth` ese de s equentialit e dapplication des op erations que lon rencontre avec Strips. Cependant, etre en pr esence dun ensemble dagents favorise lex ecution des actions puisquil nest plus n ecessaire de lin eariser des plans parall` eles, et que les probl` emes de synchronisation trouvent une solution naturelle.
8.3. COORDINATION DACTIONS PAR PLANIFICATION Limite des mod` eles ` a la STRIPS
415
Le choix dune bonne repr esentation dactions qui assure la prise en compte du parall elisme dans lex ecution des actions devient donc encore plus crucial que pour la planication pour agents uniques. Les mod` eles daction ` a la Strips, d ej` a limit es en planication mono-agent, pr esentent de nombreuses dicult es dans le cadre de syst` emes multi-agents, du fait de lex ecution n ecessairement simultan ee des actions des agents et des interactions qui en d ecoulent. De ce fait, les hypoth` eses de Strips, et en particulier celles li ees ` a lintemporalit e des actions et ` a la s equentialit e de lapplication des op erateurs, sont des contraintes excessives lorsquil sagit de faire interagir des agents entre eux. Cependant, du fait de lh eg emonie extr eme des principes daction ` a la Strips en IA et de la dicult e dorir dautres mod` eles dactions puissants avec lesquels il soit possible de construire des plans, nombre dauteurs en intelligence articielle distribu ee continuent dutiliser des op erateurs ` a la Strips pour d ecrire les actions de leurs agents. Tr` es conscient des limites de ce mod` ele, George (George 1984; George 1986) est lun des auteurs qui a le plus contribu e` a essayer dintroduire de nouvelles mani` eres de repr esenter les actions et de les appliquer ` a des univers multi-agents. Cependant, comme nous le verrons, ces extensions ne sont pas elles-m emes sans pr esenter quelques probl` emes. Laction comme processus Nous avons vu au chapitre 4 que lon peut repr esenter les actions sous la forme de processus. Cest ce qua fait George en 1984 en proposant une autre approche de la repr esentation dactions dans un univers multi-agent en partant de cette notion (George 1984). Un processus est une abstraction qui repr esente une action et qui peut elle-m eme se d ecomposer en sous-processus jusqu` a aboutir aux processus atomiques ind ecomposables. Par exemple, pr eparerSpaghettiBolognaise est un processus qui repr esente lensemble des mani` eres particuli` eres pour pr eparer des spaghetti bolognaise. Pour saccomplir, ce processus n ecessite lex ecution de sousprocessus tels que pr eparerSauce et cuireSpaghetti qui peuvent sex ecuter simultan ement. Ce dernier peut sexprimer sous la forme prendreCasserole, remplirCasseroleEau, chaufferCasserole, mettreSpaghettiDansCasserole, retirerSpaghetti. Laction est alors une instanciation particuli` ere du processus qui d ecrit un ordre dex ecution des di erents sous-processus qui le composent. Nous avons vu au m eme chapitre quun processus peut etre d ecrit sous la forme dun automate dont les etats repr esentent les etats dex ecution du processus ` a un instant donn e, et les transitions correspondent au passage dun etat du processus ` a un autre. Chaque nud est etiquet e par lensemble des etats admissibles pour cet etat dex ecution. Les arcs sont etiquet es par les transitions atomiques. Dans ce contexte, un plan est un mot reconnu par lautomate, et lensemble des plans possibles pour ex ecuter le processus correspond ` a lensemble des mots accept es par lautomate. Par exemple, imaginons le monde de la gure 8.8 o` u Clotaire peut etre localis e en cinq endroits di erents. Supposons quil veuille aller en 5 pour r ecup erer loutil. Il peut y aller soit en passant par les pi` eces 2 et 3 ou par 2 et 4. Le mod` ele de processus associ e` a allerPi` ece5 sexprime sous la forme de la gure
416
Outil 4 5
Clotaire 1
Figure 8.8: Le robot Clotaire veut aller en 5. 8.9.

aller(3,5)
aller(2,3) aller(1,2)
{lieu (Clot,1)} {lieu (Clot,2)}
{lieu (Clot,3)}
aller(2,5)
{lieu (Clot,2)}
aller(2,4)
{lieu (Clot,4)}
Figure 8.9: Un plan de Clotaire pour parvenir ` a son but Chaque etat de lautomate repr esente un etat du monde d eni comme un ensemble de formules atomiques, et les transitions correspondent aux actions possibles que peuvent eectuer les agents. Lint er et de cette conception est de pouvoir composer les processus entre eux de mani` ere ` a former des s equences, des it erations et des compositions parall` eles. Par exemple, deux processus P1 et P2 peuvent etre compos es en s equence, ce que lon ecrit P1 ; P2 . Il sut pour cela de calculer lintersection de l etat du monde obtenu en sortie du processus P1 , avec l etat du monde obtenu en entr ee du processus P2 . Lit eration consiste ` a boucler un processus P sur lui-m eme pour construire un nouveau processus P. Il sut ici encore de fusionner l etat initial et l etat nal en calculant lintersection des etats du monde correspondant. La composition parall` ele est particuli` erement int eressante pour les syst` emes multi-agents: pour composer deux processus P1 et P2 de mani` ere concurrente, il sut de cr eer un automate P3 obtenu de telle mani` ere que tout etat de P3 puisse sexprimer comme une combinaison des etats de P1 et P2 . Dans lexemple du robot ci-dessus, supposons que lon veuille ajouter un autre robot, Chilp eric, qui soit initialement dans la pi` ece 3 et qui ait comme but daller dans la pi` ece 5 et de fermer la porte entre les pi` eces 3 et 5. Le fait que Chilp eric puisse fermer la porte r eduit lensemble des possibilit es de Clotaire. En eet, si Chilp eric ferme la porte alors que Clotaire est en 3, ce dernier ne pourra plus passer directement de la pi` ece 3` a la pi` ece 5. Le processus d enissant Chilp eric est d eni ` a la gure 8.10. Malheureusement, si lid ee de composer des automates peut para tre a priori int eressante, elle sav` ere pratiquement inutilisable, du fait que le nombre d etats
8.3. COORDINATION DACTIONS PAR PLANIFICATION

{lieu(Chil,5), ouverte(porte-1)} aller en 3 aller en 5 {lieu(Chil,3), ouverte(porte-1)} aller en 2 aller en 3 {lieu(Chil,5), ouverte(porte-1)} aller en 1 aller en 4 aller en 2 aller en 2 {lieu(Chil,5), ouverte(porte-1)} {lieu(Chil,5), ouverte(porte-1)} aller en 4 aller en 5 {lieu(Chil,5), fermee(porte-1)}
417
fermer la porte
Figure 8.10: Le processus d enissant Chilp eric dun automate P3 r esultant de la composition de deux sous-automates P1 et P2 est egal au produit des etats de ses sous-automates. Ainsi, la composition des mod` eles des deux processus PClotaire et PChilp qui comportent respectivement 6 et 5 e tats eric est un automate qui en comprend 30. De ce fait, la taille des automates r esultant cro t exponentiellement avec le nombre dagents, ce qui impose de s erieuses limites quant ` a lapplicabilit e dun tel syst` eme. Mais lid ee de consid erer laction comme des processus ne doit pas etre n ecessairement abandonn ee pour autant. En utilisant des r eseaux de Petri comme mod` ele de processus, il est possible de les composer sans tomber dans le travers de la croissance exponentielle du nombre d etats. Dans ce cas, le nombre de places dun r eseau compos e est egal ` a la somme des places de chaque sous-r eseau, ce qui nous donne des r eseaux dont la taille est lin eaire en nombre dagents. Pour reprendre notre exemple de robots, on mod elisera non seulement Clotaire et Chilp eric comme des processus, mais aussi la porte qui relie les pi` eces 3 et 5. Les actions des agents sont mod elis ees sous la forme de transitions du r eseau de Petri et les conditions par des places. Ces conditions sont v eri ees sil existe (au moins) une marque dans la place correspondante. Certaines marques sont totalement consomm ees par les actions alors que dautres sont au contraire conserv ees. Les marques consomm ees (et produites) repr esentent les transformations d etat, alors que les marques conserv ees repr esentent des caract eristiques n ecessaires aux actions mais qui nentrent pas dans les transformations. Par exemple, le fait que la porte soit ouverte est evidemment une condition n ecessaire pour que le robot puisse la franchir, et cette condition nest pas modi ee par ce d eplacement. Les situations initiales et nales sont donn ees par des marquages des di erentes places, et planier revient donc ` a d eterminer un ordre de d eclenchement des transitions qui permette de passer dun marquage initial ` a un marquage nal. Bizarrement, il nexiste aucune etude ` a notre connaissance qui ait consid er e la repr esentation par r eseau de Petri comme syst` eme de base danalyse de laction. N eanmoins, nous en reparlerons dans le cadre de la planication multi-agent, car elle permet de pr esenter ais ement les probl` emes qui se posent lors de la coordination daction multi-agents.
418
Modes de planication multi-agent Planier des actions en univers multi-agents peut se d ecomposer en trois etapes distinctes. La construction de plans, la synchronisation/coordination des plans et lex ecution de ces derniers. Comme il est possible dutiliser un ou plusieurs agents a chacune de ces ` etapes, il est possible dobtenir un grand nombre dorganisations di erentes, dont le principe g en eral est donn e` a la gure 8.11. Un syst` eme de planication est alors compos e dun ensemble dagents pouvant planier, synchroniser ou ex ecuter des plans, un m eme agent pouvant accomplir une seule ou plusieurs de ces t aches.
Buts Init Actions
{pi } Planificateur Synchroniseur/ coordinateur
{pj}
Excuteur Excuteur Excuteur
{pi }
Plans possibles
Plans excuter
Figure 8.11: La planication multi-agent peut faire appel ` a plusieurs planicateurs, plusieurs synchroniseurs/coordinateurs et, evidemment, ` a plusieurs ex ecuteurs. En premier lieu, il sagit de construire des plans. Pour cela, on peut faire appel ` un agent unique, et on parle alors de planication centralis a ee ou au contraire distribuer la t ache de planication au sein de chacun des agents, et obtenir alors un syst` eme de planication distribu ee. Dans ce cas, chaque agent construit un sousplan qui satisfait ses buts locaux, sans n ecessairement tenir compte des autres agents. Dans ce cas, ces plans ont de fortes chances de ne pas pouvoir sint egrer facilement les uns avec les autres et il devient alors n ecessaire de les coordonner entre eux. Cette t ache peut etre soit d el egu ee ` a un agent unique qui centralisera tous ces sousplans et essayera de les synth etiser an de d eterminer un plan global, soit laiss ee a linitiative de chacun des agents, en leur demandant de coordonner leurs actions ` entre eux et de r esoudre leurs conits potentiels par des techniques de n egociation. De ce fait, les trois grands modes dorganisation classiques de la planication multi-agent sont: 1. la planication centralis ee pour agents multiples, 2. la coordination centralis ee pour plans partiels, 3. la planication distribu ee.
8.3.2
Planication centralis ee pour agents multiples
La planication centralis ee pour agents multiples suppose quil nexiste quun seul planicateur, cest-` a-dire quun seul agent capable de planier et dorganiser les actions pour lensemble des agents, comme le montre la gure 8.12. Cet agent traite
419
aussi g en eralement de la synchronisation des plans ainsi que de lallocation des t aches aux autres agents dont le r ole se cantonne alors ` a n etre que de simples ex ecutants.
Plan Planificateur Coordinateur Plan Plan Excuteur Plan Excuteur
Excuteur
Excuteur
Figure 8.12: Dans la planication centralis ee pour agents multiples, un agent unique, le planicateur est charg e de produire un plan global dont les actions sont ensuite allou ees aux ex ecuteurs. Les techniques de construction centralis ee de plans pour agents multiples reprennent celles de la planication pour agents uniques et seectuent g en eralement en trois temps: 1. On cherche dabord un plan g en eral partiel, qui puisse sexprimer sous la forme dun graphe acyclique. 2. On d etermine ensuite les branches qui peuvent etre ex ecut ees en parall` ele et on introduit des points de synchronisation chaque fois que deux branches de calcul se rejoignent. 3. Enn, on alloue lex ecution des t aches aux di erents agents concern es. Reprenons le cas des cubes trait e au chapitre 4 dans le cas dagents uniques et essayons de l etendre au cas o` u deux robots peuvent manipuler ces cubes (g. 8.13). Dans le cas dune planication centralis ee, on construit un plan comme sil ny avait quun seul agent, et le r esultat de l etape 1 donne un graphe partiel acyclique qui pr esente deux branches dex ecution parall` eles pour la r ealisation des op erations poserTable(D) et poser(A,D) dune part et poser(B,C) dautre part. Le plan une fois r ealis e, il faut placer des points dex ecution pour emp echer les agents de se trouver en conit et faire en sorte que les actions eectu ees le long dune branche de calcul ne soient ex ecut ees que si les pr ec edentes sont bien termin ees. Par exemple, on peut faire ex ecuter simultan ement poserTable(D) et poser(B,C) puisquil nexiste aucune interf erence possible dans lex ecution de ces actions. Il est alors possible de construire un graphe dex ecution sous la forme dun r eseau de Petri
420
C D A B A D B C
Figure 8.13: Un probl` eme de d eplacement de cubes, mais on cherche ici ` a lex ecuter par deux agents simultan ement.
poserTable(D) poser(A,D)
poser(B,C) poserTable(C)
Figure 8.14: Plan de r esolution dun probl` eme de cube qui montre les points de parall elisation ainsi que ceux de synchronisation n ecessaire (g. 8.14). Le probl` eme de la coordination se r esume alors ` a une simple combinaison de synchronisation et dallocation de t aches. Deux cas limites peuvent se pr esenter. Soit lallocation est g er ee a priori par le planicateur (ou tout autre agent centralisateur) qui pr ecise quel agent doit faire quoi, soit lallocation est g er ee de mani` ere dynamique a chaque nouvelle action. Evidemment, entre ces deux extr ` emes il est possible denvisager toute une gamme de solutions interm ediaires. 1. Gestion dynamique de lallocation. Une gestion dynamique de lallocation peut etre eectu ee par un m ecanisme dappel dore comme nous lavons vu au chapitre pr ec edent. Il est aussi possible de g erer ` a la fois la synchronisation et lallocation de t aches de mani` ere dynamique en consid erant les ex ecuteurs comme des ressources qui sont a priori daccord pour eectuer le travail. Par exemple, le probl` eme de la gestion des cubes peut etre mod elis e par un r eseau de Petri comme le montre la gure 8.15. Par rapport au graphe dex ecution, on ajoute une place suppl ementaire qui repr esente les ressources (cest-` a-dire les pinces en attente) et cette place est reli ee ` a lentr ee et ` a la sortie de chaque action. Cela signie quune fois laction accomplie, la ressource est de nouveau disponible pour une autre action, ce qui r esout el egamment le probl` eme de lallocation de t aches. 2. Gestion statique de lallocation. Dans une gestion statique de lallocation, la r epartition des agents est eectu ee au pr ealable, chacun sachant ce quil doit faire et quand. La coordination se r esume alors ` a une simple synchronisation. La mod elisation par r eseau de Petri est ici aussi encore tr` es simple: il sut de cr eer autant de places quil existe dagents et de relier ces places aux actions associ ees ` a

Pinces
421
poserTable(D) poser(B,C) poserTable(C)
poser(A,D)
Figure 8.15: Ex ecution dun plan avec allocation dynamique chaque agent.
8.3.3
Coordination centralis ee pour plans partiels
Il est possible aussi de ne centraliser que la coordination. Dans ce cas, chaque agent construit ind ependamment son propre plan partiel quil envoie au coordinateur. Ce dernier tente alors de synth etiser tous ces plans partiel en un seul plan global coh erent (g. 8.16). Il sagit alors de d egager les conits potentiels et de les supprimer, soit en ordonnant les actions, soit en d eterminant les points de synchronisation n ecessaires.
But: A
Plan coordonn
But: B
Coordinateur
plan partiel
Planificateur Excuteur
But: C
Planificateur Excuteur Plan coordonn Plan partiel
But: D
Figure 8.16: Dans la coordination centralis ee pour plans partiels, un agent est charg e de la fusion et de la synchronisation des plans partiels construits ind ependamment par les agents.
422
Coordination par fusion de plans partiels La planication multi-agent repose sur une fusion r eussie des plans partiels provenant des divers agents concern es de mani` ere ` a nen faire quun seul qui soit coh erent. Si lon repr esente les plans sous la forme de r eseaux de Petri, fusionner deux plans consiste ` a coller les deux graphes repr esentant les r eseaux en identiant les places semblables. Dans ce cas, plusieurs possibilit es sont oertes selon que les actions des plans sont ind ependantes, positives ou n egatives. Ind ependance des actions Il ny a aucune place commune entre les agents et il est donc impossible de fusionner les deux r eseaux en un seul r eseau connexe. Les plans des agents sont donc ind ependants, et lex ecution des actions des uns et des autres ne sont absolument pas modi ees. Relations positives entre actions Les deux plans comportent des actions qui sont en relation positive (cf. section 8.1.2). Il est alors possible de fusionner les plans pour obtenir un plan unique au moins aussi performant que les deux plans ex ecut es s epar ement. Le probl` eme revient alors simplement ` a synchroniser lex ecution des plans partiels de mani` ere ` a g erer les ressources en conits sans modier les plans eux-m emes. Cela consiste ` a entrecroiser les actions des di erents plans en etablissant lordre dex ecution des actions et en d eterminant les sections o` u il est possible dex ecuter plusieurs actions en parall` eles, cest-` a-dire ` a elaborer un graphe acyclique repr esentant les di erentes actions ` a accomplir.
R1 R2
But R2
E D C
B A F B
But R1
F C A E D
Figure 8.17: Un probl` eme de cubes avec deux agents Supposons par exemple que deux robots aient ` a r ealiser chacun un empilement de cubes ` a partir dun ensemble de cubes communs, comme le montre la gure 8.17, et que chaque agent nait aucune connaissance des buts de lautre. Les buts des robots sont les suivants: Buts R1 = sur(B,Table), sur(A,Table), sur(C,A) Buts R2 = sur(D,Table), sur(E,D), sur(F,E)
423
Si chaque robot dispose dun planicateur qui lui est propre, il peut construire son propre plan sans tenir compte de lautre. De ce fait, les plans obtenus par R1 et R2 peuvent prendre les forme des plans (partiellement ordonn es) P1 et P2 de la gure 8.18.
poserTable(B) poserTable(A) poser(C,A)
P1
poserTable(E)
poserTable(D)
But R1
poserTable(B)
poserTable(A) poser(F,E)
P2
poserTable(E)
poserTable(D) poser(E,D)
But R2
Figure 8.18: Les plans partiels des deux agents La fusion des plans P1 et P2 est relativement simple, puisquil ny a pas de point de conits. Il sut donc ` a un superviseur g en eral de superposer les deux plans et donc de d enir un plan global PG qui soit la synth` ese de ces deux plans partiels, comme le montre la gure 8.19.
poserTable(B) poserTable(A) poser(C,A)
But R1 PG
poserTable(E) poserTable(D)
But R2
poser(E,D) poser(F,E)
Figure 8.19: Synth` ese des plans partiels de R1 et R2 Il sut ensuite de lui appliquer une technique statique ou dynamique dallocation et de synchronisation de t aches telle que celle que nous avons examin ee ` a la section pr ec edente. Relations n egatives et conits de ressources La r esolution du probl` eme pr ec edent est particuli` erement simple, puisquil ny a ni conit ni synergie, mais seulement une intersection non vide de la structure des plans, chaque agent pouvant satisfaire ses buts de mani` ere ind ependante. Mais
424
evidemment cette situation nest quun cas particulier de la coordination dagents multiples. Supposons par exemple que nous ayons ` a faire face ` a une situation comme celle de la gure 8.20 o` u plusieurs agents doivent saider mutuellement pour que les actions soient accomplies. Il sagit de placer une petite caisse au fond dun placard et un piano au fond dun r eduit, le r eduit donnant acc` es au placard.
Clotaire Piano
Rduit Chilpric Caisse
Placard
Figure 8.20: Comment placer une caisse et un piano, sachant quil faut deux agents pour transporter le piano? Les deux op erateurs servant ` a d enir ces actions peuvent s ecrire ainsi: Op erateur: placerPiano nbre agents : 2 pr e: lieu(Piano,la),vide(Reduit) suppr: lieu(Piano,la), vide(Reduit) ajouts: lieu(Piano,reduit), plein(Reduit) fin Op erateur: placerCaisse nbre agents : 1 pr e: lieu(Piano,lb),vide(Reduit), vide(Placard) suppr: lieu(Caisse,lb),vide(Reduit) ajouts: lieu(Caisse,Placard),plein(Placard) fin Supposons que Clotaire d ecide de d eplacer le piano et Chilp eric la caisse. Chacun na donc quun seul op erateur et sil na pas connaissance des buts de lautre, Clotaire demandera de laide ` a Chilp eric pour laider ` a ranger le piano. Mais sil accomplit cette t ache, alors il ne pourra plus ranger la caisse dans le placard. Le probl` eme consiste donc ` a ordonner les actions des deux agents de mani` ere ` a ce quelles soient accomplies dans le bon ordre. Ici encore, d` es quil existe un agent centralisateur, le probl` eme revient ` a fusionner les plans et ` a d eterminer un parcours dans lex ecution des plans qui satisfasse tous les buts. La gure 8.21 montre les plans des deux agents avant la fusion, et la gure 8.22 montre le plan obtenu apr` es fusion
425
PChilpric lieu(Caisse,la) & la Placard <vide>
Placard <plein> lieu(Caisse,Placard)
<vide>
Chilpric Rduit
<vide>
PClotaire
Chilpric
Rduit lieu(Piano,lb) & lb Rduit <vide> <plein> lieu(Piano,Rduit)
Clotaire
Figure 8.21: Les plans partiels de Clotaire et Chilp eric sous la forme de r eseaux de Petri
PGlobal lieu(Caisse,la) & la Placard <vide>
Placard
<plein>
lieu(Caisse,Placard)
<vide>
Chilpric Rduit
<vide>
lieu(Piano,lb) & lb Rduit
<vide> <plein>
lieu(Piano,Rduit)
Clotaire
Figure 8.22: Le plan global obtenu apr` es fusion des plans partiels de Chilp eric et Clotaire
426
des plans de Chilp eric et de Clotaire, en identiant la place de Chilp eric et celle du r eduit communes aux deux plans. R esoudre le probl` eme revient alors ` a trouver une suite de transitions telle que les deux etats terminaux soient accessibles, cest-` a-dire ` a dire que les deux places terminales comprennent chacune un jeton.
8.3.4
Coordination distribu ee pour plans partiels
Principe g en eral La planication distribu ee introduit encore plus de r epartition des travaux en supposant quil nexiste aucun agent centralisateur, ni pour planier des plans globaux, ni pour coordonner des plans partiels. Dans la planication distribu ee, chaque agent planie individuellement les action quil compte accomplir en fonction de ses propres buts. La dicult e porte alors non seulement sur la r esolution des conits potentiels qui peuvent intervenir lors de lex ecution des plans, mais aussi, comme nous lavons pr ecis e plus haut (cf. section 8.1.2), sur la reconnaissance des situations synergiques qui peuvent se pr esenter lorsque les actions des uns peuvent etre utiles ` a la r ealisation des buts des autres, les agents se rendant alors mutuellement service. La gure 8.23 montre une organisation de planication distribu ee. Chaque agent dispose de buts et de plans lui permettant de r esoudre ses buts. Le probl` eme consiste pour ces agents ` a echanger des informations portant sur leurs plans et leurs buts, an que chacun puisse satisfaire ses objectifs.
But: A
But: B
But: C
Planificateur Excuteur Requtes, infos et plans partiels Planificateur Excuteur
But: D
Figure 8.23: Le mod` ele de planication distribu ee. Chaque agent dispose de buts et de plans partiels quil peut communiquer ` a dautres agents. Peu de chercheurs ont abord e ce probl` eme dans toute sa g en eralit e, hormis V.
427
Lesser et E. Durfee qui, avec le mod` ele PGP (Partial Global Planning ou planication globale partielle), ont tent e de donner un cadre g en eral pour la planication distribu ee pour agents multiples (Durfee et Lesser 1991). Dans le mod` ele de planication globale partielle, chaque agent dispose dune base de connaissance dispos ee sur trois niveaux. Au premier niveau se trouvent les plans locaux qui organisent les activit es futures de lagent avec tous les d etails requis: buts ` a court ou moyen terme, co uts, dur ee, etc. Au deuxi` eme niveau on trouve les nuds-plans (dans la terminologie de Lesser et Durfee, un nud est un agent), qui sont des r esum es des plans locaux, d ebarrass es des d etails inutiles. Enn au troisi` eme niveau se trouvent les PGP (Plans Globaux Partiels) qui contiennent une information g en erale sur le d eroulement dune partie des activit es globales. Un PGP est une structure dinformation que les agents utilisent pour echanger des informations sur leurs objectifs et leurs plans. Un PGP contient des informations portant sur lensemble des plans dont il assure la fusion, les objectifs poursuivis, ce que les agents sont en train de faire, les co uts et r esultats esp er es ainsi que la mani` ere dont les agents devraient interagir. Un agent echange alors des PGP avec dautres et, ` a partir dun mod` ele de soi et des autres, il tente didentier les agents dont les buts appartiennent ` a un objectif de groupe, appel e PGG (pour Partial Global Goal) et de combiner les PGP associ es en un PGP plus g en eral pour satisfaire ce but. Conits dacc` es aux ressources et construction des plans Nous allons illustrer la dicult e quil y a ` a fusionner des plans locaux, en donnant un exemple qui nappartient pas au domaine des SMA mais ` a la vie courante. Il a lavantage de bien montrer les probl` emes qui se posent lorsquil faut non seulement r eorganiser lordre des actions, mais aussi, pour chaque agent, reprendre localement son plan en fonction du plan des autres. Jules d ecide demmener son ls, Hector, au cin ema. Pour cela il envisage de prendre la voiture et donc de partir juste avant le d ebut de la s eance, ce qui lui permet de nir un travail en retard avant et de coucher Hector ensuite. Mais sa femme, H el` ene, doit imp erativement se rendre ` a un rendez-vous de travail pour lequel elle a absolument besoin de la voiture. Ici les deux plans partiels sont en conit du fait que lacc` es ` a une ressource, la voiture, est limit ee et que deux actions sont imp eratives: le rendez-vous dH el` ene et le coucher dHector, cette derni` ere pouvant etre eectu ee indi eremment par Jules ou H el` ene, comme le montre la gure 8.24. Comment r esoudre ce probl` eme? Voici une solution humaine: Jules accepte de prendre les transports en commun et donc de partir plus t ot. Il devra nir son travail en retard le soir et ne pourra plus soccuper dHector. H el` ene lui propose alors de sen occuper en revenant de son rendez-vous. En consid erant quil existe non pas deux mais trois agents (Hector est aussi un agent) et que la voiture et les transports en commun agissent comme des ressources pour accomplir des actions, le probl` eme et sa solution sont pr esent es ` a la gure 8.25.
428
Plan de Jules
Travail en retard

Plan d'Hlne
Aller au cinma
ressource
Voiture
ressource
Aller au rendezvous
Coucher Hector
Figure 8.24: Les plans originaux de Jules et H el` ene, avant coordination A partir de ce r eseau, il est facile de voir que lon ne peut atteindre les place nales (cercl ees en gras) que si eectivement Jules emprunte les transports en commun et quH el` ene se charge donc de coucher Hector. Cest donc simplement ` a partir dune technique de recherche de marquage dans un r eseau de Petri que lon peut d enir un bon plan qui tiendra compte des interactions entre les agents et des ressources disponibles. Mais en fait, le probl` eme consiste g en eralement ` a trouver une bonne repr esentation du plan. En eet, dans le cas pr ec edent, ce nest que parce quil y avait un conit dacc` es aux ressources, que Jules a imagin e une alternative ` a son premier plan, en d ecidant de prendre les transports en commun et de ne faire son travail en retard quensuite. Cest cette identication des conits, mais aussi des possibilit es annexes tels que lacc` es ` a une autre ressources non envisag ee au pr ealable qui constitue le travail le plus dicile. Dicult es et quelques solutions envisageables Ces approches g en erales fond ees sur des plans partiels subissent encore les limites suivantes: 1. Hypoth` ese dhomog en eit e. Les agents sont suppos es homog` enes et disposer des m emes m ecanismes de raisonnement. On suppose que tous les agents, plac es dans les m emes conditions, arriveront au m eme but, ce qui est evidemment loin d etre le cas dans la r ealit e. 2. Limitation du nombre dagents. la puissance de ces techniques de fusion de plans sont limit ees ` a des situations ne faisant intervenir quun tr` es petit nombre dagents, du fait de la dicult e` a faire converger lensemble des plans locaux vers un plan global coh erent, en pr esence dun ensemble de contraintes. Dune mani` ere g en erale, toutes ces techniques ont une complexit e qui cro t
429
Travail en retard
Transport en commun
Aller au cinma
Voiture
Aller au rendez-vous
Travail en retard
S'occuper d'Hector
S'occuper d'Hector
Jules
Hlne
Coucher Hector
Hector
Figure 8.25: Lensemble des plans de Jules et dH el` ene repr esent es sous la forme dun r eseau de Petri exponentiellement avec le nombre dagents et le nombre de choix possibles pour chaque agent. 3. Hypoth` ese de r egularit e du monde. Elles supposent que lenvironnement ne se modie pas trop vite par rapport ` a laccomplissement des actions et que les agents ne changent pas de t aches facilement. En dautres termes, on suppose que les agents sengagent ` a accomplir les actions quils ont plani es. De ce fait ces techniques ne savent pas tr` es bien prendre en compte des situations r eclamant une r eaction rapide, non plani ee sous la forme dun acte r eexe. 4. Probl` emes temporels. Enn, ces techniques doivent etre am elior ees si lon veut quelles prennent en compte la dur ee eective des actions et donc quelles g` erent les probl` emes de simultan eit e et de ressources uniquement disponibles pendant une plage de temps r eduite. Par rapport ` a tous ces probl` emes et face ` a lensemble des dicult es qui se dressent devant la planication distribu ee, on peut envisager des solutions qui permettent dobtenir des plans coh erents et applicables? Pour r epondre ` a cette question, nous nous bornerons ` a donner quelques conseils permettant daboutir ` a des solutions pratiques. Hi erarchisation des plans On peut hi erarchiser les plans et supposer que leur anage ne conduira pas a ` des conits, en reprenant les travaux portant sur les plans hi erarchiques (lire par
430
exemple (Nilsson 1980) pour une pr esentation de la planication hi erarchique). Si des conits apparaissent, on devra alors les traiter en utilisant au mieux les heuristiques pr esent ees ci-dessous. Engagement des agents La notion dengagement est essentielle pour la planication multi-agent. Si le monde, et donc les autres agents, etait totalement impr evisible, sil ne pr esentait pas quelques r egularit es, il serait impossible dex ecuter le moindre plan, puisquil deviendrait caduc sur le champ. Pour comprendre ce point de vue, il faut le mettre en correspondance avec un monde chaotique. Par exemple, supposons, comme la d ecrit L. Suchman (Suchman 1987) que nous devions franchir un rapide en cano e. On peut bien entendu sasseoir un moment et essayer de trouver un plan qui nous permette de le passer sans encombre. Mais d` es que lon s elance dans le rapide, les courants nous font rapidement sortir de notre plan et lon doit alors sen remettre a ses r ` eexes, son exp erience et son habilet e. Le plan ne sert plus ` a rien. Cette conception permet ainsi de donner des arguments aux partisans de la planication r eactive que nous etudierons ` a la section suivante. Mais heureusement le monde ne se comporte pas toujours comme un rapide. On peut planier sa journ ee de travail car lenvironnement ne change pas trop. Les rendez-vous sont des points de synchronisation sur lesquels on peut compter si les agents sont s urs et sils ne remettent pas leur engagement (ou seulement tr` es rarement). Dans ce cas, la planication est possible car le monde est relativement pr evisible, les engagements des agents jouant le r ole des lois de la physique pour d eterminer (partiellement) un etat futur du monde. Par exemple, Clotaire, qui se trouve ` a Paris doit aller a Toulouse. Il apprend que Chilp ` eric doit aussi se rendre ` a Toulouse ` a la m eme epoque et quil peut lemmener. Clotaire peut donc tenir compte de ce que vient de lui dire Chilp eric, si celui-ci tient evidemment ses promesses, et planier son voyage en consid erant que le probl` eme du moyen de transport est r esolu. Strat egies de fonctionnement On peut aussi utiliser des strat egies de fonctionnement qui d eterminent un mode dapproche du monde, en sachant que certaines ne conduiront certainement pas ` a une solution optimale, mais se r ev eleront faciles et rapides ` a mettre en uvre, alors que dautres, plus pr ecises, r eclameront des moyens plus importants. Par exemple, on peut supposer que tout se passera bien tant quil ny aura pas de conits et on ne replaniera qu` a la d etection de ces conits. Dans ce cas, on ex ecute toujours ses propres plans localement sans tenir compte des autres et cest uniquement lorsquon d etecte des probl` emes que lon int` egre les actions des autres dans ses plans. Cette mani` ere de faire est evidemment mauvaise puisquelle ne permet pas de tenir compte des relations synergiques entre actions. Elle pr esente aussi linconv enient de ne pas assez tenir compte des autres et donc de devoir beaucoup sen remettre a des techniques de r ` esolution de conits chaque fois quun probl` eme se pr esente. N eanmoins, dans des situations o` u lind ependance est de r` egle, o` u les situations de conit sont mineures et o` u lenvironnement est modi e rapidement, il sagit dune strat egie ` a envisager, pr esentant lavantage d etre particuli` erement simple ` a mettre en uvre.
8.4. COORDINATION REACTIVE
431
On peut au contraire pr ef erer avoir une strat egie de g en eral de corps darm ee et essayer dutiliser toutes les informations disponibles sur les autres pour tenir compte de tous les conits ou opportunit es qui se pr esentent et replanier au fur et a ` mesure de lobtention de ces informations. Evidemment, cette technique correspond a une recherche doptimalit ` e, mais elle n ecessite des moyens de calcul importants pour mod eliser lenvironnement et les autres agents et tenter de pr evoir leurs plans dactions. Entre ces deux extr emes, il existe de nombreuses approches, mais il faut savoir que, avec une vision distribu ee, il nest jamais certain (sauf dans des cas el ementaires) dobtenir une solution optimale, et il faudra donc utiliser des heuristiques tout en sachant quelles peuvent conduire ` a des echecs alors quil existait une solution.
8.4
Coordination r eactive
A loppos e des approches pr ec edentes, la coordination r eactive consid` ere quil est souvent plus simple dagir directement sans planier au pr ealable ce que lon doit faire. Comme nous lavons d ej` a signal e aux chapitres pr ec edents, les agents r eactifs sont tr` es simples et ne poss` edent pas de repr esentations de leur environnement. De ce fait, toutes les informations relatives ` a leur comportement se trouvent dans lenvironnement et leurs r eactions d ependent uniquement de la perception quils peuvent en avoir. Les agents r eactifs sont donc situ es (cf. chap. 1) et op` erent dans lici et le maintenant, cest-` a-dire quils ne m emorisent pas les ev enements pass es et ne peuvent pas non plus anticiper sur le futur. Bien que cette simplicit e les rende souvent sans d efense lorsquils sont utilis es de mani` ere isol ee, les agents r eactifs prennent leur force du travail en groupe, ce qui leur donne la possibilit e de r ealiser des actions dont ils auraient et e bien incapables individuellement. Comme nous lavons vu au chapitre pr ec edent, les agents r eactifs sont tr` es sensibles aux relations spatiales qui d eterminent tout ` a la fois des contraintes, des capacit es dactions et d enissent des relations de coop eration privil egi ees.
8.4.1
Coordination par actions situ ees
Nous avons vu au chapitre 4 comment il etait possible de d enir le comportement dun agent isol e en termes dactions situ ees. Mais quen est-il pour des syst` emes compos es de plusieurs agents? Par exemple que se passe-t-il si lon demande ` a plusieurs robots deectuer certaines t aches et comment peuvent-ils accomplir leurs objectifs simultan ement. Nous nous trouvons evidemment dans une situation de coop eration et plusieurs cas peuvent se pr esenter (cf. chap. 2). Si les agents ont des buts ind ependants, les seuls probl` emes quils peuvent rencontrer viennent des conits eventuels dacc` es ` a des ressources communes. On peut alors distinguer deux grandes cat egories de situations: 1. Les premi` eres ont trait ` a lacc` es dune m eme portion despace par un ensemble dagents. Il sagit alors pour eux daccomplir leurs buts tout en s evitant, comme dans le cas du contr ole a erien. Les techniques les plus utilis ees dans
432
CHAPTER 8. COORDINATION DACTIONS ce cadre sont celles qui se rapportent ` a lutilisation de champs de potentiels d enissant des comportements attractifs et r epulsifs.
2. Les secondes portent sur lutilisation dune ressource ponctuelle, telle quun outil commun. Il est alors possible dutiliser des m ecanismes de synchronisation semblables ` a ceux que nous avons etudi es pr ec edemment section 8.2 Un probl` eme particulier se pose lorsque les agents ont des buts d ependants et que les actions des uns peuvent am eliorer celles des autres et donc augmenter les performances du groupe tout entier. Le principe g en eral consiste ` a utiliser les capacit es des agents r eactifs ` a r eagir aux modications de lenvironnement et souvent a marquer cet environnement pour coordonner les actions des agents entre eux. ` De ce fait, presque toutes les techniques de coordination r eactives se r esument ` a lutilisation de quelques techniques essentielles: 1. Utilisation de champs de potentiels ou plus g en eralement de champs de vecteurs pour la d etermination du d eplacement des agents mobiles. 2. Utilisation de marques pour coordonner laction de plusieurs agents, ces marques permettant dutiliser lenvironnement comme un syst` eme de communication souple, robuste et simple.
8.4.2
Du comportement de meute aux syst` emes anti-collisions
Lun des premiers comportements que lon peut demander ` a des agents r eactifs situ es est de savoir evoluer en groupe tout en s evitant mutuellement. Les techniques el ementaires Le premier ` a s etre int eress e` a la d enition de comportements collectifs de meutes (ocking) est Craig Reynolds. En 1987, il produisit un mod` ele de meute fond e sur lobservation par chacun dun comportement extr emement simple (Reynolds 1987). Le comportement agr egatif de ses cr eatures quil appelle boids (prononcer bo d) est un ph enom` ene emergent qui r esulte de leur interaction, chacun deux se contentant de suivre les r` egles comportementales suivantes: 1. Maintenir une distance minimale par rapport aux autres objets dans lenvironnement et en particulier les autres boids. 2. Adapter sa vitesse ` a la moyenne de celle de ses voisins. 3. Aller vers le centre de gravit e des boids voisins. Ces r` egles sont susantes pour que les boids adoptent un comportement semblable a ceux dun vol doiseaux migrateurs. A lencontre des escadrilles a ` eriennes, qui poss` edent un chef, les boids evoluent sans leader et sans contr ole global. Leur comportement est particuli` erement uide et semble tr` es naturel lorsquils evitent tous ensemble des obstacles en restant naturellement group es. Parfois la meute se divise et produit deux groupes qui se meuvent ind ependamment lun de lautre. Parfois aussi deux sous-groupes se r eunissent pour produire un nouveau groupe.
8.4. COORDINATION REACTIVE Des robots collectifs
433
Les agents r eactifs peuvent faire preuve dune grande souplesse dans la r ealisation dune t ache et montrer des comportements collectifs emergents relativement spectaculaires ` a partir de principes tr` es el ementaires. En reprenant les travaux de C. Reynolds et en les adaptant ` a des robots r eels, M. Mataric, du Mobot Lab de R. Brooks au M.I.T., a constitu e de v eritables meutes robotiques (Mataric 1992; Mataric 1994). Chaque robot dispose dune batterie de comportements de haut niveau que ce dernier s electionne en fonction de la situation dans laquelle il se trouve: evitement de collision, lature dun autre robot, dispersion et r epartition sur un territoire, agr egation, guidage sur un but. Ces comportements font appel a ` des primitives de bas niveau telles que la perception par infrarouge dun obstacle ou le calcul dune distance par sonar. Voici, par exemple, les comportements de lature et dagr egation. Comportement filature Si il y a un objet sur la droite seulement alors aller ` a droite. Si il y a un objet sur la gauche seulement alors aller ` a gauche. Si il y a un objet sur la gauche et la droite alors continuer tout droit et compter le temps. Si il y a un objet sur la gauche et la droite qui sont l` a depuis un moment, alors stopper. Comportement Agr egation Si aucun robot nest trouv e dans une certaine zone, alors aller vers un centre de gravit e local. Le comportement de meute est donn e comme la somme pond er ee des comportements d evitement, de lature, dagr egation et de dispersion: Comportement Meute Pond erer les sorties des actions d evitement, de filature, dagr egation et de dispersion et calculer un vecteur de d eplacement. Si il se trouve au d ebut de la meute alors ralentir. Si il se trouve ` a la fin de la meute, alors acc el erer. Dapr` es M. Mataric, le comportement de meute est tr` es dicile ` a impl ementer lorsquil sagit de v eritables robots, ` a cause de la dynamique propre de leur m ecanique ainsi quaux limitations des capteurs. Il faut alors jouer sur les param` etres de pond eration et faire attention que les robots ne cherchent pas trop ` a s eloigner ou, au contraire, en viennent ` a former des groupes trop compacts qui g eneraient leurs evolutions. N eanmoins, et ` a condition de bien ajuster ces param` etres, il est possible
434
de faire emerger de tels comportements, que les agents soient simul es ou r eels. On peut cependant se poser la question de savoir si les probl` emes viennent eectivement des capteurs ou bien sils proviennent dune analyse encore trop el ementaire des comportements.
Les bancs de poissons Car en eet, si ces approches sinspirent de la nature, elles nont parfois quun lointain rapport avec la mani` ere dont les animaux se comportent eectivement. Qui na jamais et e impressionn e par ces comportements collectifs que sont les vols doiseaux migrateurs, les bancs de poissons, les meutes de loups ou les hordes de gazelles? Comment ces animaux font-ils pour evoluer ainsi en groupe et accomplir parfois des gures fort complexes? Comment synchronisent-ils leurs actions pour donner limpression quun chef dirige leur chor egraphie? Cest pour r epondre ` a ces questions que R. Mesl e sous ma direction et en collaboration avec J.-P. Treuil et P. Fr eon de lOrstom a d evelopp e un programme de simulation de bancs de poissons, Ichtyus (g. 8.26), montrant comment il est possible de comprendre leur constitution et leur evolution ` a partir de consid erations enti` erement distribu ees (Mesle 1994). Un banc de poissons est une agr egation spatiale dun certain nombre dindividus fond ee sur une approche egalitaire, tous les membres ayant la m eme inuence. Ces bancs ont des comportements collectifs particuli` erement int eressants, car leurs mouvements semblent parfaitement synchronis es comme sils r epondaient tous au m eme signal ou sil existait un organe de commande. De plus, tout en agissant de mani` ere parfois brusque, les poissons ne se heurtent jamais, tous les mouvements semblant toujours formidablement coordonn es. Lapproche distribu ee permet de rendre compte de ce ph enom` ene. Il sut de consid erer que chaque poisson est un agent dont la direction est fonction de linuence de lensemble de ses voisins, cest-` a-dire des poissons se trouvant ` a proximit e, et que le comportement collectif emerge de ces interactions. Chaque poisson calcule la direction quil doit prendre en fonction de sa propre direction ant erieure et des directions et des positions des di erents poissons qui lentourent, en eectuant un calcul de somme vectorielle pond er ee par la distance. Le r esultat est impressionnant: a partir dune situation initiale, dans laquelle les poissons sont plac ` es de mani` ere al eatoire, et en faisant tourner une simulation portant sur plusieurs cycles (de 40 a 100 cycles environ), on constate que les poissons tendent en eet ` ` a construire des bancs dans lesquels les agents coordonnent leurs mouvements pour aller dans la m eme direction. De plus, la pr esence dun obstacle ne les g ene nullement: ils l evitent de concert comme sils s etaient donn e le mot. Tous les poissons evitent lobstacle tout en restant group es sans que lon puisse d egager un leader, ni m eme un d eclencheur du mouvement.
435
Figure 8.26: Les poissons se rassemblent en bancs dans Ichtyus. Les champs de forces sym etriques Si le comportement de meute peut sexpliquer par une simple combinaison vectorielle en est-il de m eme lorsque plusieurs agents mobiles, des avions par exemple, doivent coordonner leurs actions pour s eviter mutuellement ` a des distances importantes tout en essayant de suivre leurs plans de vols? Nous avions vu au chapitre 4 quil etait possible de mod eliser le d eplacement dun agent ` a partir des forces attractives et r epulsives r esultant de la combinaison de potentiels correspondant ` a des buts ou a des obstacles. Peut-on g ` en eraliser cette m ethode ` a des agents mobiles? Dans ce cas, les agents sont des obstacles qui modient le paysage des potentiels des autres agents. Chacun deux construit sa propre vision du monde, son propre champ de potentiels, ` a partir des informations dont il dispose et donc de ce quil per coit. Les potentiels r esultants sont donc d enis pour chaque agent Ai comme la somme du potentiel attractif correspondant au but avec la somme de tous les potentiels r epulsifs d enis pour les autres agents ` a eviter.
n
Ui =
Uia ttr
+
j =1
Ujr ep
La force r esultante sexprime alors comme le gradient (cest-` a-dire la d eriv ee) de ce potentiel au point p: Fi (p) = Ui (p) Mais cette technique, si elle sav` ere tr` es simple ` a mettre en uvre, pr esente n eanmoins un inconv enient majeur: du fait que les agents se d eplacent, les champs de potentiels sont continuellement modi es, et les trajectoires que suivent les agents deviennent parfois aberrantes. Par exemple, la gure 8.27 montre une situation caract eristique
436
introduite par les champs de potentiels. Deux agents qui suivent des routes qui se croisent cherchent ` a s eviter et donc ` a fuir. Pour eviter lagent A2 , lagent A1 s ecarte vers la gauche, mais lagent A2 en cherchant lui aussi ` a eviter A1 incurve sa trajectoire vers la droite. Bien que ces r eactions soient logiques du point de vue de chaque agent, elles conduisent ` a des modications de trajectoires inad equates. Cela est d u au fait que, en utilisant simplement des techniques fond ees sur le gradient de potentiels, les agents narrivent pas ` a tenir compte du d eplacement des autres agents, la prise de d ecision locale ne permettant pas de r esoudre le probl` eme de mani` ere globale.
Figure 8.27: Une cons equence malheureuse de lutilisation de champs de potentiels lorsque le comportement d evitement est r eduit ` a celui dune fuite. Il est cependant possible de r esoudre ce probl` eme en introduisant une nouvelle force, une force de glissement, comme la fait K. Zeghal5 (Zeghal 1993), qui permet dembrasser les probl` emes de coordinations spatiales tout en restant dans la m eme logique de champs de force. Lid ee est tr` es simple: elle consiste ` a dire que pour contourner un obstacle il sut de rester sur une ligne qui conserve la m eme valeur du potentiel et donc ` a tenter de rester ` a m eme distance dun obstacle. Math ematiquement, cela revient ` a dire que cette force Fij qui agit sur lagent Ai ` a partir dun potentiel provenant de lagent Aj est perpendiculaire au gradient du potentiel, ce qui est donn e par l equation suivante: Fij (p). Uij (p) = 0 De plus lintensit e de cette force en un point p est egale ` a celle du gradient g en er e par Aj : ||Fij (p)|| = || Uij (p)|| Il est facile de donner une image de cette th eorie: le meilleur moyen pour contourner un obstacle nest pas de le fuir, mais dessayer de se d eplacer en restant toujours ` a une distance sup erieure ` a une distance limite, ce que les alpinistes font naturellement lorsquils tentent de rester sur une ligne de m eme altitude, une ligne iso dans
5 De mani` ere ind ependante, De Medio et Oriolo dune part (De Medio et Oriolo 1991) et Masoud et Bayouni dautre part (Masoud et Bayoumi 1993) ont propos e des techniques voisines pour traiter le probl` eme de l evitement entre agents mobiles autonomes dans le cadre de la robotique.
437
leur jargon. Lintensit e de cette force est donn ee comme etant egale ` a lintensit e du gradient au m eme point, ce qui signie que plus on est loin, moins on cherche a contourner un obstacle, et plus on est pr ` et, plus on doit eectivement avoir un d eplacement qui se rapproche de la perpendiculaire du gradient. Enn, il sagit de savoir de quel c ot e on doit chercher ` a contourner lobstacle. Si cela est (presque) indi erent lorsquil sagit dun obstacle xe ou dun agent ne r eagissant pas ` a la pr esence dautrui, il nen est pas de m eme lorsque deux agents r eagissent de la m eme mani` ere, comme nous lavons vu ` a la gure 8.27. Pour passer dun agent cherchant simplement ` a eviter un obstacle ` a une interaction d evitement entre agents, il sut de donner ` a la force de glissement le sens d eni par la di erence des vecteurs vitesse, comme le montre la gure 8.28. Lorsquil existe la moindre petite di erence entre les vecteurs vitesse des deux agents, les vecteurs vitesse vont dans des sens oppos es, ce qui permet de choisir la bonne direction d evitement.
(V2 ) V1 A1 V1 - V2 F12 gliss V2 - V1
F21 gliss V2 (V1 )
A2
Figure 8.28: Contournement sym etrique de deux mobiles. Les formes de glissement ont une direction perpendiculaire au gradient du potentiel de r epulsion, une intensit e egale ` a celle du gradient et leur sens est donn e par la di erence des vecteurs vitesse des agents. Des situations int eressantes emergent de ce type de coordination dactions. Lorsque plusieurs agents doivent s eviter simultan ement, des structures dynamiques de tourbillon apparaissent spontan ement, donnant limpression que les agents tournent autour dun rond-point (g. 8.29). K. Zeghal a impl ement e cette technique dans le syst` eme Craash, qui simule l evolution dun ensemble davions disposant ou non de son syst` eme danti-collision (Zeghal et Ferber 1993). Il a ainsi pu montrer que plus dune cinquantaine dappareils civils (Airbus, Boing, etc.) etaient capables d evoluer pour tous venir atterrir de mani` ere automatique sur le m eme a eroport, sans entrer en collision.
8.4.3
Marquage de lenvironnement
Nous avons vu limportance des techniques utilisant des champs de vecteurs pour d enir les positions respectives des buts, des obstacles et des agents, et permettre
438
(a)
(b)
Figure 8.29: Lintroduction dun comportement d evitement par lusage de forces glissantes permet non seulement de r esoudre le probl` eme pos e par les champs de potentiels (a), mais aussi de provoquer des structures qui emergent des interactions tels que celle du rond point (b). Cette derni` ere appara t alors quaucune r` egle de priorit e nest donn ee (dapr` es (Zeghal 1993)). ainsi ` a ces derniers de coordonner leur d eplacement dans lespace. Mais elles ne se bornent pas ` a la gestion des mouvements. Elles se g en eralisent facilement ` a des probl` emes de coordination, le marquage de lenvironnement constituant la cl e de la coordination coop erative dagents r eactifs. Quest-ce quune marque? Une marque est un signe mat eriel ou une empreinte qui sert ` a indicer articiellement lenvironnement an de coordonner les actions des agents. Les marques peuvent etre d epos ees, lues et retir ees par les agents, mais leur eet peut aussi dispara tre lentement, par evaporation naturelle dans lenvironnement. Marques et synchronisation dactions Connah et Wavish (Wavish et Connah 1990) ont montr e la dicult e quil pouvait y avoir de concevoir un ensemble dagents r eactifs coop erants et, en particulier, quil ne susait pas dajouter b etement des agents r eactifs pour quautomatiquement les performances du syst` eme soient am elior ees. Par exemple, supposons que lon cherche ` a assembler dynamiquement des composants de mani` ere ` a r ealiser un appareil electronique tel quun t el eviseur. Dans une pi` ece comprenant un tapis roulant et cinq casiers contenant cinq types de composants pour t el eviseurs (carcasses, tubes, d eecteurs, circuits electroniques et vis), des robots doivent placer les composants dans un ordre pr ecis au point dassemblage (g. 8.30). On consid` ere que, lorsque ces cinq composants ont et e plac es sur le tapis roulant dans cet ordre, la t el evision est achev ee et la t ache nie (Hickman et Shiels 1991). Le comportement de chaque agent est d eni sous la forme dun ensemble de
439
Carcasses
Tubes
Circuits
Vis Decteurs
Figure 8.30: Des robots doivent assembler des composants de t el eviseurs dans un ordre pr ecis, les pi` eces d etach ees se trouvant dans des casiers s epar es. r` egles de production qui impl ementent des actions situ ees (cf. chap. 4). Si un agent distingue une certaine situation, et notamment ce qui se trouve au point dassemblage, il d eclenche une action associ ee ` a la situation per cue. Par exemple, si un agent saper coit quune pi` ece particuli` ere se trouve d ej` a au point dassemblage, il peut d eclencher la recherche de l el ement suivant. R` egle prendre si je ne porte rien et je suis devant un casier alors je prend ce quil y a dans le casier et je me dirige vers le point dassemblage R` egle d eposer si je porte quelque chose et je suis au point dassemblage alors je d epose ce que je tiens R` egle chercherD eflecteur si je ne porte rien et je suis au point dassemblage et je per cois un tube au point dassemblage alors je me dirige vers le casier des d eflecteurs R` egle chercherCircuitElectronique si je ne porte rien et je suis au point dassemblage et je per cois un d eflecteur au point dassemblage alors je me dirige vers le casier des circuits electroniques Les deux premi` eres r` egles sont g en erales, mais les suivantes doivent etre hi erarchis ees. En eet, la r` egle chercherCircuitElectronique doit etre prioritaire devant chercherD eflecteur, puisque, sil existe un d eecteur, il existe aussi un tube, mais
440
la perception de ce dernier ne doit pas pour autant d eclencher la recherche dun autre d eecteur. Avec un seul agent, tout se passe bien: il sut quil se pr esente au point dassemblage et constate quil ny a rien pour se diriger vers le casier des carcasses ou quil aille directement devant ce casier pour que les composants soient plac es dans le bon ordre. Mais que se passe-t-il avec seulement deux agents? Avec le m eme comportement, ils risquent de d eposer certains composants en double. En eet, lorsque lagent A voit quil y a un tube au point dassemblage, il va naturellement chercher un d eecteur; mais si lagent B arrive au m eme endroit avant quA ne revienne, il ira lui aussi chercher un d eecteur, ce qui aura pour cons equence de doubler le nombre de d eecteurs. Le comportement de B est donc redondant et mal synchronis e avec celui de A. On peut r esoudre ce probl` eme de plusieurs mani` eres. La solution pr esent ee dans (Hickman et Shiels 1991) consiste ` a donner aux agents la possibilit e de voir ce que les autres agents transportent: si lagent B voit que A transporte un d eecteur, il se dirigera vers le casier des circuits electroniques, evitant ainsi de ramener un autre d eecteur. Mais cette solution nest absolument pas satisfaisante et pose dautres probl` emes. Dabord B doit non seulement voir que A transporte un d eecteur, mais aussi quil a lintention den apporter un lorsque A se dirige vers les casiers, ce qui est en contradiction avec lhypoth` ese de r eactivit e associ ee aux actions situ ees. De plus, cette technique nest pas tr` es g en eralisable. Sil y a un nombre n dagents, chacun doit voir ce que les n 1 autres portent et donc etre ` a m eme de d ecider ` a partir dune perception globale de la conguration des autres agents, hypoth` ese peu applicable dans un contexte r eel, notamment ` a cause de laccroissement exponentiel du nombre de r` egles. Heureusement, des solutions plus simples existent, qui consistent ` a marquer ce que les agents sont en train de faire au point dassemblage. Par exemple, si lagent A d ecide daller chercher un d eecteur, il placera une marque de la forme RechercheD eflecteur. De ce fait, un agent B arrivant apr` es et voyant cette marque pourra se diriger directement vers le casier des circuits electroniques. Il sut pour cela de l eg` erement modier les r` egles de recherche de mani` ere ` a prendre en compte la perception des marques. Voici, par exemple, la nouvelle r` egle de recherche dun circuit electronique: R` egle si et et chercherCircuitElectronique je ne porte rien je suis au point dassemblage je per cois un d eflecteur au point dassemblage ou une marque RechercheD eflecteur alors je me dirige vers le casier des circuits electroniques et je d epose une marque RechercheCircuitElectronique
Dans ce cas, les marques jouent le r ole dindices pour la coordination des actions entre les agents et emp echent les actions inecaces eventuelles. Il est aussi possible dutiliser les marques pour amplier les performances des agents en servant ` a la fois dindice de collaboration et de coordination dactions.
8.4. COORDINATION REACTIVE Marques et am elioration des performances
441
Lutilisation des marques peut aussi servir ` a am eliorer les performances dun groupe et ` a former des structures autocatalytiques, cest-` a-dire des organisations qui emergent des interactions. Les premiers travaux ayant port e sur lusage de telles marques pour r esoudre le probl` eme de la r ecup eration de minerai sont dus ` a J.-L. Deneubourg (Deneubourg et Goss 1989) et ` a L. Steels (Steels 1989). Une discussion des approches possibles ainsi que de leur ecacit e peut etre trouv ee dans (Drogoul et Ferber 1992). Lexemple des robots explorateurs (cf. chap. 1) permet en eet de comprendre comment lutilisation des marques peut servir ` a r eduire lespace de recherche des robots et donc ` a am eliorer leur productivit e. Rappelons que le probl` eme de lexploration consiste pour les robots ` a trouver des echantillons de minerai et ` a les rapporter ` a la base. Le comportement des robots peut donc etre d ecrit simplement par la succession de phases dexploration et de transport des echantillons jusqu` a la base. En termes dactions situ ees, on pourrait d ecrire ce comportement de la mani` ere suivante: R` egle explorer si je ne porte rien et je ne per cois aucun minerai alors jexplore de mani` ere al eatoire R` egle trouver si je ne porte rien et que je per cois du minerai alors je prend un echantillon du minerai R` egle rapporter si je porte du minerai et je ne suis pas ` a la base alors retourner ` a la base R` egle d eposer si je porte du minerai et je suis ` a la base alors d eposer le minerai Nous consid ererons que retourner ` a sa base nest pas un probl` eme pour un robot et quil lui est toujours possible de revenir ` a son point dattache. Par exemple, on supposera que la base emet un signal inversement proportionnel ` a sa distance (ou au carr e de sa distance) qui permet ` a chaque robot de trouver son chemin. Le probl` eme demeure donc celui de la d ecouverte des echantillons. Si ces derniers sont diss emin es de mani` ere al eatoire et que les robots nont aucun indice de leur pr esence, les robots suivront un d eplacement al eatoire jusqu` a ce quils per coivent un tas de minerai pour en rapporter un echantillon ` a la base.
442
Linconv enient de cette technique est d etre relativement co uteuse, puisque, si les agents se d eplacent de mani` ere al eatoire, le temps mis pour trouver un tas de minerai est proportionnel ` a la surface dexploration. Dans ce cas, les actions des robots ne sont absolument pas coordonn ees, et tout le travail eectu e par un robot pour trouver un tas de minerai est totalement perdu pour les autres. Une m ethode qui peut etre employ ee pour am eliorer lecacit e de la recherche consiste evidemment ` a ce que les agents se communiquent la position des tas de minerai. Plusieurs solutions utilisant des communications r eactives (cf. chap. 6 et 7) peuvent etre envisag ees. En sinspirant de la fa con dont certaines fourmis se transmettent la position des sources de nourriture en d eposant de petites quantit es de ph eromones, Deneubourg et Steels ont imagin e que des robots explorateurs pourraient d eposer des marques dans lenvironnement lorsquils ont trouv e du minerai et quils retournent a ` la base. Ces marques am eliorent le processus de recherche du minerai car, lorsquun robot en phase dexploration per coit une marque il se dirige naturellement vers cette marque et remonte ainsi jusqu` a la source du minerai. Le comportement de ces robots est alors modi e de la mani` ere suivante (on modie les r` egles explorer et rapporter et on ajoute la r` egle suivreMarque): R` egle explorer si je ne porte rien et je ne per cois aucun minerai et je ne per cois aucune marque alors jexplore de mani` ere al eatoire R` egle rapporter si je porte du minerai et je ne suis pas ` a la base alors retourner ` a la base et d eposer une marque R` egle suivreMarque si je ne porte rien et je ne per cois aucun minerai et je per cois une marque alors je me dirige vers cette marque Un robot ayant trouv e du minerai et qui retourne vers la base va cr eer un chemin dodeur, cest-` a-dire une suite de marques d epos ees sur le sol. Les robots en train dexplorer vont se trouver capt es par le chemin et auront donc tendance ` a suivre les traces, ce qui les am` enera normalement vers le tas de minerai. De ce fait, avec le temps, de plus en plus de robots seront amen es ` a trouver le tas de minerai et donc ` a marquer eux-m emes le chemin et ` a d eposer des marques, ce qui aura pour eet de renforcer la tendance des robots ` a suivre ce chemin, dans un ph enom` ene autocatalytique caract eristique des r etroactions positives. La gure 8.31 montre la situation dun ensemble de robots cherchant des echantillons de minerai et utilisant des marques pour am eliorer le processus. Cela
443
donne limpression que les agents suivent un chemin dodeurs pour retrouver l echantillon de minerai.
Minerai
Agents
Minerai
Marques Base (a) Base
(b)
Figure 8.31: Utilisation de marques par des robots pour rapporter du minerai ` a la base et am eliorer leurs performances collectives
Cependant, lutilisation de marques pose parfois un probl` eme: leur pr esence peut induire des agents en erreur. Par exemple, si la source de minerai est eteinte et sil reste des marques, alors les agents suivront les marques pour aboutir ` a un endroit maintenant vide. Il faut donc que les marques soient elles-m emes des el ements dynamiques capables de dispara tre lorsquil ny a plus d echantillon ` a aller chercher, cest-` a-dire que le chemin soit volatile et disparaisse avec le temps. Deux solutions sont envisageables: 1. La premi` ere consiste ` a utiliser des marques volatiles. Si le chemin nest pas constamment renforc e par le d ep ot de nouvelles marques, les marques dispara tront. Cette technique, qui sapparente ` a ce qui se passe dans la nature avec des fourmis, n ecessite seulement une bonne param etrisation de la dur ee de r emanence des marques. Si celle-ci est trop grande, on se retrouve dans la situation pr ec edente qui pi` ege des robots alors que cela nest plus n ecessaire, et si elle est trop faible, le m ecanisme de marquage naura pas le temps de fonctionner pour de nouvelles fourmis. 2. On peut aussi faire en sorte que les agents enl` event une partie des marques. Au retour, au lieu de ne d eposer quune seule marque, les robots en d eposent deux et, ` a laller, lorsquils suivent le chemin des marques, ils en reprennent une. De ce fait sil nexiste plus de minerai, les robots pi eg es par le chemin des marques elimineront les marques d epos ees pr ealablement, ce qui aura pour eet de nettoyer le chemin de toutes les marques inutiles.
444
8.4.4
Actions de coordination
Nous avons envisag e dans les sections pr ec edentes lutilisation de marques d epos ees dans lenvironnement pour coordonner les actions dagents r eactifs. Mais il est possible de coordonner les actions de tels agents m eme en labsence de marques. Il faut alors ajouter des actions de coordination qui orent aux agents, au-del` a des m ecanismes de synchronisation que nous avons vus plus haut (cf. section 8.2), la possibilit e de sentraider (ou simplement de ne pas se g ener) dans leurs t aches. Un probl` eme particuli` erement int eressant est celui de la formation dune cha ne de transport dobjets. Le d eplacement dobjets dun point ` a un autre est une des activit es fondamentales des organisations humaines. La production des biens ne se trouve g en eralement pas au m eme endroit que leur consommation et il faut donc les transporter. Mais comment transporter ces objets dun point X ` a un point Y? Il existe essentiellement trois techniques de transport de bases. La premi` ere consiste a porter directement un objet de X ` ` a Y sur toute la longueur du trajet. Mais, d` es que la distance devient longue et que la quantit e daaires ` a transporter devient importante, il sav` ere plus rentable dutiliser des moyens de transport m ecaniques qui permettent de transf erer de grandes masses dobjets sur de longues distances. Ces moyens vont du char ` a buf ` a lavion cargo, en passant par les v ehicules routiers, le chemin de fer, les bateaux et la brouette. Le probl` eme consiste alors ` a charger ces syst` emes de transport, cest-` a-dire ` a poser un probl` eme semblable mais sur des distances beaucoup plus petites, celles qui s eparent le point dorigine du lieu o` u se trouve le v ehicule. Soit on porte tout ` a la force de ses bras, soit on utilise des techniques interm ediaires permettant de transporter sur de plus courtes distances. Mais il existe une autre technique de transport qui ne peut seectuer qu` a plusieurs et qui consiste ` a faire la cha ne, cest-` a-dire ` a se passer un objet de mains en mains depuis son lieu dorigine jusqu` a sa destination. A la di erence des deux premi` eres techniques, lobjet nest pas port e par la m eme personne (ou par le m eme syst` eme de transport) pendant tout son trajet. Il est au contraire continuellement pass e` a un tiers, et cest son transfert dagent ` a agent qui assure son d eplacement. Cette technique suppose deux choses: quil existe un grand nombre dagents, dune part, et que le transfert de lobjet dun agent ` a un autre puisse seectuer de mani` ere ais ee, dautre part. Mais lorganisation dune cha ne, les gestes de transfert des objets n ecessitent une grande coordination des actions pour que les objets arrivent ` a bon port. Cette coordination peut etre d ecrite simplement ` a partir du comportement des agents r ecup erateurs de minerai vus pr ec edemment. Lorsquils vont du lieu dorigine (X) vers le lieu de destination (Y) et quils portent quelque chose, les agents transmettent leur charge ` a celui qui revient de Y les mains vides (Drogoul et Ferber 1992): R` egle explorer si je ne porte rien et je ne per cois aucun minerai et je ne per cois aucun agent avec du minerai alors explorer de mani` ere al eatoire
8.4. COORDINATION REACTIVE R` egle donnerUnCoupDeMain si je ne porte rien et je ne per cois aucun minerai et je per cois un agent avec du minerai alors proposer ` a lagent mes services et retourner ` a la base R` egle rapporter si je porte du minerai et je ne suis pas ` a la base et aucun agent ne me propose ses services alors retourner ` a la base R` egle echanger si je porte du minerai et je ne suis pas ` a la base et un agent me propose ses services alors donner mon chargement ` a lagent et retourner do` u je viens
445
Il est alors possible de constituer des cha nes dynamiques qui se forment d` es quil existe un tas de minerai ` a rapporter. Les agents qui reviennent donnent leur chargement ` a ceux qui vont vers la source et repartent charger. Mais en repartant, ils peuvent etre amen es ` a rencontrer des agents qui reviennent de la source et donc a ` prendre leur charge et ` a retourner vers la base. De ce fait, tr` es vite, les agents ne se d eplacent plus le long de lensemble du chemin, mais ne font qualler et venir sur de courtes distances. Un agent libre sempare de la charge dun agent porteur de minerai, la transporte jusqu` a trouver un agent libre et retourne vers la source de mani` ere continuelle. Si le nombre des agents devient plus important, les agents ne bougent plus de place et se contentent alors de transf erer leur charge dun voisin a ` lautre, cr eant ainsi une v eritable cha ne dagents. La gure 8.32 montre deux exemples de cha nes. Le premier (a) ne comprend quune seule cha ne puisquil ny a quune seule source de minerai, alors que le second (b) forme une fourche du fait de la pr esence de deux sources. On pourra noter que ces cha nes comprennent parfois des trous, des agents se d epla cant alors entre les segments. Lint er et de cette approche est de montrer quavec une toute petite modication du comportement des agents, il est possible de construire des structures de coordination poss edant des propri et es tr` es int eressantes, telles que celle de produire des structures stationnaires ouvertes, qui restent stables tant quelles sont approvisionn ees en el ements ext erieurs. Elles se comportent alors comme des structures autocatalytiques, cest-` a-dire des syst` emes ouverts qui restent stables en dehors de leur point d equilibre.
446
Minerai
Minerai
Base (a)
Base (b)
Figure 8.32: Un exemple de cha nes. La premi` ere (a) ne comprend quun seul bras, puisquil ny a quune seule source, alors que la seconde (b) forme une fourche vers chacune des sources.
8.5
R esolution par coordination : l eco-r esolution
Alors que toutes les techniques que nous venons de voir se chargent daider ` a la coordination des actions dagents d enis au pr ealable, nous allons voir quil est aussi possible dutiliser de telles approches pour r esoudre des probl` emes classiques en reformulant le probl` eme. L eco-r esolution, en particulier, est une m ethode de r esolution de probl` eme qui prend le contre-pied des techniques classiques. Plut ot que de formaliser un probl` eme de mani` ere globale et de d enir ensuite des m ethodes de r esolution sappliquant directement ` a sa d enition, on consid` ere quil est pr ef erable de reformuler le probl` eme de mani` ere quil soit con cu comme un ensemble dagents en interaction qui tentent de satisfaire individuellement leur propre but.
8.5.1
Principes de l eco-r esolution
Dans le cadre de l eco-r esolution, appr ehender un probl` eme, cest d enir une population dagents dont lensemble des comportements tend ` a aboutir ` a un etat stable, que lon appelle la solution du probl` eme. Chaque agent r epond aux principes dautonomie et de localit e, cest-` a-dire que les actions quil entreprend sont la cons equence ` a la fois de perceptions locales et des relations quil a etablies avec dautres agents. Au cours de leur comportement, ces agents eectuent parfois des actions particuli` eres qui, si elles sont m emoris ees, correspondent directement aux actions qui devraient etre eectu ees par un syst` eme centralis e (un programme de planication ou un individu) pour aboutir au r esultat. Le plan est alors obtenu comme un eet secondaire (un eet de bord disent les informaticiens) du comportement des agents. Les particularit es essentielles de cette approche sont les suivantes:
8.5. RESOLUTION PAR COORDINATION : LECO-R ESOLUTION
447
A. Il ny a pas dexploration globale de lespace des etats possibles du monde. Les etats du monde ne sont pas directement utilis es par l eco-r esolution. Seuls les etats internes des agents et leur relation perceptive avec lenvironnement sont pris en compte. B. Ces syst` emes r esistent tr` es bien au bruit. Une perturbation ne modie pas le m ecanisme de r esolution. En fait, une perturbation est presque une donn ee normale dans l evolution du syst` eme et se trouve donc prise en compte sans aucune dicult e. Cest dailleurs cette caract eristique qui rend tr` es int eressants ces syst` emes dans des univers evolutifs o` u de nouvelles informations arrivent en permanence. C. De ce fait, cette m ethode ne pr esente que tr` es peu dexplosion combinatoire, ce qui la rend capable de r esoudre des probl` emes de taille relativement plus importante. Eco est un mod` ele g en eral de syst` eme de r esolution de probl` emes fond e sur l ecor esolution, qui se compose de deux parties: 1. Un noyau qui d enit le protocole suivi par lensemble des agents. Ce noyau est absolument ind ependant du domaine du probl` eme ` a r esoudre. Il consiste en une d enition abstraite des agents du syst` eme, appel es eco-agents, et surtout des interactions entre les di erents comportements el ementaires des agents. Ces comportements tr` es simples peuvent etre d enis ` a laide dun automate d etat comme nous le verrons ci-dessous. 2. Une partie d ependante du domaine dapplication, o` u les comportements des agents sp eciques au domaine sont cod es.
8.5.2
Les eco-agents
Chaque agent dispose dun ensemble de comportements el ementaires pr ed enis qui lentra nent dans une qu ete perp etuelle dun etat de satisfaction. Dans cette recherche de satisfaction, ces agents peuvent etre g en es par dautres agents. Dans ce cas, ils agressent ces g eneurs, lesquels sont dans lobligation de fuir. Au cours de cette fuite, ils peuvent etre amen es ` a agresser dautres g eneurs qui les emp echent de fuir, cette op eration se poursuivant jusqu` a ce que les g eneurs se d eplacent eectivement. Structure des eco-agents Chaque eco-agent peut etre caract eris e par: Un but, cest-` a-dire un autre agent avec lequel il doit etre dans une relation particuli` ere, appel ee relation de satisfaction, pour quil soit satisfait. Un etat interne. Un eco-agent peut etre dans lun des trois etats internes suivants: satisfait, en recherche de satisfaction ou en recherche de fuite. Le passage dun etat ` a un autre est donn e par une table de transition caract eristique dun automate ` a etats nis (voir ci-dessous).
448
Des actions el ementaires, d ependantes du domaine, qui correspondent aux comportements de satisfaction et de fuite des agents. Une fonction de perception des g eneurs, cest-` a-dire de lensemble des agents qui emp echent lagent courant d etre satisfait ou de fuir. A cela, il faut ajouter le concept des d ependances tr` es souvent utilis e en Eco: Les d ependances sont les agents dont lagent courant est le but, et ces d ependances ne pourront etre dans l etat satisfait que si lagent courant se trouve lui-m eme satisfait. Ces d ependances sont produites par la d enition des buts, et donc par l etablissement des relations de satisfactions. On dit que A est directement d ependant de B si A est dans les d ependances de B (ou B est un but pour A). Etre d ependant de est une relation dordre partielle qui peut s enoncer ainsi: on dit que A d epend de B si B est directement d ependant de A ou sil existe un autre agent C tel que A soit directement d ependant de C et tel que C d epende de B. Comportement des eco-agents Les comportement el ementaires dun eco-agent sont ind ependants du domaine dapplication et leur interaction est d enie dans le noyau dEco. Ces comportements peuvent etre 6 d ecrits comme des proc edures . Voici la d enition simpli ee de ces fonctions : 1. La volont e d etre satisfait : Les eco-agents cherchent ` a se trouver dans un etat de satisfaction. Sil ne peuvent y parvenir, parce quemp ech es par quelques g eneurs, ils agressent ces derniers: Proc edure essayerSatisfaire(x) si le but de x est satisfait alors pour tous les agents y qui g^ enent x fuir(y, x, but(x)) d` es quil ny a plus de g^ eneurs, alors faireSatisfaction(x) La fonction faireSatisfaction est d ependante du domaine dapplication et doit etre adapt ee pour chaque type d eco-agent. Elle se charge dex ecuter lop eration dont le r esultat aura pour cons equence que lagent v erie sa condition de satisfaction. Cette action est rendue possible par la fuite de lensemble des g eneurs. 2. Lobligation de fuir : Lorsquun eco-agent est attaqu e, celui-ci doit fuir. Il doit alors chercher une situation qui satisfasse la contrainte c qui est pass ee en argument de la fonction fuir. Voici la d enition de cette fonction: Proc edure fuir(x, y, c) // x fuis y avec la contrainte c si x etait satisfait, x devient insatisfait
6 En fait, ces fonctions etant d ependantes dun type dagent, il est plus facile de les repr esenter comme des m ethodes dun langage objet.
8.5. RESOLUTION PAR COORDINATION : LECO-R ESOLUTION soit p := trouverPlacePourFuir(x,y,c) si P est NIL, alors "pas de solution", sinon pour tous les agents z qui g^ enent x dans sa fuite vers p, fuir(z, x, p) d` es quil ny a plus de g^ eneurs pour fuir, alors faireFuite(x,p)
449
Les fonctions trouverPlacePourFuir et faireFuite sont elles aussi d ependantes de lapplication. La premi` ere cherche une place dans lenvironnement o` u lagent peut fuir, et la seconde r ealise eectivement laction de fuite. Les eco-agents comme automates ` a etats nis Chaque eco-agent peut etre vu comme un automate ` a etats nis comprenant 4 etats, 2 entr ees et 3 sorties. Les etats de lautomate correspondent aux etats de satisfactions des eco-agents. Ces quatre etats sont la satisfaction (S), la recherche de satisfaction (RS), la recherche de fuite (RF) et la fuite (F)7 . L etat de d epart est RS. Les deux entr ees correspondent aux deux situations qui peuvent etre observ ees par un eco-agent: lagression par un autre agent et le fait davoir des g eneurs qui lemp echent daccomplir ses actions. Les commandes de sorties correspondent dune part aux actions el ementaires (faireFuite et faireSatisfaction) et dautre part a un message dagression envoy ` e ` a un autre agent. La gure 8.33 repr esente cet automate. Le graphe de lautomate est donn e 8.34. Chaque changement d etat est
Agression Geneur (x) Eco-agent FaireFuite FaireSatisfaction Agresser (x)
Figure 8.33: Repr esentation dun eco-agent sous la forme dun automate caract eris e par un couple de variables dentr ee <Agression, G^ eneurs>, o` u a et g d enotent des variables dentr ee ` a 1, et a, g des variables dentr ee ` a 0, la valeur x indiquant une indi erence. Une marque - indique quaucune action nest eectu ee en sortie.
8.5.3
Exemples simples d eco-probl` emes
Un eco-probl` eme est d eni par:

7 Il existe parfois des agents qui nont pas de buts. Dans ce cas, lautomate est l eg` erement di erent, car les agents ne cherchent pas ` a se satisfaire et ils ne poss` edent quun comportement de fuite.
450

ag,Agresser
RF ax, ax,
ag,FaireFuite ax,
ax,
ax,Agresser ax, RS ag,Agresser
ag,FaireSatisfaction
Figure 8.34: Le graphe des etats dun eco-agent 1. Un ensemble dagents, chaque agent etant caract eris e par un but et un comportement (compos e de lautomate et des actions el ementaires d ependantes de lapplication). 2. Une conguration initiale, d ecrite par un ensemble dagents plac es dans leur etat de d epart (RS). 3. Un crit` ere de terminaison d eni comme une fonction des etats de satisfaction des eco-agents. Dans la plupart des exemples suivants, ce crit` ere correspond ` a la satisfaction de tous les agents pr esents. De ce fait, l etape la plus complexe pour r esoudre un probl` eme en Eco est de d eterminer lensemble des agents et la mani` ere de les utiliser. Elle n ecessite une m ethode danalyse radicalement di erente de la r esolution de probl` eme classique. Alors que cette derni` ere utilise g en eralement des op erateurs de transition d etat, l eco-r esolution suppose que ce sont les entit es du monde et non les op erateurs qui interagissent. Ce type de d emarche est en fait ` a la r esolution de probl` emes et ` a la planication ce que la programmation par objet est ` a la programmation proc edurale. Ce ne sont plus les op erateurs qui sont le centre dint er et du syst` eme mais, au contraire, les objets sur lesquels portent ces actions. Les cubes Lexemple le plus simple et en m eme temps peut- etre le plus parlant est donn e par le probl` eme, bien connu en planication, du monde des cubes. Il sagit dinvertir deux cubes dans une pile, ce qui revient ` a echanger la valeur de 2 registres. Un cube ne
451
peut supporter quun seul cube et on ne prend quun seul cube ` a la fois. Supposons que lon d esire obtenir un etat (b) ` a partir dune conguration (a):
C B B
(a)
(b)
La solution classique consiste ` a explorer un ensemble d etats engendr e par lapplication de lensemble des op erations disponibles sur la conguration initiale, comme nous lavions d ecrit au chapitre 4. Si lon explore cet espace avec des op erateurs de type Strips, on est parfois conduit ` a des situations d echec, en particulier si lon a plac e le cube B sur C avant de s etre assur e que C soit sur A. Cet echec r eclame un retour en arri` ere de la part du planicateur, qui va essayer une autre issue. Pour pallier cet inconv enient, certains planicateurs modernes utilisent ou trouvent des heuristiques pour essayer deectuer le bon choix et donc limiter les retours en arri` ere. En revanche, dans le cadre de l eco-r esolution, la solution consiste ` a donner aux agents des conditions de satisfaction relatives ` a l etat nal qui doit etre engendr e: le cube A sera satisfait sil est sur la table, le cube B sil est sur C, le cube C sil se trouve sur A. Fuir consiste pour un cube ` a se poser sur la table. Lensemble des relations de satisfaction est donc: {sur(B,C), sur(A,Table), sur(C,B)} Do` u lon d eduit les relations de d ependance entre agents: {B d epend de C, C d epend de A, A d epend de Table} Sachant que la table est toujours satisfaite, on peut en d eduire que le cube A est satisfait. Restent les cubes B et C. Commen cons par C, puisque B d epend de C. B est un g eneur de C puisquil est un obstacle ` a la satisfaction directe de C. De ce fait, C demande ` a B de fuir. Mais C est alors un obstacle ` a la fuite de B, donc B demande a C de fuir. Ce dernier se pose sur la table, ce qui permet ` ` a B de fuir en se posant sur la table. C peut alors se poser sur A et devenir satisfait et B peut se poser alors sur C, terminant ainsi la solution du probl` eme. Il sut alors de m emoriser la trace de lex ecution des actions pour en d eduire un plan. Pour ecrire cet exemple et le r esoudre gr ace ` a Eco, la premi` ere chose ` a faire est didentier les di erents types d eco-agents, puis de leur associer une structure et enn de d enir les comportements d ependants de lapplication tels que faireFuite et faireSatisfaction. Dans le monde des cubes, il existe deux types dagents: les cubes et les surfaces dont la table est lunique exemplaire. On suppose quun cube ne peut soutenir quun seul cube et que les surfaces ont une place innie. Voici la d enition de ces types dagents: Type Cube Sous type de EcoAgent
452
CHAPTER 8. COORDINATION DACTIONS Champs auDessus : Cube auDessous : EcoAgent (Cube ou Surface) Proc edure faireSatisfaction(x:Cube) x.but.auDessus(x) x.auDessous.auDessus(nil) x.auDessous.but Proc edure faireFuite(x:Cube, p:EcoAgent) x.auDessous.auDessus(nil) x.auDessous := p
Proc edure satisfait?(x:Cube) si x.auDessous = x.but alors retourner(Vrai) sinon retourner(Faux) Proc edure trouverPlacePourFuir(x:Cube) retourner(Table) Voici maintenant les proc edures d enissant les g eneurs de fuite et de satisfaction. Un cube est g en e pour fuir sil existe un cube au-dessus de lui et il est g en e pour se satisfaire sil existe un cube sur lui ou sur son but: Proc edure g^ eneursFuite(x:Cube) si x.auDessus <> nil alors // on retourne la liste des g^ eneurs retourner(x.auDessus) sinon retourner(nil) // sinon rien Proc edure g^ eneursSatisfaction(x:Cube) local r r := x.auDessus ou x.but.auDessus si r <> nil alors retourner(r) sinon retourner(nil) La d enition des surfaces est beaucoup plus simple: elles sont toujours satisfaites et comme elles sont toujours libres (on suppose que la table est innie), elles ne poss` edent aucun g eneur. Type Surface Sous type de EcoAgent
8.5. RESOLUTION PAR COORDINATION : LECO-R ESOLUTION Proc edure satisfait?(x:Surface) retourner(Vrai)
453
On notera que toutes ces proc edures correspondent ` a des actions simples: elles nappellent aucune m ethode de r esolution (et, en particulier, elles nappellent pas le noyau dEco) et re` etent directement les donn ees du probl` emes. Les proc edures g^ eneursFuite et g^ eneursSatisfaction, notamment, d ecrivent directement les contraintes d enies dans le monde des cubes, ` a savoir quon ne peut poser un cube sur la table que sil est libre (il na aucun cube au dessus), et on ne peut poser un cube sur un autre cube que si les deux sont libres. Une proc edure en particulier m erite notre attention. Il sagit de trouverPlacePourFuir. Cette proc edure, qui est ici tr` es el ementaire puisquelle retourne toujours la table, est g en eralement la plus complexe ` a ecrire et celle o` u il est possible dajouter des heuristiques permettant des r esolutions plus rapides. Nous en verrons quelques-unes dans les exemples suivants. Les cubes avec contraintes Le probl` eme des cubes tel quil a et e d ecrit ici peut sembler trop facile. Il sut en eet de poser tous les cubes sur la table puis de les reposer un par un pour r esoudre le probl` eme. En revanche, si lon consid` ere que la taille de la table est limit ee, cest-` a-dire si le nombre de cubes quelle peut contenir est ni, le probl` eme nest plus aussi simple. Cette limitation entra ne des contraintes qui obligent ` a d efaire des situations, en supposant quun cube, pour fuir, peut etre amen e` a se poser sur un autre. Evidemment cette fuite peut provoquer une g ene suppl ementaire pour les autres cubes. La situation suivante en est un exemple. Pour atteindre la conguration nale, les cubes ne disposent que de trois places sur la table (g. 8.35). En (1), A cherche ` a se satisfaire (en allant sur E) et demande ` a B de fuir en lui donnant comme contrainte de ne pas se poser sur E. B peut fuir sur D et agresse C en lui interdisant daller sur D. Ainsi, en (2), A est bien libre, mais C lui bloque lacc` es ` a E et il doit de nouveau lagresser pour parvenir ` a son but. De la m eme fa con, en (3), B chasse C en lui interdisant A comme destination. La proc edure trouverPlacePourFuir renvoie pour ce probl` eme un des ecoagents en choisissant pr ef erentiellement un emplacement libre sur la table, puis un cube libre di erent de la contrainte pass ee lors de lagression. Cest la seule m ethode quil est n ecessaire de modier dans la d enition du probl` eme pr ec edent. Le code en est le suivant: Proc edure trouverPlacePourFuir(x: Cube, y:Cube) local ensemble : liste de EcoAgent ensemble := Table.emplacements pour tout z de ensemble si (z.sur) = nil alors retourner z // on parcourt lensemble des cubes pour tout z de EnsembleDesCubes si (z.sur) = nil et (z <> y) et
454

E D C B A D C B A E
C B A D E
2
B A D C E
C B D A E
4
C D
B A E
Figure 8.35: Un probl` eme de cubes contraint. La table ne peut recevoir que trois piles de cubes. (z <> contrainte) // contrainte provenant de lagression alors retourner(z) retourner(nil) // pas de place pour fuir Les tours de Hano Le probl` eme des tours de Hano , dans lequel une tour de disques doit etre d eplac ee dun piquet ` a un autre sans quun disque ne soit jamais pos e sur un autre disque de taille inf erieure, h erite directement du probl` eme des cubes avec contraintes. En eet, il sagit l` a dun cas particulier du probl` eme dans lequel une contrainte suppl ementaire est ajout ee lors de la recherche dune place pour fuir. On voit ainsi emerger la notion de famille de probl` emes dont les membres sont des eco-agents ayant des comportements similaires. On traite ce probl` eme de mani` ere semblable ` a la technique des cubes avec contraintes. Les deux classes dagents sont (naturellement) les disques et les tours, ces derniers etant satisfaits en permanence. Les disques sont satisfaits sils reposent sur un disque de taille imm ediatement sup erieure, ou sur une tour libre. Leur comportement se borne aux deux r eactions classiques: 1. Comportement de satisfaction: aller sur un disque de taille imm ediatement sup erieure. 2. Comportement de fuite: aller sur une autre tour. Mais cette r eaction a comme contrainte le fait de ne pas aller sur la tour sur laquelle lagresseur (le disque qui provoque la fuite) veut aller. Cette contrainte permet ainsi d eliminer les probl` emes de conits qui pourraient survenir si le disque sup erieur allait ` a lendroit o` u le disque inf erieur voulait aller.
455
De plus, d` es que lacte dagression est termin e, et donc que lobjet de la fuite dispara t, la r eaction de satisfaction se remet en place. Le disque A a comme but (condition de satisfaction) daller sur le disque 3. Pour cela il agresse le disque B en lui interdisant daller en 3. De ce fait, B veut sen aller en 2. Comme il est g en e, il agresse le disque C en lui interdisant daller en 1. De ce fait, le disque C ne peut aller quen 3. Une fois plac e, il indique ` a B quil peut se d eplacer et B se place en 2. Il indique alors quil a ni son agression envers C et C vient se replacer sur B, de plus il donne comme continuation le fait dindiquer ` a A quil peut maintenant se d eplacer. De ce fait, A se place en 3 et pr ecise quil a termin e son agression envers B. De ce fait, B veut se placer sur A, mais comme il est g en e, il est oblig e dagresser C en lui interdisant daller sur la tour 3. C va en 1, ce qui lib` ere B qui va sur A. B enl` eve son agression envers C, et C peut se placer sur B, ce qui r esout enti` erement le probl` eme, les trois disques etant satisfaits. A lanalyse de la trace ci-dessus on constate que la solution obtenue correspond directement ` a lalgorithme classique des tours de Hano . Cette remarque a et e observ ee directement ` a partir de lanalyse du comportement des tours, et navait pas et e imagin ee auparavant: cest en regardant le fonctionnement du syst` eme que cette correspondance a et e mise ` a jour, et non ` a partir dune volont e a priori de r ealiser la m eme op eration. Devant une telle constatation, on ne peut semp echer de formuler un certain nombre de remarques et questions et, en particulier, celles-ci: Quelle est la nature du lien entre le comportement d eni et lalgorithme? Est-ce que cet algorithme est un etat stable de comportement, ou bien na-t-on pas programm e lalgorithme de mani` ere d eguis ee, ou enn sagit-il simplement dune co ncidence pour cet exemple-l` a, la correspondance ne se g en eralisant pas? En fait, le probl` eme des tours de Hano est tr` es contraint, et toute solution passe soit par une exploration despaces d etats avec retour en arri` ere, soit par un comportement qui est n ecessairement celui de lalgorithme: il nexiste pas dalternative. Si, par contre, on diminue les contraintes associ ees ` a ce jeu (en augmentant le nombre de piquets par exemple) le comportement s eloigne alors de lalgorithme parfait, et des variantes commencent ` a appara tre. Par exemple, si lon utilise 4 piquets avec seulement 3 disques, lalgorithme le plus parfait consiste ` a placer le disque C sur la tour 2, le disque B sur la tour 3, puis le disque A sur la tour 4 et enn ` a empiler tous les disques les uns apr` es les autres dans le bon ordre (g. 8.36).
1 2 3 4
3 1 2
A C B
Figure 8.36: Dans un probl` eme de tour de Hano ` a plus de trois piquets, Eco utilise automatiquement toute la place qui lui est disponible. L etude de syst` emes aussi simples que celui des cubes ou des tours de Hano montre lint er et de ce type de technique, mais aussi ses limites, puisquon nest
456
pas certain a priori dobtenir un plan optimal. Cependant, il serait certainement possible dy int egrer des techniques dapprentissage an de modier localement et incr ementalement les comportements des agents et, en particulier, la coordination des di erentes r eactions.
Le taquin Bien plus que les tours de Hano , le taquin a inspir e nombre d etudes en planication. Son univers parfaitement d elimit e, g en erant des contraintes evidentes, est en eet particuli` erement propice ` a lexploration de domaines d etats ou darborescences. Les travaux les plus aboutis ` a ce jour, non seulement en terme de r eduction de la complexit e des recherches, mais aussi en terme de r esultats empiriques, sont ceux de R.E. Korf, commenc es en 1985 avec lutilisation de lalgorithme IDA* (IterativeDeepening A*) (Korf 1985), et poursuivis avec les algorithmes de recherche RTA* (Real-Time A*) et ses successeurs, dont notamment LRTA* (Learning Real-Time A*) (Korf 1988). Pour r eussis et int eressants quils soient, ces travaux nen sont pas moins d` eles ` a la ligne directrice qui, depuis le d ebut, sous-tend toute tentative de r esolution du probl` eme du taquin: lexploration plus ou moins profonde de domaines d etats guid es par une technique heuristique. La r ealisation du taquin a montr e que, m eme si la complexit e des fonctions relatives au probl` eme augmente consid erablement, il nest pas n ecessaire de modier les fonctions du noyau dEco. Les algorithmes utilis es sont lin eaires en nombre de cases du taquin, aussi la complexit e cro t-elle lin eairement avec la taille du taquin. De plus cette impl ementation en Eco ouvre des possibilit es suppl ementaires (telles le taquin ` a cases vides multiples, le passage imm ediat dune taille de taquin ` a une autre, la r esolution de taquins non carr es, etc.), ce qui nest pas du tout le cas des approches exploratoires pr ecit ees. Pour r esoudre ce probl` eme en Eco, on consid` ere que les cases comme les palets sont des eco-agents. Alors que les premiers sont toujours satisfaits (les cases sont immobiles), les seconds ne le sont que sils se trouvent sur la case correspondant ` a la conguration d esir ee. Par exemple, le palet marqu e de la lettre A ne sera satisfait que sil se trouve sur la case de coordonn ee (1,1). La fonction trouverPlacePourFuir est ici un peu plus compliqu ee, car elle doit estimer quel palet il faut agresser pour fuir. On trouvera une d enition pr ecise de lalgorithme, ainsi quune preuve de la compl etude et de la d ecidabilit e de la solution quelle que soit la taille du taquin dans (Drogoul et Dubreuil 1992). Comme exemple de la souplesse du mod` ele, voici la r esolution du probl` eme des coins : le palet A veut prendre la place de E pour compl eter la premi` ere ligne (g. 8.37). Ce m ecanisme, qui utilise les propri et es g en erales du probl` eme, permet de r esoudre des taquins de tr` es grande taille, dont certains navaient jamais et e r esolus a cause du co ` ut du calcul. Le tableau 8.38 montre les performances moyennes du syst` eme en fonction de la taille du taquin, chaque exemple etant r esolu 100 fois. Le chronom etrage a et e eectu e sur une version dEco ecrite en Smalltalk-80 4.1, tournant sur une station de travail Sun Sparc 10 sans achage graphique.
457
Palet bloqu Palet actif
A agresse E en lui passant comme contrainte de ne pas toucher B (B est le palet dont "dpend" A). E n'a plus comme solution que d'agresser A.
A ragresse E en lui passant comme contrainte, cette fois, de ne pas fuir sur le blanc (son but). E agresse donc F. Sont successivement agresss: I, K, G, C et B
4
A agresse maintenant B qui occupe son but sans lui passer aucune contrainte B agresse donc C, qui agresse G, etc...
B, C, G, K, I, F et E ayant boug, A agresse le blanc en vue de se satisfaire. Le blanc fuit en changeant sa place avec le palet qui l'agresse.
Figure 8.37: Le probl` eme des coins dans le taquin, tel quil est g er e dans Eco
458
Configuration
Largeur Palets Temps moyen

Solution
Longueur Moyenne 48,90 142,10 283,00 482,00 746,30 1 109,20 1 455,20 1 947,70 2 483,10 2 889,10 3 361,90 4 199,70 4 881,50 5 581,90 6 267,10 6 947,60 7 797,20 9 004,70 9 882,00 11 093,70 12 404,00 13 340,10 15 181,20 16 514,00 18 496,80 19 999,40 21 229,20 23 009,00 Longueur par Palet 6,11 9,47 11,79 13,77 15,55 17,61 18,19 19,67 20,69 20,20 20,01 21,54 21,79 21,89 21,76 21,51 21,66 22,57 22,46 22,97 23,49 23,20 24,33 24,47 25,41 25,54 25,27 25,59
n
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
N
8 15 24 35 48 63 80 99 120 143 168 195 224 255 288 323 360 399 440 483 528 575 624 675 728 783 840 899
Secondes
0,2218 0,7547 2,4812 4,5146 9,6559 17,027 23,1532 35,4682 52,7616 65,7846 86,7198 106,9209 116,4785 165,8702 204,4582 230,687 271,5735 292,0156 340,8768 415,1151 477,3549 544,9122 625,5805 655,0309 782,0069 897,6368 1036,3034 1179,58
Nombre de Mouvements
Figure 8.38: R esultats exp erimentaux de la r esolution du Taquin. Les valeurs sont des moyennes sur 100 exp erimentations pour chaque exemple (dapr` es (Drogoul 1993)).
8.5.4
Univers evolutifs
Les possibilit es dEco ne se limitent pas ` a la r esolution de probl` emes. Il sest r ev el e etre un outil particuli` erement bien adapt e` a la simulation dunivers evolutifs. Comme nous lavons signal e pr ec edemment, les m ethodes combinatoires sont tr` es sensibles aux perturbations. Au contraire, dans un syst` eme d eco-agents, une perturbation ext erieure est trait ee exactement comme nimporte quelle autre donn ee du probl` eme: tout agent qui per coit la perturbation y r eagit localement, selon ce que lui dicte son comportement. Cest dans cette optique qua et e impl ement e le probl` eme du Misachieving baby (Schoppers 1987): Lors de la r esolution dun probl` eme du monde des cubes, un b eb e malfaisant d eplace des cubes, des parties de piles, voire des piles enti` eres ` a sa guise (g. 8.39). Par exemple, dans la situation (1), le cube B na qu` a se poser sur C pour achever la pile d esir ee. Cest alors que le b eb e intervient et d eplace la pile compos ee des cubes A et C et la pose sur B (2). Le cube A nest plus satisfait et B est maintenant oblig e dagresser les cubes au-dessus de lui pour pouvoir atteindre son but. Du point de vue de lutilisateur, la d enition du probl` eme nest pas di erente de celui des cubes examin e pr ec edemment. Cest le noyau dEco qui prend en charge la dynamique du syst` eme en g erant le changement des conditions: il sut simplement

D C B A B C A D
459
C A D B
2
D
C A B
Figure 8.39: Dans un probl` eme de cubes, un b eb e malicieux vient perturber une pile de cubes. de mettre ` a jour l etat de satisfaction (le cube A nest plus satisfait) et surtout de r einitialiser les g eneurs et les fuyards, en consid erant que la situation r esultante de laction du b eb e malicieux est une nouvelle situation initiale. Le graphique de la gure 8.40 montre la moyenne du nombre de d eplacements des cubes (sans compter ceux qui sont eectu es par le b eb e) en fonction de la p eriode (P) des perturbations. A chaque activation dun cube, le b eb e avait une chance sur P de provoquer une perturbation. Le probl` eme ` a r esoudre, d ecrit ci-dessus, demande 6 d eplacements sil ny a aucune perturbation. Lop eration a et e r ep et ee 100 fois pour chaque valeur de P.
40 35 30 25 Nombre de 20 Dplacements 15 10 5 0 1 2 3 4 5 6 7 8 9 10
Priode des perturbations
Figure 8.40: Le nombre de d eplacements de cubes n ecessaires en fonction de la p eriode des perturbations P On constate que m eme si la p eriode des perturbations diminue, la solution est rapidement atteinte. Quand le rythme des perturbations est plus elev e que celui des actions des cubes (P < 2), le syst` eme parvient tout de m eme ` a son etat nal lorsqu` a un moment (statistiquement dautant plus eloign e dans le temps que P est proche de 1), les perturbations naectent plus que des agents non satisfaits. Dautre part, on peut expliquer la grande r eussite dEco par le fait que les perturbations sont parfois positives: le b eb e peut placer des cubes dans leur etat de satisfaction de mani` ere al eatoire. Si le b eb e continue ses interventions une fois la conguration
460
nale atteinte, le syst` eme va naturellement retrouver son etat d equilibre, ce qui tend ` a faire osciller le syst` eme autour de cet etat. Eco induit ainsi naturellement un comportement de syst` eme hom eostatique.
8.5.5
Formalisation
Il est possible de donner une formalisation dEco ` a partir dun crit` ere permettant de savoir si une suite dop erations a bien abouti au but d esir e. La probl ematique de la planication a et e tout particuli` erement etudi ee par Chapman (Chapman 1987), lequel pr esente tout ` a la fois un mod` ele formel de la planication, un crit` ere permettant de d eterminer la validit e des plans et un planicateur con cu comme une r ealisation calculatoire de ce crit` ere. Lid ee g en erale est de d ecrire une condition permettant de d ecider si une proposition, consid er ee comme une description de l etat nal, peut etre etablie par une suite dop erateurs de type Strips. Il est possible dadapter ce crit` ere ` a l eco-r esolution, en consid erant les op erateurs de satisfaction et de fuite comme m ecanisme principal de construction de plan. Soit A = {a1 , ..., an } un ensemble dagents qui doivent etre satisfaits pour que le probl` eme soit consid er e comme r esolu, un ensemble d etat du monde, et si lon nomme Sat(ai , ) laction de satisfaction de lagent ai conduisant ` a l etat , et F uite(ai , ) laction de fuite, alors ce crit` ere peut etre d eni ainsi (Bura et al. 1991): Crit` ere de satisfaction: La satisfaction dun agent ai peut etre arm ee dans l etat du monde nal f , sil est arm e directement dans l etat nal, ou sil a et e arm e dans un etat pr ec edent n et quil a et e conduit ` a fuir dans aucun etat b entre l etat p et f . Pour chaque etat b o` u lagent a et e conduit ` a fuir, il doit y avoir un etat a entre l etat b et l etat f qui resatisfasse cet agent. Pour chaque etat o` u un agent doit fuir et peut etre satisfait simultan ement, lagent eectue alors lop eration qui le conduit ` a la satisfaction. Voici une traduction plus formelle de ce crit` ere: ai A, , Sat(ai , p ) (b , (p b ) F uite(ai , b ) ((a , (p b ) Sat(ai , a )) Sat(ai , b ))) Ce crit` ere permet de comprendre comment fonctionne Eco dans les cas pr ec edents: par exemple, dans le monde des cubes (cubes contraints, tour de Hano ...), les d ependances entre agents forment un ordre partiel tel que pour satisfaire un agent, il sut de d eplacer tous les g eneurs qui se trouvent entre lagent qui cherche ` a se satisfaire et son but, cest-` a-dire un agent d ej` a satisfait. Comme le d eplacement de ces g eneurs ne modie pas le statut des agents d ej` a satisfaits (il sut de d eplacer tous les cubes qui g enent sur dautres empilements), il sensuit que le crit` ere de v erit e est v eri e. Cela signie que Eco sait d enir un plan daction pour tous les probl` emes dont la situation nale peut etre donn ee sous la forme dune structure arborescente. Cest en particulier vrai pour lassemblage des structures donn ees en kit, qui supposent que tous les el ements sembo tent les uns sur les autres. La g en eralisation ` a des structures de d ependance plus complexes est en cours.
461
8.5.6
R esolution de contraintes par eco-r esolution
Les techniques r eactives ne se limitent pas ` a la planication daction. Il est possible de les utiliser pour r esoudre dautres probl` emes tels que ceux que lon rencontre dans le domaine de la satisfaction de contraintes. Comment, par exemple, placer au mieux un ensemble de t aches sur un ensemble de machines? Comment constituer un emploi du temps pour un coll` ege, lorsquil nexiste pas n ecessairement une solution satisfaisant ` a la fois toutes les contraintes p edagogiques et les pr ef erences des professeurs? R esoudre ces types de probl` emes est du ressort de la satisfaction de contraintes. Les probl` emes de contraintes mettent en pr esence deux types dentit es: les variables et les contraintes. R esoudre un probl` eme de satisfaction de contraintes, cest trouver une assignation de valeurs pour les variables qui satisfasse les contraintes. Par exemple, r esoudre le syst` eme d equations suivant: 3 X + Y = Z, Z > 2 X, 4 X < 2 Y dans lequel X , Y et Z sont des variables enti` eres d enies dans le domaine [1, 10], cest trouver lensemble des valeurs qui satisfont ces contraintes. Un syst` eme de satisfaction de contraintes donnerait ainsi les solutions: X=1, X=1, X=1, X=1, X=1, Y=3, Y=4, Y=5, Y=6, Y=7, Z=6 Z=7 Z=8 Z=9 Z=10
Pour une bonne introduction aux probl` emes de satisfaction de contraintes, et en particulier ` a la programmation par contraintes, on pourra se r ef erer ` a (Fron 1994). La gure 8.41 montre un r eseau de contraintes pour le probl` eme pr ec edent.
X 4 2 3
<
1
Variables
<
2 Y 1
Contraintes
Figure 8.41: Un petit r eseau de contraintes r esolvant le syst` eme d equation ` a trois inconnues d eni plus haut En partant dun point de vue initialement tr` es di erent de celui des techniques classiques fond ees sur la propagation de contraintes et l enum eration implicite de solutions, K. Ghedira a d evelopp e une m ethode originale de r esolution de contraintes qui associe l eco-r esolution et le recuit simul e (Ghedira 1993; Ghedira 1994). Lid ee g en erale consiste ` a consid erer les variables et les contraintes comme des eco-agents qui cherchent ` a trouver un etat de satisfaction.
462 Les contraintes
Une contrainte est satisfaite si sa relation associ ee est v eri ee. Autrement, une contrainte insatisfaite demande ` a lune de ses variables de changer de valeur. Le graphe d etat dune contrainte est donn e gure 8.42.a et comprend 4 etats principaux: non-instanci ee, instanci ee-satisfaite, instanti ee-insatisfaite et en-attente. La premi` ere correspond ` a un etat dans lequel des variables associ ees a la contrainte ne sont pas encore instanci ` ees, la seconde ` a une situation o` u la contrainte est ` a la fois instanci ee et satisfaite, la troisi` eme au cas o` u elle est ` a la fois instanci ee mais non satisfaite et la quatri` eme ` a une situation interm ediaire o` u la contrainte attend le verdict dune variable.
non-instancie
non-instancie
instancie-satisfaite
en-attente en-attente
instancie-insatisfaite
(b) (a)
instancie
Figure 8.42: Le diagramme des etats dune contrainte (a) et dune variable (b)
Les variables Les variables tentent de trouver des valeurs appartenant ` a leur domaine de d enition. Lorsquon lui demande de changer de valeur, une variable choisit al eatoirement une valeur de son domaine de d enition et demande ` a ses contraintes leur opinion, cesta-dire si ces valeurs les satisfont ou non. A partir de toutes ces r ` eponses, elle d ecide daccepter ou non cette valeur en fonction dun crit` ere de choix d ependant dun m ecanisme fond e sur la notion de recuit simul e. La gure 8.42.b montre le graphe de transition dune variable. La fonction de d ecision est fond ee sur le processus suivant: soit i, la valeur courante dune variable v et j la nouvelle valeur, soit S (i) le nombre de ses contraintes satisfaites, la variable choisira la valeur j si: S (j ) S (i) S (j ) < S (i) et Rand(0, 1) < e
S (j )S (i) T (k.v )
et d ecidera de garder la valeur i autrement. La fonction Rand(0, 1) choisit une valeur al eatoire entre 0 et 1 et la fonction T (k, v ) d etermine la tol erance dacceptation de la variable v au temps k . An de restreindre au fur et ` a mesure les choix dune variable, sa tol erance d ecro t r eguli` erement avec le temps: T (k + 1, v ) = T (k, v ) 1,
463
la valeur initiale de la fonction T d ependant du nombre de contraintes associ ees a ` la variable v . De ce fait, plus une variable a d ej` a eectu e des choix, moins elle aura tendance ` a accepter une valeur qui satisfait un moins grand nombre de contraintes. Elle restera de plus en plus g ee sur ses choix ant erieurs, comme si elle se gelait avec le temps. Lint er et de cette m ethode est de pouvoir facilement se g en eraliser ` a des situations de satisfactions partielles, cest-` a-dire de probl` emes pour lesquels il nexiste aucune solution globale, et de trouver rapidement une solution. De plus, des travaux th eoriques montrent quelle est capable de donner la solution optimale. Enn, des modications l eg` eres de lensemble des contraintes ne remettent pas en cause lensemble des situations d ej` a trouv ees. Les insatisfactions se propageront de proche en proche aux variables et aux autres contraintes, et le syst` eme privil egiera donc les solutions proches des solutions d ej` a trouv ees. Une autre approche fond ee sur une conception distribu ee de la satisfaction de probl` emes a et e propos ee dans (Liu et Sycara 1993), mais elle ne semble pas orir, pour linstant, daussi bons r esultats que celle de K. Ghedira. Quoi quil en soit, lutilisation de la coordination dagents comme m ecanisme de r esolution ouvre de nouvelles perspectives dans les techniques de r esolution de probl` emes.
464
Chapter 9 Conclusion
La k en etique propose une vision nouvelle ` a la fois de la construction des logiciels informatiques, mais aussi, et cest ce que jai voulu montrer tout au long de cet ouvrage, de la r esolution de probl` emes qui ne sappuie plus sur une vision centralis ee du monde et de lindividu mais qui pense tout comme interaction et comme emergence de fonctionnalit es li ees ` a ces interactions. Les syst` emes multi-agents proposent une r evolution tranquille, un simple changement dattitude et de perspective, mais dont les cons equences sont radicales. Le fait dignorer volontairement les solutions globales au prot de visions purement locales suppose encore une certaine ouverture desprit, car tout notre enseignement, tous les paradigmes dominants posent encore le global comme le seul moyen de r esoudre les probl` emes. Mais la complexit e du monde, et en particulier des syst` emes informatiques, est maintenant telle que seules les perspectives qui mettent en avant des conceptions locales et qui pr onent avant tout la capacit e d emergence et dauto-organisation de ces syst` emes seront capables dapporter des r eponses viables et ecaces. Jai d ej` a particip e, en tant que chercheur et enseignant, ` a la r evolution apport ee par la programmation par objets. Mais il faut aller encore un peu plus loin et donner aux composants logiciels lautonomie comportementale dont ils ont besoin. Et ce nest qu` a ce prix que lon pourra eectivement r ealiser ces syst` emes ouverts, communicants et interactifs.
Un peu dhistoire anticip ee...

Quel est le futur des logiciels, et quelle sera la structure des programmes de demain? Pour le savoir, projetons-nous un peu dans le futur, en 2045 par exemple. Voil` a ce que nous lirons dans un magazine dinformatique (penser ` a Byte ou au Dr Dobbs 1 Journal) ` a cette epoque . La structure des programmes du vingti` eme si` ecle nous semble maintenant bien etrange. Seuls quelques individus de murs d esu` etes programment encore comme nos grands-parents. Comment ne pas sourire ` a la vision de ces etranges syst` emes
1 Javais publi e ce texte en 1989 (Ferber 1989) dans ma th` ese dEtat. Je le pr esentais alors comme de la science-ction. Je pense maintenant quil est le prolongement logique des travaux d ecrits ici et quil sagit dune perspective pr evisible du futur g enie logiciel.
466
CHAPTER 9. CONCLUSION
qui s eparaient arbitrairement les donn ees du code, qui sexprimaient de mani` ere s equentielle, tordant lesprit humain pour quil sadapte ` a la machine. On aboutissait ` a des logiciels quasiment incapables de sadapter ` a un contexte en constante mutation. L evolution etait impossible, si ce nest au prix de co uteuses manipulations de code, qui obligeaient parfois les programmeurs ` a tout recommencer. Dans ces temps-l` a, un logiciel etait une chose inerte, manipul ee de lext erieur, sans comportement propre. Certains cherchaient ` a xer ces programmes dans une rigidit e voisine du cristal. On appelait cela sp ecier et prouver des programmes. Evidemment, les logiciels r ealis es avec des techniques de sp ecication et de synth` ese de programmes sex ecutaient de mani` ere correcte, mais les probl` emes etaient report es ailleurs: dans l elaboration des sp ecications qui exigeaient des programmeurs une gymnastique mentale au moins aussi complexe que celle de la programmation et, surtout, dans la tr` es grande dicult e de faire evoluer le logiciel, toute modication n ecessitant un travail consid erable pour veiller ` a lind ependance des transformations apport ees. Programmer etait alors un art, qui r eclamait du doigt e et du savoir-faire, an d eviter ce que lon appelait ` a l epoque un bug, cest-` a-dire une erreur de programme. Les bugs, qui ont disparu aujourdhui le Silicium Museum en conserve quelques int eressants et rares exemplaires etaient langoisse des programmeurs, car leur pr esence pouvait totalement arr eter le programme. Ils ne savaient pas comment engendrer un logiciel par auto-organisation! Ils ne connaissaient pas les techniques li ees ` a l emergence! Ils ne savaient pas utiliser linteraction avec lenvironnement comme facteur de complexication et dadaptation! Leur technique etait rudimentaire ` a lextr eme, et ils nous apparaissent aujourdhui comme relevant dun age presque ant ediluvien. Aujourdhui, heureusement, il nen est plus de m eme. Les programmes sont devenus des entit es quasi vivantes, form ees dun nombre gigantesque de petites unit es ind ependantes et dou ees dune certaine autonomie, qui communiquent entre elles, sorganisent, se r eorganisent, se complexient et sadaptent ` a leur environnement, an daccomplir les t aches qui leur sont imparties. Cette architecture est complexe et sans cesse remise en question par lensemble des unit es organis ees en colonies, lesquelles pr esentent de nombreuses analogies tant avec la structure neuronique du cerveau quavec celle dune soci et e animale ou humaine. On fait ainsi pousser des programmes, comme on fait pousser des plantes ou comme on el` eve un animal. Pour disposer dune application, il sut de placer une souche dans une architecture informatique et de la mettre en interaction avec dautres agents (programmes et/ou etres humains) dans un environnement ad equat, pour quils sadaptent et r ealisent les t aches pour lesquelles ils sont sp ecialis es. Il est possible ensuite de greer des programmes, cest-` a-dire de les agr eger an quils coop` erent et que le r esultat ne soit pas seulement la somme des deux programmes, mais le produit dune alchimie particuli` ere li ee aux interactions qui ont lieu entre les deux morceaux initiaux. On obtient alors un logiciel original, qui na plus que de lointaines ressemblances avec ceux dont il est issu, un peu comme un enfant par rapport ` a ses parents. Dans le m eme journal, on peut lire la publicit e suivante: Nouveau: souche de logiciel ` a prise rapide pour lorganisation et le man-
467 agement des PME Cette souche permet le d eveloppement dun multi-organisateur int egr e qui prend en charge la prise de d ecision, la gestion et la communication dans lentreprise. Elle sadapte ` a toute architecture Hyper Compatible disposant dau moins 3 millions de Giga EO virtuels2 . Elle sinstalle tr` es simplement dans lappareil. Comme pour les souches ordinaires, il sut de lui donner de plus en plus de travail ` a eectuer, an quelle apprenne sa t ache et sadapte ` a vos besoins. Sa nouvelle organisation Multi World, qui lui procure des simulations dinteractions hypoth etiques internes, lui permet d etre totalement op erationnelle au bout de seulement quinze jours au lieu de deux mois avec les souches ordinaires. Cette souche r evolutionnaire sint egre naturellement ` a toutes celles disposant dun m ecanisme d eco-h et ero-adaptation. En lan 2045, tout ce qui constitue notre culture informatique actuelle sera d epass e. Lintelligence articielle nexistera peut- etre plus en tant que discipline a part, si ce nest comme ` etude de la psycho-socio-biologie des artefacts. Elle sera totalement fusionn ee et amalgam ee avec tous les secteurs de linformatique et en collaboration avec les sciences physiques, biologiques, sociales et psychologiques. La structure des ordinateurs aura chang e. La notion m eme de processeur central aura totalement disparu. Chaque ordinateur sera constitu e de plusieurs milliers de petits processeurs travaillant ensemble, constituant ainsi le milieu dans lequel les petites entit es des programmes evolueront. Cette vision du futur suppose que les logiciels puissent coop erer harmonieusement avec nous en sins erant directement dans lensemble de nos activit es. Ils apprendront en nous observant (mais pas en nous contr olant, il ne sagit pas de cr eer Big Brother) et sint egreront de plus en plus dans les processus de traitement, dans les t aches de routines, mais aussi pour nous aider ` a prendre rapidement et ecacement des d ecisions. A linstar des humains, qui apprennent par osmose, cest-` a-dire par confrontation avec la r ealit e, en imitant, en essayant et en modiant des comportements pour voir ce que ca fait, les logiciels de lavenir devront etre en contact avec nous, en regardant et en apprenant ` a partir des ux dinformations qui circulent normalement entre les humains. Simples outils aujourdhui, collaborateurs de demain, les agents informatiques nous seront aussi indispensables quune calculette ou, pour certains, quun ordinateur portable. Ces agents, en voyant circuler des informations, en sadaptant au fonctionnement des etres humains (qui en retour saccommoderont eux aussi des comportements des agents informatiques), se r eorganiseront et se restructureront dynamiquement pour sam eliorer et sadapter aux conditions de leur environnement. Ce type de syst` eme verra alors l emergence dun ecosyst` eme de nature compl` etement nouvelle, form e dune population hybride dagents humains et informatiques, qui seront amen es ` a cohabiter pour, tout simplement, accomplir leurs destins et vivre.
2 les EO sont des Equivalents Octets, une mesure utilis ee pour d ecrire des organisations m emoires.
468
CHAPTER 9. CONCLUSION
Appendix A BRIC
Bric (Block-like Representation of Interactive Components) est un langage de haut niveau permettant de concevoir et de r ealiser des syst` emes multi-agents ` a partir dune approche modulaire. Un syst` eme Bric comprend un ensemble de composants reli es entre eux par des liens de communication. Nous naborderons ici que les el ements n ecessaires ` a la compr ehension des composants d ecrits dans cet ouvrage. Dautres extensions de Bric sont possibles mais nous ne les d ecrirons pas ici.
A.1
Les composants
Un composant Bric est une structure logicielle caract eris ee ext erieurement par un certain nombre de bornes dentr ees et de sorties et de mani` ere interne par un ensemble de composants. Les bornes dentr ees et de sorties jouent le r ole dinterface en recevant ou en transmettant des messages vers lext erieur (g. A.1). Tout composant est instance dune classe qui d ecrit sa structure interne. Les classes servent donc, ` a limage des langages objets, ` a r eunir toutes les informations communes ` a un ensemble de composants semblables.
Bornes d'entres Composant Bornes de sortie
Bornes de sortie
Bornes d'entres
Figure A.1: Structure dun composant et de ses bornes Le comportement de ces composants peut etre d eni soit par lassemblage dautres composants dont le comportement est d ej` a sp eci e, et on parle alors de composants structur es, soit directement par linterm ediaire dun r eseau de Petri associ e. Dans ce dernier cas, on dira quil sagit de composants el ementaires. Enn, il
470
APPENDIX A. BRIC
est aussi possible dintroduire des composants primitifs dont le comportement nest pas d ecrit par un r eseau de Petri, mais dont lint er et est de prendre en charge des fonctionnalit es externes ` a lagent ou au syst` eme.
A.2
Composants composites
Un composant structur e est d eni par lensemble des sous-composants qui le compose. Les bornes dentr ees du composant structur e sont li ees aux bornes dentr ees des sous-composants. On peut aussi fusionner les bornes dentr ees (et de sorties) des composants composites avec ses sous-composants, comme le montre la gure A.2.
Figure A.2: Un composant composite
A.3
Constitution des composants el ementaires
Les composants el ementaires ont leur comportement d ecrit en termes de r eseaux de Petri. Le formalisme de r eseau normalement utilis e en Bric est celui des r eseaux de Petri color es avec arcs inhibiteurs. Mais dautres formalismes, tels que celui des r eseaux synchrones ou des r eseaux temporis es, peuvent etre employ es.
b 1,..,bk i 1,..,i m ...
a 1,..,an
...
...
f1(a1,..,an ,b1,..,bk )
E P
fr (a1,..,an ,b1,..,bk )
...
Figure A.3: Forme g en erale dune transition dans le formalisme Bric
EMENTAIRES A.3. CONSTITUTION DES COMPOSANTS EL
471
La forme g en erale dune transition est repr esent ee gure A.3. Une transition est d enie par des arcs entrants, des arcs sortants et une pr econdition dactivation.
a) Les arcs entrants associent une place ` a une transition. Ils sont porteurs dune condition sous la forme dune description de marque, cette description comprenant des variables. Lorsque la place contient une marque correspondant ` a cette description, larc est valid e. Il existe trois cat egories darcs entrants:
1. Les arcs standard, not es a1 , .., an , ne d eclenchent la transition que sils sont tous valid es. Ces arcs consomment les marques qui servent au d eclenchement, lesquelles sont donc supprim ees des places en entr ees. 2. Les arcs inhibiteurs, not es i1 , .., im , inhibent le d eclenchement de la transition sil est valid e. Ces arcs ne sont pas consommateurs de marques. 3. Les arcs non consommateurs, not es b1 , .., bk , fonctionnent comme les arcs standard, ` a la seule di erence quils ne consomment pas les marques en entr ee. Les arcs non consommateurs peuvent toujours sexprimer sous la forme darcs standard, leur usage servant uniquement ` a rendre plus lisible les gures (g. A.4).
Figure A.4: Les arcs non consommateurs (a) peuvent etre transform es en r eseaux ne comprenant que des arcs consommateurs (b).
b) Les arcs sortants, qui associent une transition ` a une place de sortie, produisent de nouvelles marques qui viennent se placer dans ces places. Ces marques produites sont fonction des marques utilis ees pour le d eclenchement de la transition. c) La pr econdition associ ee ` a une transition porte sur des conditions externes. Il est n ecessaire que cette pr econdition soit v eri ee pour que la transition soit d eclench ee.
472
APPENDIX A. BRIC
A.4
Liens de communication
Les composants communiquent en s echangeant des informations, que lon appelle 1 parfois message , le long de liens de communication qui relient des bornes de sorties ` a des bornes dentr ees. Le passage des informations est r egi par les lois de franchissement des r eseaux de Petri, introduisant de fait une ex ecution de type ev enementiel asynchrone. Le d eroulement des op erations est cadenc e par les informations emises et re cues par les composants, lensemble constituant un r eseau de propagation dinformations. Les informations sont v ehicul ees dans le r eseau sous la forme de marques. Une marque est soit un jeton, cest-` a-dire une information el ementaire qui ne vaut que par sa pr esence ou son absence, soit un pr edicat de la forme p(a1 , .., an ), o` u les ai repr esentent des symboles dans un alphabet ni ou des nombres.
A.5
Conventions de notations et equivalences
An de faciliter la lecture des composants Bric, on fera un certain nombre dhypoth` eses concernant les notations:
Q(a1,..,an)
Q(a1,..,an)
Vrai
(a)
(b)
Figure A.5: Les conditions externes peuvent etre traduites sous la forme dune demande dinformation ` a un autre composant. 1. On suppose que tout arc en sortie dune place ayant un libell e de la forme P(a1 , .., an ) aura pour condition de validit e une description identique ` a la description de la place, sauf mention du contraire. De ce fait, il nest en g en eral pas n ecessaire de reproduire la description sur un arc entrant sur une transition, sauf si lon cherche a donner plus de pr ` ecision ` a une condition. Les conditions externes associ ees ` a des transitions (g. A.5.a) peuvent etre consid er ees comme des demandes dinformation. La gure A.5.b montre ainsi un r eseau equivalent, dans lequel la transition externe a et e traduite sous la forme dun acc` es ` a un composant. 2. Les noms des bornes dentr ee seront pris comme des libell es de place, puisquelles sont consid er ees comme des places.
1 An d eviter d eventuels conits sur le terme message lorsquil sapplique aux communications entre les composants ou entre les agents, on appelle les premiers messages internes et les seconds messages externes chaque fois que la confusion sav` ere possible.
A.6. TRADUCTION SOUS FORME DE RESEAUX DE PETRI
473
3. Tout lien direct entre une borne dentr ee dun composant englobant et une borne dentr ee dun composant englob e est suppos e comprendre une transition, dapr` es les r` egles de construction des r eseaux de Petri. N eanmoins, et an de simplier les gures, on pourra ecrire des liens directs entre ces bornes en supposant quil existe une transition virtuelle entre ces bornes. La gure A.2 doit donc se r e ecrire sous la forme de la gure A.6.
E1 E2 C1 S1 S2
E3 C2 C0 C3
S3
Figure A.6: Repr esentation des transitions interm ediaires entre bornes dentr ees
A.6
Traduction sous forme de r eseaux de Petri
Il est toujours possible de transformer un ensemble de composants en un r eseau de Petri equivalent qui repr esente une sorte d eclat e de la structure Bric, en consid erant que les bornes dentr ee des composants correspondent ` a des places, alors que les bornes de sortie ne correspondent ni ` a des places ni ` a des transitions, mais servent uniquement de ls conducteurs vers les bornes dentr ee dautres composants. Par exemple, lensemble de composants Bric de la gure A.7.a peut etre repr esent e par le r eseau de Petri equivalent de la gure A.7.b, les bornes de sortie ayant disparu, et les bornes dentr ee etant remplac ees par des places.
A.7
Exemple
La gure A.8 montre un composant reprenant lexemple c el` ebre en programmation par objet du compte en banque (Ferber 90), sur lequel on peut d eposer (borne d eposer) ou retirer (borne retirer) des sommes. Il est aussi possible de consulter le solde des d ep ots et retraits. Le solde est repr esent e par une place S(v). On constate quon ne peut retirer que des sommes laissant le compte couvert. Toute tentative pour retirer une somme sup erieure au montant du solde entra nera la production du message impossibleTirer(x) en sortie o` u x est la valeur que lon cherche ` a retirer.
474
APPENDIX A. BRIC
(a)
(b)
Figure A.7: La d enition dun ensemble de composants Bric (a) se transforme en un r eseau de Petri equivalent (b).
avoirSolde
dposer(x)
solde(v)
s(v+x) s(v) s(v-x) v-x 0 impossibleTirer(x)
retirer(x)
v-x < 0
Figure A.8: Un composant Bric repr esentant un compte en banque
R ef erences bibliographiques
Agha G. (1986) Actors: A Model of Concurrent Computation for Distributed Systems. MIT Press. Agre P. E. et Chapman D. (1987) Pengi: an Implementation of a Theory of Activity. In AAAI-87, p. 268-272, Morgan Kaufmann. Allen J. F. et Perrault C. R. (1980) Analyzing Intention in Utterances. Articial Intelligence. 15, p. 143-178. Andler D. (Ed.) (1992) Introduction aux sciences cognitives. Gallimard. Atlan H. (1979) Entre le cristal et la fum ee. Essai sur lorganisation du vivant. Le Seuil. Austin J. L. (1962) How to Do Things With Words. Clarendon Press. Trad. fr. Quand dire cest faire, Le Seuil, 1970. Axelrod R. (1992) Donnant, Donnant. Th eorie du comportement coop eratif. Editions Odile Jacob. Bachat` ene H. et Estraillier P. (1992) A Modular Design on Stepwise Renements of Coloured Petri Nets. Research Report, MASI, Universit e Paris 6. Bachimont B. (1992) Le Contr ole dans les syst` emes ` a base de connaissances. Herm` es. Barraquand J. et Latombe J.-C. (1989) Robot Motion Planning: A Distributed Representation Approach. Research Report, STAN-CS-89-1257, Department of Computer Science, Stanford University. Barwise J. et Perry J. (1983) Situations and Attitudes. MIT Press. Bateson G. (1979) La Nature et la pens ee. Le Seuil. Bateson G., Birdwhistell R., Goman E. et al. (1981) La Nouvelle communication. Le Seuil. Baylon C. et Mignot X. (1991) La Communication. Nathan. Beckers R., Holland O. E. et Deneubourg J.-L. (1994) From Local Actions to Global Tasks: Stigmergy and Collective Robotics. In Proc. of the Fourth International Workshop on the Synthesis and Simulation of Living Systems, Articial Life IV, R. Brooks et P. Maes (Ed.), MIT Press. Beer R. D. et Chiel H. J. (1992) The Neural Basis of Behavioral Choice in an Articial Insect. In From Animals to Animats: Proc. Of the First International Conference on Simulation of Adaptive Behavior (SAB90), Paris, J.-A. Meyer et S. W. Wilson (Ed.), p. 247-254, MIT Press. Benda M., Jaganathan V. et Dodhiawala R. (1986) On Optimal Cooperation of Knowledge Sources. In Sixth Workshop on Distributed Articial Intelligence, Boing AI Center, Seattle, WA.
476
Bernard-Weil E. (1988) Pr ecis de syst emique ago-antagoniste. Introduction aux strat egies bilat erales. Limonest, LInterdisciplinaire. Bertalany L. v. (1968) General System Theory. New York, Braziller. Bond A. et Gasser L. (1988) Readings in Distributed Articial Intelligence. Morgan Kaufman. Bond A. H. (1989) Commitment, Some DAI Insights from Symbolic Interactionnist Sociology. In Ninth Workshop on Distributed Articial Intelligence, Seattle. Bond A. H. et Gasser L. (1988) An Analysis of Problems and Research in Distributed Articial Intelligence. In Readings in Distributed Articial Intelligence, A. H. Bond et L. Gasser (Ed.), Morgan Kaufman. Bonnet C., Ghiglione R. et Richard J.-F. (1990) Trait e de psychologie cognitive, tome 1. Dunod. Booch G. (1991) Object Oriented Design with Applications. Benjamin Cummings. Bouron T. (1991) What Architecture for Multi-Agent Systems. In AAAI91 Worshop on Cooperation among heterogeneous intelligent systems. Bouron T. (1992) Structures de communication et dorganisation pour la coop eration dans un univers multi-agents. Th` ese de luniversit e Paris 6. Bouron T., Ferber J. et Samuel F. (1990) MAGES: a Multi-Agent Testbed for Heterogeneous Agents. In Decentralized Articial Intelligence (Vol II), Y. Demazeau et J.-P. Muller (Ed.), North-Holland. Bousquet F., Cambier C., Mullon C. et al. (1993) Simulating the Interaction between a Society and a Renewable Resource. Journal of Biolog. Systems. 1(2), p. 199-214. Boutot A. (1993) Linvention des formes. Editions Odile Jacob. Braitenberg V. (1984) Vehicles: Experiments in Synthetic Psychology. MIT Press. Brassac C. (1992) Analyse de conversation et th eorie des actes de langage. Cahiers de linguistique fran caise. 13. Bratman M. (1987) Intention, Plans, and Practical Reason. Harvard University Press. Bratman M. (1990) What Is Intention? In Intentions in Communications, P. R. Cohen, J. Morgan et M. E. Pollack (Ed.), Cambridge, Bradford Book/MIT Press. Briot J.-P. (1989) Actalk: a Testbed for Classifying and Designing Actor Languages in the Smalltalk-80 Environment. In Proc. of ECOOP 89, Nottingham, UK, p. 109-129. Brooks R. et Connell J. H. (1986) Asynchronous Distributed Control System for a Mobile Robot. SPIE. 727, Mobile Robots. Brooks R. (1990) Elephants Dont Play Chess. Robotics and Autonomous Systems. 6. Bura S., Drogoul A., Ferber J. et Jacopin E. (1991) Eco-r esolution: un mod` ele de r esolution par interactions. In Huiti` eme congr` es sur la reconnaissance des formes et lintelligence articielle (RFIA91), Lyon, AFCET. Bura S., Gu erin-Pace F., Mathian H., Pumain D. et Sanders L. (1993) Multi-Agents Systems and the Dynamics of a Settlement System. In Simulating Societies Symposium, Siena, C. Castelfranchi (Ed.).
477
Burg B. et Arlabosse F. (1994) ARCHON: une plateforme industrielle pour lintelligence articielle distribu ee. In Actes des deuxi` emes journ ees francophones sur lintelligence articielle distribu ee et les syst` emes multi-agents (JFIADSMA94), Voiron, Y. Demazeau et S. Pesty (Ed.), IMAG. Burloud A. (1936) Principes dune psychologie des tendances. Paris. Cambier C. (1994) SIMDELTA: un syst` eme multi-agent pour simuler la p eche sur le Delta Central du Niger. Th` ese de luniversit e Paris 6. Cambier C., Bousquet F. et Dansoko D. (1992) Un Univers multi-agents pour la mod elisation du syst` eme de la p eche du Delta Central du Niger. In Premier colloque africain sur la recherche en informatique (CARI92), Yaound e. Cammarata S., McArthur D. et Steeb R. (1983) Strategies of Cooperation in Distributed Problem Solving. In Proc. of the 1983 IJCAI Conference. Carle P. (1992) Un Langage dacteur pour lintelligence articielle distribu ee int egrant objets et agents par r eexivit e compilatoire. Th` ese de luniversit e Paris 6. Casta neda H.-N. (1975) Thinking and Doing. Dordrecht, Holland, D. Riedel. Castelfranchi C. et Conte R. (1992) Mind is not Enough: Precognitive Bases of Social Interaction. In Simulating Societies Symposium, Guildford, N. Gilbert (Ed.). Castelfranchi C. et Werner E. (Ed.) (1994) Articial Social Systems, Proc. of Maamaw92. Springer-Verlag. Chaib-Draa B. (1989) Contribution ` a la r esolution distribu ee de probl` eme: approche bas ee sur les comportements intentionnels des agents. Th` ese de luniversit e de Valenciennes. Chaib-Draa B., Moulin M., Mandiau R. et Millot P. (1992) Trends in Distributed Articial Intelligence. Articial Intelligence Review. 6, p. 35-66. Chapman D. (1987) Planning for Conjunctive Goals. Articial Intelligence Journal. 32, p. 333-367. Charest J. (1980) La Conception des syst` emes: une th eorie, une m ethode. Qu ebec, Ga eton Morin. Cherian S. et Troxell W. O. (1993) Neural Network Based Behavior Hierarchy for Locomotion Control. In From Animal to Animats 2, Proceedings of the Second International Conference on Simulation of Adaptive Behavior (SAB92), Hawaii, J.-A. Meyer, H. L. Roitblat et S. W. Wilson (Ed.), p. 61-70, MIT Press. Chevrier V. (1993) Etude et mise en uvre du paradigme multi-agent: de Atome a ` Gtmas. Th` ese de luniversit e de Nancy I. Cli D., Harvey I. et Husbands P. (1993) Exploration in Evolutionary Robotics. Adaptive Behavior. 2(1), p. 73-110. Cohen P. R. et Levesque H. J. (1990a) Intention is Choice with Commitment. Articial Intelligence. 42, p. 213-261. Cohen P. R. et Levesque H. J. (1990b) Persistence, Intention and Commitment. In Intentions in Communication, P. R. Cohen, J. Morgan et M. E. Pollack (Ed.), p. 33-69, MIT Press. Cohen P. R. et Levesque H. J. (1990c) Rational Interaction as the Basis for Communication. In Intentions in Communications, P. R. Cohen, J. Morgan et
478
M. E. Pollack (Ed.), p. 508, MIT Press. Cohen P. R. et Levesque H. J. (1995) Communicative Actions for Articial Intelligence. In First International Conference on Multi-Agent Systemes (ICMAS95), San Francisco, V. Lesser (Ed.), MIT Press. Cohen P. R. et Perrault C. R. (1979) Elements of a Plan Based Theory of Speech Acts. Cognitive Science. 3(3). Collins R. J. et Jeerson D. R. (1991) Representation for Articial Organisms. In From Animal to Animats, Paris, J.-A. Meyer et S. W. Wilson (Ed.), p. 382-390, MIT Press. Conry S., Meyer R. A. et Lesser V. (1988) Multistage Negotiation in Distributed Articial Intelligence. In Readings in Distributed Articial Intelligence, A. Bond et L. Gasser (Ed.), Morgan Kaufman. Conte R., Miceli M. et Castelfranchi C. (1991) Limits and Levels of Cooperation: Disentangling Various Types of Prosocial Interaction. In Distributed A.I. 2, Y. Demazeau et J.-P. M uller (Ed.), North-Holland. Corbara B. (1991) LOrganisation sociale et sa gen` ese chez la fourmi Ectatomma ruidum Roger. Th` ese de luniversit e Paris XIII. Corbara B., Drogoul A., Fresneau D. et Lalande S. (1993) Simulating the Sociogenesis Process in Ant Colonies with MANTA. In Towards a Practice of Autonomous Systems II, P. Bourgine et F. Varela (Ed.), MIT Press. Coria M. (1993) Stepwise Development of Correct Agents: a Behavioural Approach Based of Coloured Petri Nets. In Proc. of the Canadian Conf. on Electrical and Computer Engineering, Vancouver, Canada. Corr ea M. et Coelho H. (1993) Around the Architectural Agent Approach to Model Conversations. In Proc. of the 5th European Workshop on Modelling Autonomous Agents in a Multi-Agent World, Neuch atel. Cougnal L. (1963) La Cybern etique. Vol. 638, PUF. Crozier M. et Friedberg E. (1977) LActeur et le syst` eme. Le Seuil. Cyrulnik B. (1989) Sous le signe du lien. Hachette. David R. et Alla H. (1989) Du Grafcet aux r eseaux de Petri. Herm` es. Davis R. et Smith R. J. (1983) Negotiation as a Metaphor for Distributed Problem Solving. Articial Intelligence. 20(1), p. 63-109. De Medio C. et Oriolo G. (1991) Robot Obstacle Avoidance Using Vortex Fields. In Advances in Robot Kinematics, S. Stifter et Lenarcic (Ed.), p. 227-235, Springer Verlag. Delattre P. (1968) Structure et fonction (Biologie). In Encyclopaedia Universalis, vol. 15, (Ed.), p. 442-444. Delattre P. (1971) Syst` eme, structure, fonction, evolution. Maloine. Delaye C. (1993) Structures et organisations des syst` emes multi-agents autonomes et adaptatifs. Th` ese de luniversit e Paris 6. Demazeau Y., Boissier O. et Koning J.-L. (1994) Using Interaction Protocols to Control Vision Systems. In IEEE International Conference on Systems, Man and Cybernetics, San Antonio. Demazeau Y. et M uller J.-P. (Ed.) (1990) Decentralized Articial Intelligence. Elsevier North-Holland.
479
Demazeau Y. et M uller J.-P. (Ed.) (1991) Decentralized AI 2. Elsevier NorthHolland. Deneubourg J.-L. et al. e. (1993) Self-Organisation and life: from Simple Rules to Global Complexity. In Second European Conference on Articial Life., Bruxelles. Deneubourg J.-L., Goss S., Sendova-Franks A., Detrain C. et Chretien L. (1991) The Dynamics of Collective Sorting Robot-like Ants and Ant-like Robots. In From Animals to Animats, Paris, J.-A. Meyer et S. W. Wilson (Ed.), p. 356-363, MIT Press. Deneubourg J. L., Aron S., Goss S., Pasteels J. M. et Duerinck G. (1986) Random Behaviour, Amplication Processes and Number of Participants: How they Contribute to the Foraging Properties of Ants. Physica. 22(D), p. 176-186. Deneubourg J. L. et Goss S. (1989) Collective Patterns and Decision-Making. Ecology, Ethology and Evolution. 1, p. 295-311. Dennett D. (1991) La Conscience expliqu ee. Editions Odile Jacob. Dennett D. C. (1983) Intentional Systems in Cognitive Ethology: the Panglossian Paradigm Defended. The Behavioral and Brain Sciences. 6, p. 343-390. Dennett D. C. (1987) The Intentional Stance. M.I.T. Press. Trad. fr. La Strat egie de linterpr` ete, Essais, Gallimard, 1990. Devlin K. (1991) Logic and Information. Cambridge University Press. Doyle J. (1979) A Truth Maintenance System. AI Journal. 12, p. 231-272. Dreyfus H. (1979) What Computers cant do: a Critique of Articial Reason. Harper. Dreyfus H. L. (1992) La Port ee philosophique du connexionisme. In Introduction aux sciences cognitives, D. Andler (Ed.), p. 352-373, Gallimard. Drogoul A. (1993) De la simulation multi-agent ` a la r esolution collective de probl` emes. Une etude de l emergence de structures dorganisation dans les syst` emes multi-agents.. Th` ese de luniversit e Paris 6. Drogoul A., Corbara B. et Fresneau D. (1993) MANTA: New Experimental Results on the Emergence of (Articial) Ant Societies. In Simulating Societies Symposium, Siena, C. Castelfranchi (Ed.). Drogoul A. et Dubreuil C. (1992) Eco-Problem Solving: Results of the N-Puzzle. In Decentralized Articial Intelligence III, Y. Demazeau et E. Werner (Ed.), North Holland. Drogoul A. et Ferber J. (1992) From Tom Thumb to the Dockers: Some Experiments with Foraging Robots. In From Animals To Animats: Second Conference on Simulation of Adaptive Behavior (SAB 92), Hawaii, J.-A. Meyer, H. Roitblat et S. Wilson (Ed.), MIT Press. Drogoul A. et Ferber J. (1994a) Multi-Agent Simulation as a Tool for Modeling Societies: Application to Social Dierenciation in Ant colonies. In Articial Social Systems, vol. 830, C. Castelfranchi et E. Werner (Ed.), p. 3-23, Berlin, SpringerVerlag. Drogoul A. et Ferber J. (1994b) Multi-agent Simulation as a Tool for Studying Emergent Processes in Societies. In Simulating Societies: the Computer Simulation of Social Phenomena, N. Gilbert et J. Doran (Ed.), p. 127-142, UCL Press. Drogoul A., Ferber J., Corbara B. et Fresneau D. (1992) A Behavioral Simulation Model for the Study of Emergent Social Structures. In Towards a Practice
480
of Autonomous Systems, Paris, P. Bourgine et F. Varela (Ed.), p. pp161-170, MIT Press. Drogoul A., Ferber J. et Jacopin E. (1991) Pengi: Applying Eco-Problem Solving for Behavior Modeling in an Abstract Eco-System. In European Simulation Multiconference, ESM91, E. Mosekilde (Ed.). Dupuy J.-P. (1994) Aux origines des sciences cognitives. La D ecouverte. Durfee E. et Montgomery T. (1989) MICE: A Flexible Testbed for Intelligent Coordination Experiments. In Proc. of Ninth Workshop on Distributed AI, Orcas Islands, Seattle, M. Benda (Ed.), Boing Computer Services. Durfee E. H. et Lesser V. R. (1991) Global Partial Planning: A Coordination Framework for Distributed Hypothesis. IEEE Transactions on Systems, Man and Cybernetics. 21(6). Durfee E. H., Lesser V. R. et Corkill D. D. (1987a) Coherent Cooperation Among Communicating Problem Solvers. IEEE Transactions on Computers. C(36), p. 1275-1291. Durfee E. H., Lesser V. R. et Corkill D. D. (1987b) Cooperation through Communication in a Distributed Problem Solving Network. In Distributed Articial Intelligence, M. Huhns (Ed.), Pitman. Durfee E. H., Lesser V. R. et Corkill D. D. (1989) Cooperative Distributed Problem Solving. In The Handbook of Articial Intelligence, vol. IV, A. Barr, P. R. Cohen et E. A. Feigenbaum (Ed.), p. 83-148, Addison-Wesley. Durkheim E. (1897) Le Suicide. PUF. Eco U. (1988) S emiotique et philosophie du langage. PUF. El Fallah-Seghrouchni A. et Haddad S. (1994) Repr esentation et manipulation de plans ` a laide de r eseaux de Petri. In Actes des deuxi` emes journ ees francophones sur lintelligence articielle distribu ee et les syst` emes multi-agents (JFIADSMA94), Voiron, Y. Demazeau et S. Pesty (Ed.), IMAG. Engelmore R. et Morgan T. (1988) Blackboard Systems. Addison-Wesley. Enjalbert P. (1989) Notes pr eliminaires ` a une th eorie op erationnelle du sens. Intellectica. 8, p. 109-159. Enjalbert P. (1993) Th eories du signe selon Umberto Eco. Rapport interne, 93-10, Laboratoire dalgorithmique et dintelligence articielle de Caen, Universit e de Caen. Erceau J. et Ferber J. (1991) Lintelligence articielle distribu ee. In La Recherche, Juin. Erman L., Hayes-Roth F., Lesser V. et Reddy D. (1980) The HEARSAY-II Speech Understanding System: Integrating Knowledge to Resolve Uncertainty. ACM Computing Surveys. 12. Estraillier P. et Girault C. (1992) Applying Petri Net Theory to the Modelling Analysis and Prototyping of Distributed Systems. In Proceedings of the IEEE International Workshop on Emerging Technologies and Factory Automation, Cairns, Australia. Ferber F. (1906) Pas ` a pas, saut ` a saut, vol ` a vol. Berger-Levrault. Ferber J. (1987) Des objets aux agents: une architecture strati ee. In Sixi` eme congr` es RFIA, Antibes, AFCET.
481
Ferber J. (1989) Objets et agents: une etude des structures de repr esentation et de communications en Intelligence Articielle. Th` ese dEtat, Universit e Paris 6. Ferber J. (1990) Conception et programmation par objets. Herm` es. Ferber J. (1994) La K en etique: des syst` emes multi-agents ` a une science de linteraction. Revue internationale de syst emique. 8(1), p. 13-27. Ferber J. (1995a) Basis of Cooperation in Multi-Agent Systems. In Proc. of the 95 European Conference on Cognitive Science, Saint-Malo, INRIA. Ferber J. (1995b) Reactive Distributed Articial Intelligence: Principles and Applications. In Foundations of Distributed Articial Intelligence, N. Jennings (Ed.), Wiley. Ferber J. et Carle P. (1991) Actors and Agents as Reective Concurrent Objects: a Mering IV Perspective. IEEE Trans on Systems, Man and Cybernetics. 21(6). Ferber J., Carle P., Mousseau D. et Furet T. (1993) Synchronisation de messages par utilisation de la r eexivit e du langage dacteurs Mering IV. In Actes des journ ees fran caises sur les langages applicatifs, JFLA93. Ferber J. et Drogoul A. (1992) Using Reactive Multi-Agent Systems in Simulation and Problem Solving. In Distributed Articial Intelligence: Theory and Practice, L. Gasser et N. Avouris (Ed.), Kluwer Academic Publishers. Ferber J. et Erceau J. (1994) Lintelligence articielle distribu ee et la conception de syst` emes multi-agents. In Intelligence Collective, E. Bonabeau et P. Bourgine (Ed.), Herm` es. Ferber J. et Magnin L. (1994) Conception de syst` emes multi-agents par composants modulaires et r eseaux de Petri. In Actes des journ ees du PRC-IA, Montpellier. Ferraris C. et Haton M. C. (1992) Un guide m ethodologique pour lacquisition des connaissances dans le cadre dun syst` eme multi-experts. In Actes des journ ees dacquisition des connaissances, Dourdan. Fikes R. E. et Nilsson N. J. (1971) STRIPS: a New Approach to the Application of Theorem Proving to Problem Solving. Articial Intelligence. 2(3-4), p. 189-208. Finin T., Fritzson R., McKay D. et McEntire R. (1994) KQML as an Agent Communication Language. In 3rd International Conference on Information and Knowledge Management (CIKM94), ACM Press. Fodor J. (1983) The Modularity of the Mind. Cambridge, Mass, MIT Press. Trad. fr. La modularit e de lesprit, Editions de Minuit, 1983. Forrester J. W. (1980) Principes des Syst` emes. Presses Universitaires de Lyon. Fox M. (1981) An Organizational View of Distributed Systems. IEEE Trans. on Man, Systems and Cybernetics. 11(1), p. 70-79. Fresneau D. (1994) Biologie et comportement social dune fourmi ponerine n eotropicale. Th` ese dEtat, Universit e Paris XIII. Friedberg E. (1993) Le Pouvoir et la r` egle. Le Seuil. Fron A. (1994) Programmation par contraintes. Addison-Wesley France. Galliers J. R. (1991) Modelling Autonomous Belief Revision in Dialogue. In Decentralized Articial Intelligence 2: Proc. of the Second European Workshop on Autonomous Agents in a Multi-Agents World (MAAMAW90), Y. Demazeau et P. M uller (Ed.), Elsevier North Holland.
482
Gasser L. (1991) Social Conceptions of Knowledge and Action: DAI Foundations and Open Systems Semantics. Articial Intelligence. 47(1-3), p. 107-138. Gasser L. (1992) An Overview of DAI. In Distributed Articial Intelligence: Theory and Praxis, L. Gasser et N. M. Avouris (Ed.), Kluwer Academic Publishers. Gasser L. (1995) Computational Organization Research. In 1st International Conference on Multi-Agent Systems, San Francisco, V. Lesser (Ed.), MIT Press. Gasser L., Braganza C. et Herman N. (1987a) Implementing Distributed Articial Intelligence Systems using MACE. In IEEE Conference on Articial Intelligence Applications, p. 315-320. Gasser L., Braganza C. et Herman N. (1987b) MACE: a Flexible Testbed for Distributed AI Research. In Distributed Articial Intelligence, M. N. Huhns (Ed.), p. 119-152, Pitman. Gasser L. et Hill R. W. (1990) Coordinated Problem Solvers. Annual Reviews of Computer Science. 4, p. 203-253. Gasser L. et Huhns M. (Ed.) (1989) Distributed Articial Intelligence. Vol. II, Pitman/Morgan Kaufman. Gasser L., Rouquette N., Hill R. et Lieb J. (1989) Representing and Using Organizational Knowledge in Distributed AI Systems. In Distributed Articial Intelligence, vol. II, L. Gasser et M. Huhns (Ed.), Pitman. Genesereth M. R. et Nilsson N. J. (1987) Logical Foundations of Articial Intelligence. Morgan Kaufman. George M. (1984) A Theory of Action for MultiAgent Planning. In AAAI-84, p. 121-125. George M. (1986) The Representation of Events in Multi-Agent Domains. In AAAI-86, p. 70-75. George M. P. (1983) Communication and Interaction in Multi-Agent Planning. In AAAI-83, p. p125-129. Ghallab M., Grandjean P., Lacroix S. et Thibault J.-P. (1992) Repr esentation et raisonnement pour une machine multi-sensorielle. In Actes des quatri` emes journ ees nationales du PRC-GDR intelligence articielle, Marseille, p. 121-167, Teknea. Ghedira K. (1993) MASC: une approche multi-agents des probl` emes de satisfaction de contraintes. Th` ese de lENSAE. Ghedira K. (1994) Partial Constraint Satisfaction by a Multi-Agent Simulated Annealing approach. In Int. Conf. of AI, KBS, ES and NL, Paris. Ghiglione R. (1986) LHomme communicant. Armand Colin. Ghiglione R. (1989) Le qui et le comment. In Perception, Action, Langage Trait e de Psychologie Cognitive, vol. 3, C. Bonnet, R. Ghiglione et J.-F. Richard (Ed.), p. 175-226, Dunod. Giroux S. (1993) Agents et syst` emes, une n ecessaire unit e. Th` ese de Doctorat, Universit e de Montr eal. Giroux S. et Senteni A. (1992) Steps to an Ecology of Concurrent Computation. Rapport de recherche, Universit e de Montr eal. Gleick J. (1989) La Th eorie du chaos. Flammarion.
483
Gleizes M.-P., Glize P. et Trouilhet S. (1994) Etude des lois de la conversation entre agents autonomes. Revue internationale de syst emique. 8(1), p. 39-50. Goldberg A. et Robson D. (1980) Smalltalk-80: The language and its Implementation. Addison-Wesley. Goldberg D. (1989) Genetic Algorithms. Addison-Wesley. Grice H. P. (1975) Logic and Conversation. In Syntax and Semantics, vol. 3, Speech Acts, P. Cole et J. L. Morgan (Ed.), p. 41-58, Academic Press. Guha R. V. et Lenat D. (1990) CYC: A Midterm Report. In AI Magazine, Gurvitch G. (1963) La vocation actuelle de la sociologie. PUF. Harel D. (1979) First Order Dynamic Logic. Vol. 68, Springer-Verlag. Haton J.-P., Bouzid N., Charpillet F. et al. (1991) Le Raisonnement en intelligence articielle. InterEditions. Hayes-Roth B. (1985) A Blackboard Architecture for Control. Articial Intelligence. 26(3), p. 251-321. Hayes-Roth B. et Collinot A. (1993) A Satiscing Cycle for Real-Time Reasoning in Intelligent Agents. Expert Systems with Applications. 7, p. 31-42. Hayes-Roth B., Washington R., Ash D. et al. (1992) Guardian, a Prototype Intelligent Agent for Intensive-Care Monitoring. Articial Intelligence in Medicine. 4(2). Hayes-Roth F., Erman L., Fouse S., Lark J. S. et Davidson J. (1988) ABE: a Cooperative Operating System and Development Environment. In Readings in Distributed Articial Intelligence, A. Bond et L. Gasser (Ed.), Morgan Kaufman. Heudin J.-C. (1994) La Vie articielle. Paris, Herm` es. Hewitt C. (1977) Viewing Control Structures as Patterns of Message Passing. Articial Intelligence. 8(3), p. 323-374. Hewitt C. (1985) The Challenge of Open Systems. In Byte, Hewitt C. (1991) Open Information Systems Semantics for Distributed Articial Intelligence. Articial Intelligence (special issue on foundations of AI). 47(1-3), p. 79-106. Hewitt C., Bishop P. et Steiger R. (1973) A Universal Modular Actor Formalism for Articial Intelligence. In Third International Joint Conference on Articial Intelligence. Hickman S. et Shiels M. (1991) Situated Action as a Basis for Cooperation. In Decentralized A.I. 2, E. Werner et Y. Demazeau (Ed.), Elsevier North Holland. Holland J. H. (1968) Processing and Processors for Schemata. In Associative Information Processing, E. L. Jacks (Ed.), p. 127-146, American Elsevier. Holland J. H. (1978) Cognitive Systems Based on Adaptive Algorithms. In Pattern directed inference systems, D. A. Waterman et F. Hayes-Roth (Ed.), p. 313-329, Academic Press. Holland J. H., Holyoak K. J., Nisbett R. E. et Thaghard P. R. (1986) Induction: Processes of Inference, Learning and Discovery. MIT Press. Huhns M. N. (Ed.) (1987) Distributed Articial Intelligence. Pitman. Husserl E. (1950) Id ees directrices pour une ph enom enologie. Gallimard. Ienecker C. (1992) Un Syst` eme multi-agents pour le support des activit es de conception de produits. Th` ese duniversit e, Universit e Paris 6.
484
Ienecker C. et Ferber J. (1992) Using Multi-Agent Architecture for Designing Electomechanical Products. In Actes de la conf erence Avignon92 sur les Syst` emes Experts et leurs Applications, Avignon, EC2. Ishida T. (1989) CoCo: A Multi-Agent System for Concurrent and Cooperative Operation Tasks. In 9th Distributed Articial Intelligence Workshop, Orcas Island, M. Benda (Ed.). Ishikawa Y. et Tokoro M. (1986) A Concurrent Object-Oriented Knowledge Representation Language Orient84/K: its features and implementation. In OOPSLA86, ACM Sigplan Notices. Jacopin E. (1993) Algorithmique de linteraction: le cas de la planication. Th` ese de luniversit e Paris 6. Jagannathan V., Dodhiawala R. et Baum L. S. (1989) Blackboard Architectures and Applications. Academic Press. Jakobson R. (1963) Essai de linguistique g en erale. Editions de Minuit. Jennings N. (1994) Cooperation in Industrial Multi-Agent Systems. Vol. 43, World Scientic Press. Jennings N., Corera J. M. et Laresgoiti I. (1995) Developing Industrial MultiAgent Systems. In First International Conference on Multi-Agent Systems, San Francisco, V. Lesser (Ed.), MIT Press. Jennings N. et Wittig T. (1992) ARCHON: Theory and Practice. In Distributed Articial Intelligence: Theory and Practice, L. Gasser et N. Avouris (Ed.), Kluwer Academic Publishers. Jensen K. (1992) Coloured Petri Nets. Basic Concepts, Analysis Method and Practical Use. Vol. 1, Springer-Verlag. Konolige K. (1986) A Deduction Model of Belief. Pitman. Korf R. E. (1985) Depth-rst Iterative-Deepening: an Optimal Admissible Tree Search. Articial Intelligence. 27. Korf R. E. (1988) Real Time Heuristic Search. Articial Intelligence. 42. Kornfeld W. (1979) ETHER: a Parallel Problem Solving System. In Proc. of 6th IJCAI. Kornfeld W. et Hewitt C. (1980) The Scientic Community Metaphor. AI Lab Memo, 641, MIT. Kripke S. A. (1991) Semantical Considerations on Modal Logic. In Reference and Modality, Linsky (Ed.), p. 63-72, Oxford University Press. Kuhn T. (1962) The Structure of Scientic Revolutions. University of Chicago Press. L aasri H. et Ma tre B. (1989) Coop eration dans un univers multi-agent bas ee sur le mod` ele du blackboard: etudes et r ealisations. Th` ese de luniversit e de Nancy I. L aasri H., Ma tre B. et Haton J.-P. (1987) ATOME: outil daide au d eveloppement de syst` emes multi-experts. In Actes des sixi` emes journ ees sur la reconnaissance des formes et lintelligence articielle (RFIA87), Antibes, p. 749-759. Lakatos I. (1976) Proofs and Refutations. Cambridge University Press. Lalanda P., Charpillet F. et Haton J. P. (1992) A Real Time Blackboard Based Architecture. In 10th European Conference on Articial Intelligence, Vienne, Autriche. Langton C. (Ed.) (1988) Articial Life. Addison-Wesley.
485
Langton C., Taylor C., Farmer J. D. et Rasmussen S. (Ed.) (1990) Articial Life II. Addison-Wesley. Langton C. G. (Ed.) (1994) Articial Life III. Addison-Wesley. Lapierre J.-W. (1992) LAnalyse de syst` emes. Syros. Latombe J.-C. (1991) Robot Motion Planning. Kluwer Academic Publishers. Latour B. (1989) La Science en action. La D ecouverte. Le Gallou F. (1992) Activit es des syst` emes, d ecomposition des syst` emes. In Syst emique. Th eorie et applications, F. Le Gallou et B. Bouchon-Meunier (Ed.), p. 71100, Lavoisier. Le Moigne J.-L. (1977) La Th eorie du syst` eme g en eral. PUF. Le Strugeon E. (1995) Une m ethodologie dauto-adaptation dun syst` eme multiagents cognitifs. Th` ese de luniversit e de Valenciennes. Lef` evre C. (1995) Agents logiques communicants. Th` ese de luniversit e de Caen. Lehmann F. (Ed.) (1992) Semantic Networks in Articial Intelligence. Pergamon Press. Lenat D. (1975) BEINGs: Knowledge as Interacting Experts. In Proc. of the 1975 IJCAI Conference, p. 126-133. Lenat D. et Brown J. S. (1984) Why AM and Eurisko Appear to Work. Articial Intelligence. 23, p. 269-294. Lenat D. et Guha R. V. (1990) Building Large Knowledge-Based Systems. AddisonWesley. Lesp erance Y., Levesque H., Lin F. et al. (1995) Fondements dune approche logique a la programmation dagents. In Actes des troisi` ` emes journ ees francophones sur lintelligence articielle distribu ee et les syst` emes multi-agents, Chamb ery. Lesser V. R. et Corkill D. D. (1983) The Distributed Vehicle Monitoring Testbed: A Tool for Investigating Distributed Problem Solving Networks. AI Magazine. 4(3), p. 15-33. Lestel D. (1986) Contribution ` a l etude du raisonnement exp erimental dans un domaine s emantiquement riche. Th` ese de doctorat, EHESS. Lestel D., Grison B. et Drogoul A. (1994) Les agents r eactifs et le vivant dans une perspective d evolution coop erative. Intellectica. 19, p. 73-90. Levine M. D. (1985) Vision in Man and Machine. Prentice-Hall. Lin L.-J. (1992) Self-improving Reactive Agents: Case Studies of Reinforcement Learning Frameworks. In From Animals to Animats: Proc. Of the First International Conference on Simulation of Adaptive Behavior (SAB90), Paris, J.-A. Meyer et S. W. Wilson (Ed.), p. 297-305, MIT Press. Liu J. S. et Sycara K. (1993) Emergent Constraint Satisfaction through MultiAgent Coordinated Interaction. In Maamaw93, Neuch atel. Livet P. (1994) La communaut e virtuelle. Editions de lEclat. Lorenz K. (1984) Les Fondements de l ethologie. Flammarion. Maes P. (1990) Situated Agents can have Goals. Journal of Robotics and Autonomous Systems. 6, p. 49-70. Maes P. (1991) A Bottom-Up Mechanism for Behavior Selection in an Articial Creature. In From Animals to Animats: Proc. Of the First International Conference on Simulation of Adaptive Behavior (SAB90), Paris, J.-A. Meyer et S. W.
486
Wilson (Ed.), p. 238-246, MIT Press. Maes P. (1992) Learning Behavior Networks from Experience. In Toward a Practice of Autonomous SYstems, Proc. of the First European Conference on Articial Life, Paris, F. Varela et P. Bourgine (Ed.), p. 48-57, MIT Press. Maes P. et Nardi D. (Ed.) (1988) Meta-level Architectures and Reexion. NorthHolland. Malinowski B. (1944) A Scientic Theory of Culture and Others Essays. Chapel Hill, North Carolina Press. Trad. fr. Une th eorie scientique de la culture, Le Seuil, 1968. Malone T. W. (1988) What is coordination theory. In National Science Foundation Coordination Theory Workshop, MIT. Marr D. (1982) Vision: a Computational Investigation into the Human Representation and Processing of Visual Information. Freeman. Maruichi T. (1989) Organizational Computation. Ph.D. Thesis, Keio University. Maruichi T., Ichikawa M. et Tokoro M. (1990) Modeling Autonomous Agents and Their Groups. In Decentralized A.I. 1, Y. Demazeau et J.-P. M uller (Ed.), NorthHolland. Masini G., Napoli A., Colnet D., L eonard D. et Tombre K. (1989) Les Langages ` a objets. InterEditions. Masoud A. et Bayoumi M. (1993) Robot Navigation Using the Vector Potential Approach. In Proc. of IEEE International Conference on Robotics and Automation, Atlanta, p. 805-811. Mataric M. J. (1992) Designing Emergent Behaviors: from Local Interactions to Collective Intelligence. In From Animals to Animats 2, Proceedings of the Second International Conference on Simulation of Adaptive Behavior, Hawaii, J.A. Meyer, H. L. Roitblat et S. W. Wilson (Ed.), p. 432-441, MIT Press. Mataric M. J. (1994) Learning to Behave Socially. In From Animals to Animats 3, Proceedings of the Third International Conference on Simulation of Adaptive Behavior, Brighton, D. Cli, P. Husbands, J.-A. Meyer et S. W. Wilson (Ed.), p. 453-462, MIT Press. Maturana H. et Varela F. (1980) Autopoiesis and Cognition: the Realization of the Living. Boston, D. Reidel. Maturana H. et Varela F. (1987) The Tree of Knowledge. Boston, New Science Library. Trad. fr. LArbre de la connaissance, Addison-Wesley France, 1994. McCarthy J. (1980) Circumscription: A Form of Non-Monotonic Reasoning. Articial Intelligence. 13, p. 27-39. McFarland D. (1990) Dictionnaire du comportement animal. Robert Laont. McFarland D. (1994) Towards Robot Cooperation. In 94 Conference on the Simulation of Adaptive Behavior, Brighton, MIT Press. Mesarovic M. D. et Takahara Y. (1975) General Systems Theory: Mathematical Foundations. Academic Press. Mesle R. (1994) ICHTYUS: architecture dun syst` eme multi-agents pour l etude de structures agr egatives. Rapport de DEA, LAFORIA, Universit e Paris 6. Meyer J.-A. et Guillot A. (1989) Simulation of Adaptive Behavior in Animats: Review and Prospect. In From Animals to Animats, Paris, J.-A. Meyer et S. W.
487
Wilson (Ed.), MIT Press. Meyer J. A., Roitblat H. L. et Wilson S. W. (Ed.) (1993) Simulation of Adaptive Behavior: From Animals to Animats II. Cambridge, MIT Press. Meyer J. A. et Wilson S. (Ed.) (1991) Simulation of Adaptive Behavior: From Animals to Animats. MIT Press. Milner R. (1989) Communication and Concurrency. Prentice-Hall International. Minsky M. (1988) La Soci et e de lEsprit. InterEditions. Mintzberg H. (1982) Structure et dynamique des organisations. Les Editions dOrganisation. MIRIAD E. (1992) Approcher la notion de collectif. In Actes des journ ees multiagents du PRC-IA, Nancy. Moeschler J. (1985) Argumentation et conversation. Hatier. Moeschler J. (1989) Mod elisation du dialogue: repr esentation de linf erence argumentative. Herm` es. Montague R. (1974) Formal Philosophy. Yale University Press. Moore R. C. (1988) Autoepistemic Logic. In Non-Standard Logics for Automated Reasoning, Smets (Ed.), p. 105-136, Academic Press. Morin E. (1977) La M ethode (1): la Nature de la Nature. Le Seuil. Morin E. (1991) La M ethode (4): Les Id ees. Leur habitat, leur vie, leurs moeurs. Le Seuil. Morley R. E. et C. S. (1993) An Analysis fo a Plant-Specic Dynamic Scheduler. In Proc. of the NSF Workshop on Dynamic Scheduling., Cocoa Beach. Moulin B. et Cloutier L. (1994) Collaborative Work Based on Multiagent Architectures: a Methodological Perspective. In Soft Computing: Fuzzy Logic, Neural Networks and Distributed Articial Intelligence, F. Aminzadeh et M. Jamshidi (Ed.), p. 261-296, Prentice-Hall. Murata T. (1989) Petri Nets: Properties, Analysis and Applications. Proceedings of the IEEE. 77(4), p. 541-580. Newell A. (1982) The Knowledge Level. Articial Intelligence. 18(1), p. 87-127. Newell A., Shaw J. et Simon H. (1957) Empirical Explorations of the Logic Theory Machine: a Case Study in Heuristics. In Computers and Thought (1963), E. Feigenbaum et J. Feldman (Ed.), p. 109-133, McGraw-Hill. Newton I. (1985) Principia Mathematica. C. Bourgeois. Nilsson N. (1980) Principles of Articial Intelligence. Springer-Verlag. Overgaard L., Petersen H. G. et Perram J. W. (1994) Motion Planning for an Articulated Robot: a Multi-Agent Approach. In MAAMAW94, Odense, Danemark, Y. Demazeau, J.-P. M uller et J. Perram (Ed.). Pacherie E. (1993) Naturaliser lintentionnalit e. Essai de philosophie de la psychologie. PUF. Parker L. E. (1994) Heterogeneous Multi-Robot Cooperation. PhD Thesis, MIT. Parunak H. V. D. (1987) Manufacturing Experience with the Contract Net. In Distributed Articial Intelligence, M. N. Huhns (Ed.), Pitman. Parunak H. V. D. (1990) Distributed AI and Manufacturing Control: Some Issues and Insights. In Decentralized AI, Vol 1, Y. Demazeau et J.-P. Muller (Ed.), p. 81-104, North-Holland.
488
Parunak H. V. D. (1993) Industrial Applications of Multi-Agent Systems. Rapport de recherche, Industrial Technology Institute. Pattison H. E., Corkill D. et Lesser V. (1987) Instantiating Descriptions of Organizational Structures. In Distributed Articial Intelligence, M. Huhns (Ed.), Pitman. Pav e A. (1994) Mod elisation en biologie et en ecologie. Lyon, Al eas. Pednault E. (1986) Formulating Multiagent, Dynamic-World Problems in the Classical Planning Framework. In Reasoning about Actions and Plans, Timberline, M. George et A. Lansky (Ed.), p. 425, Morgan Kaufman. Piaget J. et Inhelder B. (1966) La psychologie de lenfant. PUF. Pitrat J. (1990) Metaconnaissances. Futur de lintelligence articielle. Herm` es. Popper K. (1963) Conjectures and Refutations. Londres, Routledge and Kegan Paul. Trad. fr. Conjectures et r efutations, Payot, 1985. Prigogine I. et Stengers I. (1979) La nouvelle alliance. Gallimard. Rao A. et George M. (1992) Social Plans: Preliminary Report. In Decentralized AI 3 - Proc. of MAAMAW91, E. Werner et C. Castelfranchi (Ed.), p. 127-146, Elsevier North Holland. Quinqueton J., Reitz P. et Sallantin J. (1991) Les Sch emas mentaux, un cadre conceptuel pour lapprentissage ` a partir dexemples. In Actes du congr` es sur la reconnaissance des formes et lintelligence articielle, Lyon, J.-P. Laurent (Ed.). Raynal M. (1987) Syst` emes r epartis et r eseaux: concepts outils et algorithmes. Eyrolles. R ecanati F. (1981) Les Enonc es performatifs. Editions de Minuit. Regnier S. et Duhaut D. (1995) Une approche multi-agent pour la r esolution de probl` emes robotiques. In Actes des troisi` emes journ ees francophones sur lIntelligence articielle Distribu ee et les syst` emes multi-agents (JFIADSMA95), Chamb ery. Reiter R. (1980) A Logic for Default Reasoning. AI Journal. 13, p. 81-131. Reynolds C. (1987) Flocks, Herds ans Schools: A Distributed Behavioral Model. Computer Graphics. 21(4), p. 25-34. Rocher G. (1968) Introduction ` a la sociologie g en erale. T1: laction sociale. Le Seuil. Rosenblatt K. J. et Payton D. W. (1989) A Fine-Grained Alternative to the Subsumption Architecture for Mobile Robot Control. In Proc. of the IEEE/INNS International Joint Conference on Neural Networks. Rosenschein J. et Zlotkin G. (1994) Rules of Encounters: Designing Conventions for Automated Negotiation among Computers. MIT Press. Sabah G. (1989) LIntelligence articielle et le langage. Tome 2: Compr ehension. Herm` es. Sabah G. (1990) CARAMEL: A Computational Model of Natural Language Understanding using Parallel Implementation. In Proc. of the Ninth European Conference on Articial Intelligence (ECAI 90), Stockholm. Schoppers M. (1987) Universal Plans for Reactive Robots in Unpredictable Environment. In IJCAI-87, Milan. Schwartz E. (1993) A Coherent and Holistic Metamodel for the Functioning and
489
Evolution of Viable Systems. An application to Human Societies. In 4th International Symposium on Systems Research Informatics and Cybernetics, BadenBaden. Searle J. (1991) The Rediscovery of the Mind. MIT Press. Searle J. et Vanderveken D. (1985) Foundations of illocutionary logic. Cambridge University Press. Searle J. R. (1969) Speechs Acts. Cambridge University Press. Searle J. R. (1979) Expression and Meaning. Cambridge University Press. Searle J. R. (1985) Lintentionnalit e: essai de philosophie des etats mentaux. Editions de Minuit. Shannon C. et Weaver W. (1948) The Mathematical theory of Communication. Urbana, University of Illinois Press. Shoham Y. (1988) Reasoning About Change. MIT Press. Shoham Y. (1993) Agent Oriented Programming. Articial Intelligence. 60(1), p. 51-92. Sibertin-Blanc C. (1985) High level Petri nets with Data Structure. In 6th European Workshop on Petri Nets and Applications, Espoo, Finlande. Smith R. G. (1979) A Framework for Distributed Problem Solving. In Proceedings of IJCAI79. Smith R. G. (1980) The Contract Net Protocol: High-Level Communication and Control in a Distributed Problem Solver. IEEE Trans. on Computers. 29(12), p. 1104-1113. Smolensky P. (1992) IA connexioniste, IA symbolique et cerveau. In Introduction aux sciences cognitives, D. Andler (Ed.), Gallimard. Somb e L. (1988) Raisonnement sur des informations incompl` etes en intelligence articielle.. Revue dintelligence articielle. 2(3-4), p. 9-210. Sowa J. (1984) Conceptual Structures. Addison-Wesley. Sperber D. et Wilson D. (1986) Relevance: Communication and Cognition. Blackwell. Trad. fr. La Pertinence: communication et cognition, 1989, Editions de Minuit. Steeb R., Camarata S., Hayes-Roth F., Thorndyke P. et Wesson R. (1988) Architectures for Distributed Air Trac Control. In Readings in Distributed Articial Intelligence, A. Bond et L. Gasser (Ed.), Morgan Kaufman. Steels L. (1989) Cooperation between Distributed Agents through Self-Organization. In Decentralized A.I., Y. Demazeau et J.-P. M uller (Ed.), Elsevier/NorthHolland. Steels L. (1994a) The Articial Life Roots of Articial Intelligence. Articial Life. 1(1). Steels L. (1994b) A Case Study in the Behavior-Oriented Design of Autonomous Agents. In Proc. of the 94 Conference on the Simulation of Adaptive Behavior, Brighton, MIT Press. Stoetzel J. (1978) La Psychologie sociale. Flammarion. Suchman L. (1987) Plans and Situated Actions: the Problem of Human-Machine Communication. Cambridge University Press.
490
Sutton E. (1994) Etat de lart des algorithmes g en etiques. SGDN/STS/VST/5, Secr etariat g en eral de la d efense nationale. Sycara K. (1989) Multiagent Compromise via Negotiation. In Distributed Articial Intelligence, L. Gasser et M. Huhns (Ed.), Pitman. Tanenbaum A. (1991) Architecture des ordinateurs. InterEditions. Theraulaz G. (1991) Morphogen` ese et auto-organisation des comportements dans les colonies de gu epes Polistes dominilus (Christ). Th` ese de troisi` eme Cycle, Universit e dAix-Marseille I. Theraulaz G., Goss S., Gervet J. et Deneubourg J. L. (1991) Task Dierentiation in Polistes Wasp Colonies: a Model for Self-Organizing Groups of Robots. In From Animals to Animats, J. A. Meyer et S. Wilson (Ed.), p. 346-354, MIT Press. Thibault J.-P. (1993) Interpr etation denvironnement evolutif par une machine de perception multi-sensorielle. Th` ese de luniversit e Paul Sabatier, Toulouse. Thom R. (1988) Esquisse dune s emiophysique. InterEditions. Tinbergen N. (1951) The Study of Instinct. Clarendon Press. Trad. fr. LEtude de linstinct, Payot, 1971. Todd P. M. et Miller G. F. (1991) Exploring Adaptive Agency II: Simulating the Evolution of Associative Learning. In From Animals to Animats: Proc. Of the First International Conference on Simulation of Adaptive Behavior (SAB90), Paris, J.-A. Meyer et S. W. Wilson (Ed.), p. 306-315, MIT Press. Tokoro M. (1993) The Society of Objects. In Proc. of the OOPSLA93 Conference. Trognon A. et Brassac C. (1988) Actes de langages et conversation. Intellectica. 6(2), p. 211-232. Trognon A. et Brassac C. (1992) LEncha nement conversationnel. Cahiers de linguistique fran caise. 13. Tyrrell T. (1993a) Computational Mechanisms for Action Selection. PhD Thesis, Edinburgh University. Tyrrell T. (1993b) The Use of Hierarchies for Action Selection. Adaptive Behavior. 1(4), p. 387-420. Uexk ull J. v. (1956) Mondes animaux et mondes humains. Deno el. Vanderveken D. (1988) Les actes de discours. Pierre Mardaga. Vanderveken D. (1992) Meaning and speech acts. Cambridge University Press. Varela F. (1989) Autonomie et Connaissance. Le Seuil. Varela F., Thomson E. et Rosch E. (1993) LInscription corporelle de lesprit. Le Seuil. Varela F. J. et Bourgine P. (Ed.) (1992) Toward a Practice of Autonomous Systems. MIT Press. Vauclair J. (1992) LIntelligence de lanimal. Le Seuil. Vernadat F. et Azemat P. (1993) Prototypage de syst` emes dagents communicants. In Actes des premi` eres journ ees francophones sur lintelligence articielle distribu ee et les syst` emes multi-agents, Toulouse. Volterra V. (1926) Variation and uctuations of the number of individuals of animal species living together. In Animal Ecology, (Ed.), McGraw-Hill. von Martial F. (1992) Coordinating Plans of Autonomous Agents. Vol. 610, SpringerVerlag.
491
Waldinger R. (1977) Achieving Several Goals Simultaneously. Machine Intelligence. 8, p. 94-136. Wavish P. (1992) Exploiting Emergent Behaviour in Multi-Agent Systems. In Decentralized A.I. 3, E. Werner et Y. Demazeau (Ed.), North-Holland. Wavish P. R. et Connah D. M. (1990) Representing Multi-Agent Worlds in ABLE. Technical Note, TN2964, Philips Research Laboratories. Weihmayer R. et Brandau R. (1990) A Distributed AI Architecture for Customer Network Control. In GLOBECOM90, San Diego. Werner E. (1989) Cooperating Agents: A Unied Theory of Communication and Social Structure. In Distributed Articial Intelligence, Vol II, L. Gasser et M. Huhns (Ed.), Pitman. Werner E. et Demazeau Y. (Ed.) (1992) Decentralized A.I. 3. Amsterdam, Elsevier North-Holland. Werner G. M. (1994) Using Second Order Neural Connections for Motivation of Behavioral Choices. In From animals to animats 3: proc. of the third international conference on simulation of adaptive behavior., Brighton, D. Cli, P. Husbands, J.-A. Meyer et S. W. Wilson (Ed.), p. 154-161, MIT Press. Werner G. M. et Dyer M. G. (1992) Evolution of Communication in Articial Organisms. In Articial Life II (1990), Santa Fe, C. Langton, C. Taylor, J. D. Farmer et S. Rasmussen (Ed.), p. 659-687, Addison Wesley. Wiener N. (1948) Cybernetics. Paris, Hermann. Wilson E. O. (1971) The Insect Societies. Belknap Press of Harvard University Press. Wilson S. W. (1991) Knowledge Growth in an Articial Animal. In First International Conference on Genetic Algorithms and their Applications, Pittsburgh, p. 16-23, Carnegie-Mellon University. Winograd T. et Flores F. (1986) Understanding Computers and Cognition: a New Foundation for Design. Ablex Publishing Corp. Wittgenstein (1951) Le Cahier bleu et le cahier brun. Gallimard. Wittig T. (Ed.) (1992) ARCHON: An Architecture for Multi-Agent Systems. Ellis Horwood. Wooldridge M. et Jennings N. (1994) Towards a Theory of Cooperative Problem Solving. In MAAMAW94, Odense, Danemark, Y. Demazeau, J.-P. Muller et J. Perram (Ed.). Yonezawa A. (Ed.) (1990) ABCL: An Object-Oriented Concurrent System. MIT Press. Yonezawa A. et Tokoro M. (Ed.) (1987) Object-Oriented Concurrent Programming. MIT Press. Zeghal K. (1993) Un Mod` ele de Coordination dActions Reactive appliqu e au trac a erien. In Journees francophones IAD et SMA, Toulouse, AFCET. Zeghal K. et Ferber J. (1993) CRAASH: A Coordinated Collision Avoidance System. In European Simulation Multiconference, Lyon. Zeghal K., Ferber J. et Erceau J. (1993) Symmetrical, transitive and Recursive Force: A Representation of interactions and commitments. In IJCAI Workshop on Coordinated Autonomous Robots, Chambery.
492
Zlotkin G. et Rosenschein J. S. (1992) A Domain Theory for Task Oriented Negotiation. In Proc. of the International Joint Conference on Articial Intelligence, Chambery.
Index
eco r esolution, 38 emergence, 8, 9, 1720, 41, 59, 87, 88, 118, 126, 189, 275, 343, 398, 434, 439 etat dautomate, 171 etat du monde, 153 etats mentaux, 225227, 338, 379 evolution en groupe, 434439 ABCL, 145 abduction, 310 accointances, 14 r eorganisation, 360, 378 acheminement direct, 313 par propagation, 314 par voie dache, 315 Actalk, 145 acte consommatoire, 286, 290 actes de langage, 316, 320340, 379 action, 150 comme commande, 152, 191 comme d eplacement, 182187 comme d eplacement physique, 152 comme modications locales, 152, 187 comme processus, 151, 169 comme r eponse ` a des inuences, 151 comme transformation d etat, 152 comme transformation d etat, 164 comme transformation d etats, 151 de coordination, 446 probl ematique de l, 54 rationnelle, 304 situ ee, 195201, 288, 433 ad equation, 255, 259 adaptation, 56 administrateur, 361388 adoption de but, 74 agent, 8 cognitif, 20, 23, 129, 388 d enition, 13 et organisation, 19 fanatique, 305 hyst er etique, 206 intentionnel, 20 logiciel, 14, 16 pulsionnel, 21, 66 r eactif, 20, 23, 129, 388, 433 rationnel, 20, 269 situ e, 112 totipotent, 119, 127 tropique, 21, 66, 194206 Agent Oriented Programming, 308 Agent0, 308 algorithmes g en etiques, 139 Alliance, 398 allocation emergente, 345 centalis ee, 345 centralis ee, 346350 de ressources, 422, 425 distribu ee, 345 appel dore, 345, 378, 361378 directe, 351353 par d el egation, 353359 r eseau daccointances, 345, 350361 optimisation, 348 r eactive, 388 ANA, 291 analyse fonctionnelle, 95, 100, 122, 124 grille, 106110 structurale, 110, 122, 124
494 animat, 31, 46, 140 anneau ` a jeton, 368 anti-collision, 52, 297, 439 appel dore, 126, 385, 361388, 422 arbitrage, 68, 77, 82, 85 architecture, 24, 111, 129 classieurs, 139 connexioniste, 140, 289, 293 modulaire, 131 multi-agent, 144, 291 subsomption, 135, 181, 398 syst` emes de production, 137 syst` eme dynamique, 142, 295 t aches comp etitives, 136, 291, 293 tableaux noirs, 28, 37, 132, 315 Archon, 53 assertif, 321, 331, 334337 Atome, 134 augmentation qualitative, 80 quantitative, 80, 83 autocatalytique, 444, 447 automate a ` etats nis, 171174, 179, 207, 328, 380, 383, 417, 451 a registres, 174176 ` cellulaire, 31, 188191 autonomie, 270 autopo ` ese, 58, 100, 270
Clotaire, 153155, 169, 180, 196, 198 204, 221, 255, 414, 417 code (de communication), 310311 cogniton, 55, 227231, 240, 262, 333, 338 collaboration, 56, 84 commande (cogniton), 228, 271 communicant SMA, 14 communication, 83, 278 diusion, 313, 394 incidente, 315, 316, 345 intentionnelle, 315, 316 point ` a point, 312 sch ema g en eral, 310 comp etence, 231, 239, 266267, 333, 343, 346, 350 compatibilit e des buts, 66 Comport, 194, 207 comportement, 24, 26, 111 app etitif, 286, 290 r eexe, 20 t el eonomique, 20 conception fonctionnelle, 111 horizontale, 114 verticale, 114 objet, 111 conceptualisation, 235 Condor, 36 connaissance, 233241 banc de poissons, 436 connexionisme, 240 BB1, 133 contournement (comportement de), 438 Beings, 29 contr ole boids, 434 probl` eme du, 271 Bric, 209211, 332, 347, 383 contrat, 361367, 371374, 377379 but, 303, 333 cognitif, 319 conversation, 326, 328 catalyse, 81 coop eration, 7389, 343 cha ne avantages, 88 comportement de, 447 intentionnelle, 46, 78 cha ne daction, 276, 288 m ethodes, 82 champ r e active, 46, 78 de potentiel, 184186, 289, 296, 434, syst` eme des activit es, 86 437 coordination Chilp eric, 414, 418 client, 344, 346, 388 caract eristiques
R ef erences bibliographiques g en eralisation, 410 organisationnelles, 408 qualit e, 409 r ealisation, 410 temporelles, 408 centralis ee pour plans partiels, 423428 dactions, 56, 85 d enition, 402 distribu ee pour plans partiels, 428433 planication, 411, 416433 r eactive, 411, 433447 r eglementation, 412 synchronisation, 411, 413 t aches de, 85 couplage, 116 Craash, 213, 439 croyance, 229, 233, 246, 255, 303, 333 CYC, 29, 238 d eclaratif, 321 d ecomposition des probl` emes, 344 d el egation, 353, 356 d el egation de t aches, 266 d elib eration, 193 d ependance des actions, 406 Decision, 206 demande, 229 fonctionnelle, 276 diusion par vague, 185, 191, 203 dimension danalyse, 99 environnementale, 99, 264 personnelle, 99 physique, 99 relationnelle, 99, 265 sociale, 99 directif, 321 distributeur de bonbons, 171, 175 DVMT, 30, 37, 132 eco-agent, 449 eco-probl` eme, 451 eet de masse, 81
495 EMF, 293 encombrement, 72 engagement, 131, 230, 279285, 320, 333, 371, 378388, 432 rapide, 373 tardif, 373 environnement, 13, 212, 434 centralis e, 213, 215, 217 distribu e, 213 sp ecialis e, 216 Ether, 28, 315 Exec, 166, 193, 194, 406 exercitif, 322, 325, 329, 331, 333334 expressif, 321, 331 Flavor Paint Shop, 376 Flavors Paint Shop, 36 fonction conative, 96, 102, 318, 385, 386 d ecisionnelle, 96 de transition, 173 ex ecutrice, 96 expressive, 318 interactionnelle, 96, 103 m etalinguistique, 318 m etaconceptuelle, 318 paralinguistique, 318 motivationnelle, 96 organisationnelle, 96, 102, 343 perceptive, 96 phatique, 318, 325 po etique, 318 productive, 96, 104, 124 r ef erentielle, 318 repr esentationnelle, 95, 100 v eg etative, 97, 105 fournisseur, 344, 346, 378, 388 fuite comportement de, 456 Guardian, 134 Hearsay II, 28, 133 hom eostasie, 394 hypoth` ese, 229 Ichtyus, 436
496 Ideal, 37 illocutoire acte, 322, 324326, 332 force, 323, 327 indice, 310 conictuel, 82 dans les actions situ ees, 196 de coop eration, 75 de coordination, 442 de performance, 79 de survie, 78 inf erence, 241 inuences, 164168, 215, 260 information (cogniton), 228, 260 intelligence articielle distribu ee, 28 intention, 229, 267, 270, 299308, 312, 315, 333, 379 sociale, 306 th eorie de Cohen et Levesque, 308 th eorie de Cohen et Levesque, 302 333 intentionnalit e, 225226, 316317 interaction, 63 Internet, 52 interpr etation, 250 logique, 243244 interrogatif, 322, 331, 334
R ef erences bibliographiques epist emique, 248 des d efauts, 257 des pr edicats, 245, 248, 256 modale, 249253 op erationnelle, 254 lois de lunivers, 14, 26, 163, 165, 166, 168, 260, 262, 265
m ediateur, 313, 344350 m ethode, 230 Mace, 30, 146, 213 Mages, 146, 213 Manta, 41, 271, 293, 391398 marquage dans lenvironnement, 202, 218, 434, 440, 444446 dans les r eseaux de Petri, 177, 419, 430 marque de r eseaux de Petri, 176 Mem, 206 mentalais, 241 Mering IV, 145 meute (comportement de), 434436 micro-th eorie, 238, 245 mod` ele des actions, 149 factuel, 264 jeton, 176 notion de, 147 justication (des croyances), 258 pr evisionnel, 264, 265 psychologique, 264 k en etique, 8, 12, 31, 52, 57, 60, 63, 116, mondes synth etiques, 43 128, 237, 240 motivation, 271273 conception, 52 contractuelle, 274 Kbs-Ship, 36 environnementale, 273 KQML, 33, 338340 personnelle, 273 langage contractuelle, 274 communication, 26, 310 h edoniste, 274, 277 dacteurs, 26, 29, 61, 145 relationnelle, 273, 278 impl ementation, 25 sociale (d eontique), 273, 276 repr esentation des connaissances, 26 n egociation, 7, 19, 27, 29, 30, 56, 57, 68, sp ecication et formalisation, 27 77, 82, 85, 116, 332, 420 leader, 381, 385388 neurones, 140 locutoire (acte), 322 logique norme, 228
R ef erences bibliographiques objets et agents, 61 orant, 361388 omniscience logique, 253 organisationnel syst` eme, 85, 230 organisations, 7, 19, 57, 63, 64, 78, 81, 88, 92110, 116, 123129, 266, 280, 395, 408 emergentes, 118, 443 evolutives, 117, 127 analyse des, 94, 122 articielles, 8, 18, 57, 114, 130 collectives, 93 concr` etes, 92, 268 coop eratives, 48 d enition, 91 engagement des, 281 xes, 116, 125, 345 hi erarchiques, 117, 289, 392 individuelles, 93, 129 niveaux, 17, 93, 104, 113 pr ed enies, 118, 345, 392 r eactives, 24 sociologie des, 20 variables, 117, 126, 345 Paladin, 146 Pandora II, 213 passage ` a lacte intentionnel, 285, 299, 308 r eactif, 285298 Pengi, 197, 204 Percept, 194 Percept, 193, 206 percept, 193, 196, 206, 208, 228, 260, 275, 385 PerceptIndice, 196 perception, 231233, 260, 333 active, 233 passive, 233 perception/d elib eration/action, 193 performance, 122 performatif, 322, 330340 perlocutoire (acte), 323, 324 PGP, 429
497 place de r eseaux de Petri, 176 plan, 267, 302 d enition, 155 ex ecution du, 160 fusion de, 424, 426 lin eaire, 158 partiel, 159, 160, 421, 425, 429, 430 total, 159 planication, 22, 131, 155161, 408, 416, 420, 462 centralis ee, 420 pour agents multiples, 420423 critique, 184 de mouvements, 182 de trajectoires, 182, 205 distribu ee, 420, 428 lin eaire, 158 multi-agent, 416430, 433 potentiel daction sp ecique, 276 poursuite (probl` eme de), 44, 379 pr evision, 259 pragmatique, 316 processus, 169171, 417 composition des, 418 proies et pr edateurs (probl` eme de), 44, 379 promissif, 321, 331, 338 protocole, 327, 391 allocation de t aches, 313 pulsion, 229, 274, 275 r ef erent, 242 r eication, 111 r eseau contractuel, 30, 85, 345, 361379, 381, 382 daccointances, 345, 350361, 377, 378 de Petri, 26, 33, 176, 329, 415, 419 color es, 177 de transitions augment e, 174176 r esolution de conits, 8, 36, 56, 68, 77, 82, 428 de contraintes, 463 de probl` emes, 28
498 de probl` emes, 7, 34, 448465 de probl` emes distribu es, 37 distribu ee de probl` emes, 35 par contraintes, 38 par coordination, 38 r etroaction positive, 394 r evision (des croyances), 247, 255 r ole, 95, 268, 344 r` egles dinf erences, 245 d eontiques, 277 de franchissement, 176 raisonnement, 235 React, 166, 168, 194, 406 ReActalk, 146 recuit simul e, 463 redondance, 119, 121 degr e, 120, 127 Reexe, 194, 206 regroupement, 83 relation de satisfaction, 449 entre actions, 406 n egative, 406, 425 organisationnelle, 115 positive, 406, 424 requ ete (cogniton), 228 ressources acc` es aux, 69 limitation des, 70, 81, 283, 403, 433 relations aux, 67 synchronisation, 414415 robotique distribu ee, 50 robots d em enageurs, 49 explorateurs, 47, 76, 80, 83, 89, 123 127, 208, 264, 390, 443 transporteurs, 63, 80 s election daction, 285 s election dactions, 271, 298 s emantique des mondes possibles, 249254 logique, 243 situationnelle, 232
R ef erences bibliographiques Sam, 379388 satisfaction, 449 comportement de, 456 crit` ere de, 462 section critique, 414 signaux, 184, 233, 309, 314, 389, 391, 394 signe, 310 SimDelta, 41 SimPop, 42 simulation multi-agent, 3843 situ e action, 195201 agent, 15, 16, 112 objet, 14 SMA, 14 situation analyse des, 72 collaboration coordonn ee, 70, 403 collaboration simple, 70 comp etition collective, 71 comp etition individuelle, 71 conit collectif, 71 conit individuel, 71 dantagonisme, 66 dind ependance, 70, 403 dindi erence, 66 dinteraction, 65, 69 de collaboration, 76 de coop eration, 65, 66 de r esolution de conits, 77 encombrement, 70 macro/micro, 72 SMA communicant, 14, 212 d enition, 14 situ e, 14, 194, 218 tropique, 21, 194 sociogen` ese, 396 sp ecialisation, 84, 119, 121, 293, 315, 391, 396 degr e, 119, 127 stimuli, 193, 231, 232, 271, 274, 275, 285, 294, 310, 314, 345, 392 Strips, 157, 160163, 165, 166, 205, 215, 416, 453, 462
R ef erences bibliographiques postulats, 162 Yams, 376 StripsStrips, 153 structure egalitaire, 117 comp etitive, 118 hi erarchique, 117, 125 organisationnelle, 92, 122, 126, 268 succ` es et satisfaction (dun acte de langage), 323325, 330 survie, 79 symbole, 242 symbolico-cognitivisme, 240, 241 synchronisation, 216, 413415, 423, 432, 434 de ressources, 415 de mouvements, 413 de plans, 421 de ressources, 414425 syst emique, 57 syst` eme conatif, 229, 230, 268385 d ecisionnel, 273 interactionnel, 228, 231233 motivationnel, 272, 352, 356, 398 organisationnel, 96, 228, 230, 352, 356, 358, 385, 401 ouvert, 29, 238 perceptif, 231 pr evisionnel, 260 repr esentationnel, 229, 233268 v eg etatif, 97, 229 syst` eme ouvert, 447 t ache (cogniton), 230, 276 taquin, 458 taxie, 286 tendance, 13, 229, 271, 274 TMS, 258259 tours de Hano , 456 transition dautomate, 171 de r eseaux de Petri, 176 tri collectif, 84 viabilit e, 32, 66, 270 vie articielle, 28, 31
499

LesSMA Ferber

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

LesSMA Ferber

Uploaded by

Copyright:

Available Formats

ii

Les Syst` emes Multi Agents: vers une intelligence collective

CONTENTS La robotique . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Ce qui ne rel` eve pas de la k en etique . . . . . . . . . . . . . . . 60 63 63 65 65 67 68 69 70 70 70 70 71 71 71 71 72 74 74 75 78 79 81 82 82 83 84 84 85 85 86 86 88 89 91 91 92 93 94 95 95 99

4.7 4.8 4.9

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . structures . . . . . . . 330 . . . . . . . 338

Chapter 1 Principes des syst` emes multi-agents

Pour une intelligence collective

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

1.1. POUR UNE INTELLIGENCE COLLECTIVE

... ` a lorganisation articielle

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

1.1. POUR UNE INTELLIGENCE COLLECTIVE

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

1.1. POUR UNE INTELLIGENCE COLLECTIVE

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

E 1.2. AGENT ET SOCIET

Perceptions Ressources Actions

Agents Objets de l'environnement

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

contraintes et objectifs sociaux

E 1.2. AGENT ET SOCIET

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

E 1.2. AGENT ET SOCIET

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

Reprsentations Reprsentations mixtes symbolico/ uniquement numriques symboliques

Reprsentations non symboliques

E 1.2. AGENT ET SOCIET

Langages, communications et repr esentations

Langages de formalisation et de spcification

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

E 1.2. AGENT ET SOCIET

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

Les premiers ages

1.3. UN PEU DHISTOIRE

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

1.3. UN PEU DHISTOIRE

Linuence de la vie articielle

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

Les temps modernes

1.3. UN PEU DHISTOIRE

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

La r esolution de probl` emes

1.4. DOMAINES DAPPLICATION

Construction de mondes hypothtiques

Conception kntique de programmes

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

1.4. DOMAINES DAPPLICATION

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

1.4. DOMAINES DAPPLICATION et de pr edateurs occupant un m eme territoire. dN1 = r 1 N1 P N 1 N 2 dt dN2 = aP N1 N2 d2 N2 dt

1.4. DOMAINES DAPPLICATION

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

1.4. DOMAINES DAPPLICATION

La construction de mondes synth etiques

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

Proie capture par des prdateurs Proies libres

1.4. DOMAINES DAPPLICATION

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

Proie Attirance vers la proie Chasseur B

1.4. DOMAINES DAPPLICATION

` CHAPTER 1. PRINCIPES DES SYSTEMES MULTI-AGENTS

Lgende Lgende Robots

1.4. DOMAINES DAPPLICATION