You are on page 1of 24

Agents et Systmes

Multi-agents

Adina Magda Florea


Professeur lUniversit Politehnica de Bucarest
adina@cs.pub.ro

URL du cours: http://turing.cs.pub.ro/auf2/


Architectures des agents

Plan

! La rationalit des agents


! Structure conceptuelle des agents
! Architectures des agents intelligents
o Architecture BDI
o Architecture ractive
o Architecture hybride
! Programmation oriente agents
2
Cours Agents et SMA A.M. Florea, UPB
1. La rationalit des agents
! Un agent rationnel est un agent qui agit d'une
manire lui permettant d'obtenir le plus de succs
possible dans la ralisation des tches qu'on lui a
assignes.
! Comment peut-on mesurer le succs d'un agent
"rationnel"?
! Une mesure de performance, si possible
objective, associe une certaine tche que l'agent
doit excuter.

3
Cours Agents et SMA A.M. Florea, UPB
2. Structure conceptuelle des
agents
! Un agent est situ dans un environnement.
E={e1, .., e, ..}

! Environnement
accessible ou inaccessible
dterministe ou non dterministe
statique ou dynamique
discret ou continu

4
Cours Agents et SMA A.M. Florea, UPB
Modlisation des agents

Composante
dcision Agent ractif
action Agent voir : E P
action : P A
Composante Composante env : E x A P(E)
perception excution
voir action

Environment
env

5
Cours Agents et SMA A.M. Florea, UPB
Modlisation des agents

Plusieurs agents ractifs


env : E x A1 x An P(E)
inter : P I
Composante Agent rinter : I A
dcision Composante
action interaction Agent
inter / rinter

Composante Composante
perception excution Agent
voir action

Environment
env

6
Cours Agents et SMA A.M. Florea, UPB
Modlisation des agents

Agents cognitifs
Agents avec tats

! action : S A
! suiv : S x P S
! inter : S x P I
! rinter : S x I A
! voir : E P
! env : E x A P(E)
7
Cours Agents et SMA A.M. Florea, UPB
Modlisation des agents

Agents avec buts


but : E {0, 1}

Agents avec utilit


utilit : E R

Environnement non dterministe env : E x A P(E)


la probabilit estime par l'agent que le rsultat de l'excution
de l'action a dans ltat e sera ltat e

prob( ex( a, e ) = e' )


e' env( e, a)
= 1

8
Cours Agents et SMA A.M. Florea, UPB
Modlisation des agents

! L'utilit attendue d'une action dans l'tat e du


point de vue de l'agent

U (a, e) = prob (ex ( a , e ) = e ' )*utilite (e ' )


e 'env ( e , a )

! Le principe de la plus grande utilit attendue -


utilit attendue maximale, en anglais Maximum
Expected Utility (MEU) - dit qu'un agent rationnel
devrait choisir l'action qui lui apporte la plus
grande utilit attendue.

9
Cours Agents et SMA A.M. Florea, UPB
Comment modliser ce probleme

! Agents ractifs
! Agents avec tats
! Agents avec buts
! Agents avec utilit

10
Cours Agents et SMA A.M. Florea, UPB
3. Architectures des agents
intelligents
3.1 Architecture BDI
Modle "Croyance-Dsir-Intention" de la rationalit d'un agent
intelligent
! Le B = Belief = Croyance
! Les croyances d'un agent sont les informations que l'agent possde sur
lenvironnement et sur d'autres agents qui existent dans le mme
environnement.
! Le D = Desire = Dsir
! Les dsirs d'un agent reprsentent les tats de lenvironnement, et
parfois de lui-mme, que l'agent aimerait voir raliss.
! Le I = Intention = Intention
! Les intentions d'un agent sont les dsirs que l'agent a dcids
d'accomplir ou les actions qu'il a dcid de faire pour accomplir ses
dsirs. 11
Cours Agents et SMA A.M. Florea, UPB
Architecture BDI
B=revc(B,p)
Croayances
Rvision des
croyances

Analyseur
opportunits
Procs de dcision
perceptions

I=options(D,I)
Intentions Dsirs

D=des(B,D,I)
Raisonnement
modalits
Filtre

I=filtre(B,D,I)

Intentions structures
LibP dans plans partiels

PE=plan(B,I)
Plans Execution actions
revc : B x P B est la fonction de rvision des croyances de
l'agent lorsqu'il reoit de nouvelles perceptions sur
lenvironnement, o P reprsente l'ensemble des perceptions de
l'agent; elle est ralise par la composante Rvision des
croyances ;
options : D x I I est la fonction qui reprsente le processus de
dcision de l'agent prenant en compte ses dsirs et ses intentions
courantes; cette fonction est ralise par la composante
Processus de dcision ;
des : B x D x I D est la fonction qui peut changer les dsirs
d'un agent si ses croyances ou intentions changent, pour
maintenir la consistance des dsirs de l'agent (on suppose dans
notre modle que l'agent a toujours des dsirs consistants) ; cette
fonction est galement ralise par la composante Processus de
dcision ;
filtre :B x D x I I est la fonction la plus importante
car elle dcide des intentions poursuivre; elle est
ralise par la composante Filtre.
plan : B x I PE est la fonction qui transforme les
plans partiels en plans excutables, PE tant
l'ensemble de ces plans ; elle peut utiliser, par
exemple, une bibliothque de plans, reprsente par le
module LibP dans la figure.

! Un plan est une squence d'actions excuter dans le


temps
Soient B0, D0 et I0 les croyances, dsirs et intentions initiales de
l'agent.
Algorithme de contrle d'agent BDI
1 B B0
2 D D0
3 I I0
4 rpter
4.1 obtenir nouvelles perceptions p
4.2 B revc(B, p)
4.3 I options(D, I)
4.4 D des(B, D ,I)
4.5 I filtre(B, D, I)
4.6 PE plan(B, I)
4.7 excuter(PE)
jusqu' ce que l'agent soit arrt
fin
Stratgie d'obligation

! Obligation aveugle.Un agent suivant cette stratgie va


maintenir ses intentions jusqu' ce qu'elles soient
ralises, plus prcisment jusqu' ce qu'il croie qu'elles
sont ralises.
! Obligation limite. Cette stratgie dit que l'agent va
maintenir ses intentions ou bien jusqu' ce quelles soient
ralises ou bien jusqu' ce quil croie quelles ne sont
plus ralisables.
! Obligation ouverte. Un agent ayant une stratgie
d'obligation ouverte maintient ses intentions tant que ces
intentions sont aussi ses dsirs; une fois que l'agent a
conclu que ses intentions ne sont plus ralisables, il ne
les considre plus parmi ses dsirs. 16
Cours Agents et SMA A.M. Florea, UPB
3.2 Architecture ractive

Architecture ractive de subsomption


Module Competence (2)
Exploration de
l'environnement

Node
Composante Node de
Entre d'inhibition Composante Sortie
perception supression excution
Module Competence (1)
Deplacement dans
l'environnement

Module Competence (0)


Eviter les obstacles

17
Cours Agents et SMA A.M. Florea, UPB
! Le fonctionnement de l'agent - rgles de comportement,
"behaviour rules" en anglais.
! Une rgle de comportement est semblable une rgle de
production et elle a deux parties: une condition c et une action a.
! L'ensemble de rgles de comportement
Comp = {(c, a) | cP, aA}
! Chaque module de comptence a associ un sous-ensemble des
rgles de comportement spcifiques ses comptences.
! Relation d'ordre ou relation inhibitrice totale sur l'ensemble
Comp, : Copm x Comp qui tablis la priorit des modules de
comptence.
! R - l'ensembles des rgles de comportement qui peuvent tre
excutes un certain moment
! Les rgles qui sont effectivement excuts sont
{(c, a)| (c', a') tel que (c', a') (c, a)}
3.3. Architecture hybride

! Systme InteRRaP ("Integration of Reactive


Behavior and Rational Planning" = Intgration du
comportement ractif et planification rationnelle).

! L'architecture InteRRaP est une architecture en


couches avec des couches verticales o les
donnes d'entre, notamment les perceptions,
passent d'une couche l'autre.

19
Cours Agents et SMA A.M. Florea, UPB
Sortie

Composante excution

Architecture hybride
Couche n
en couches verticales
Couche n-1


Couche 1

Composante perception

Entre
Couche
planification AR PE BC-Sociale
cooprative

Couche
Architecture planification BC-Planification
AR PE
InteRRaP locale

Couche BC-Monde
comportement AR PE
ractif

Perceptions Actions Communication

Environnement
Architecture TuringMachine

! Le systme TuringMachine.
! L'architecture du systme est une architecture en
couches horizontales, semblable l'organisation
de l'architecture de subsomption, o chaque
couche est responsable excuter des actions de
plus en plus complexes.
Couche n
Composante Composante
perception action
Couche 2
Couche 1

Architecture horizontale
22
Cours Agents et SMA A.M. Florea, UPB
4. Programmation oriente agents
POO POA

Unit de base objet agent

Paramtres dfinissant pas de contraintes croyances, dcisions, Programmation


l'tat de l'unit de base obligations, habilits
Oriente Objets
versus
Procs de calcul envoi des messages et envoi des messages et Programmation
mthodes pour la mthodes pour la
rponse rponse Oriente Agents

AGENT0
Types de messages pas de contraintes informer, demander,
offrir, promettre, Yoav Shoham
accepter, rejeter,

Contraintes sur les pas de contraintes consistance, vrit,


mthodes

23
Cours Agents et SMA A.M. Florea, UPB
D'autres diffrences entre POO et POA

! les agents sont autonomes alors que les objets ne le sont pas; un agent
va dcider par son propre procs de dcision s'il excute ou pas une
action requise;
! les agent ont leurs propres buts et ils agissent d'une manire pro-active
pour atteindre leurs buts (par exemple saisissent de opportunits) alors
que les objets ne le font pas;
! les agents sont capable d'un comportement social et ils peuvent
sengager dans des interactions complexes, par exemple coopration,
comptition, ngociation, avec d'autres agents; ce n'est pas le cas des
objets;
! un systme multi-agents est, normalement, un systme o les agent
correspondent des fils dexcution spars; chaque agent a son
propre fil dexcution alors que les objets, part les objets concurrents,
ne prsentent pas cette caractristique.
24
Cours Agents et SMA A.M. Florea, UPB