You are on page 1of 105

Modelarea și analiza

sistemelor multi-agent
5. Teoria jocurilor (II)
Florin Leon
Universitatea Tehnică „Gheorghe Asachi” din Iași
Facultatea de Automatică și Calculatoare

http://florinleon.byethost24.com/curs_masma.htm

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm


Teoria jocurilor (II)
Jocuri de sumă generală cu doi agenți
1. Reducerea la jocuri de sumă nulă
2. Echilibru Nash pur
3. Echilibru Nash mixt
4. Jocuri cooperante
Jocuri cooperante cu n agenți
5. Reprezentarea jocurilor în forma caracteristică
6. Nucleul
7. Valoarea Shapley
8. Nucleolus

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 2


Teoria jocurilor (II)
Jocuri de sumă generală cu doi agenți
1. Reducerea la jocuri de sumă nulă
2. Echilibru Nash pur
3. Echilibru Nash mixt
4. Jocuri cooperante
Jocuri cooperante cu n agenți
5. Reprezentarea jocurilor în forma caracteristică
6. Nucleul
7. Valoarea Shapley
8. Nucleolus

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 3


Jocuri bimatriceale
 Jocurile de sumă generală (sau nenulă)
se mai numesc și bimatriceale

 Pentru jocurile de sumă nulă, R = – C

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 4


Reducerea la un joc de sumă nulă
 Un joc bimatriceal cu matricele R și C poate fi redus
la un joc de sumă nulă dacă există α > 0 și β, E fiind
matricea unitate (Eij = 1), astfel încât:

 Pentru exemplul anterior:

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 5


Exemplu de calcul (I)

α și β se obțin din ecuațiile


⇒ α = 2, β = 1 corespunzătoare primei linii și
se verifică în ecuațiile
corespunzătoare liniei a doua

Jocul nu poate fi redus

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 6


Exemplu de calcul (IIa)

Dacă α = 1/5 și β = – 2, atunci:

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 7


Exemplu de calcul (IIb)
 Jocul se reduce la un joc de sumă nulă cu matricea:

 Este un exemplu rezolvat în cursul anterior, cu strategiile de


echilibru mixt R: (4/7, 3/7) și C: (2/7, 0, 5/7, 0, 0), iar valoarea
jocului este v = 1/7
 Câștigul așteptat al lui Colin este:
 E [PC] = – v = – 1/7

 Avem: α · E [PR] + β = – E [PC] α = 1/5, β = – 2


 Câștigul așteptat al lui Rose este:
 E [PR] = 1/α · (v – β) = 5 · (1/7 + 2) = 75/7

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 8


Teoria jocurilor (II)
Jocuri de sumă generală cu doi agenți
1. Reducerea la jocuri de sumă nulă
2. Echilibru Nash pur
3. Echilibru Nash mixt
4. Jocuri cooperante
Jocuri cooperante cu n agenți
5. Reprezentarea jocurilor în forma caracteristică
6. Nucleul
7. Valoarea Shapley
8. Nucleolus

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 9


Echilibrul Nash
 O combinație de strategii este un echilibru Nash dacă
fiecare agent își maximizează câștigul, date fiind
strategiile folosite de ceilalți agenți
 Echilibrul Nash identifică acele combinații de strategii
care sunt stabile, în sensul că fiecare agent este
mulțumit cu acțiunea aleasă, date fiind acțiunile
celorlalți
 Comportamentul generat de un echilibru Nash este
de așteptat să persiste în timp

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm


Echilibrul Nash
 Echilibru Nash pentru o strategie pură
ui (si , si )  ui (si , si )
* * *

Câștigul Strategia Deterministă,


Strategiile
(utilitatea) agentului i care nu implică
celorlalți agenți
agentului i probabilități
cu excepția lui i
Strategia din
echilibrul Nash

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 11


Echilibrul Nash
 Echilibrul Nash pentru o strategie pură
ui (si , si )  ui (si , si )
* * *

 Echilibrul Nash este strict dacă:


ui (si , si )  ui (si , si )
* * *

 Stările din care niciun agent nu-și poate


mări câștigul prin schimbarea
unilaterală a strategiei

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 12


Calculul echilibrelor Nash pure
 Se evidențiază maximele pe linii pentru primul agent
cu {
 Se evidențiază maximele pe coloane pentru al doilea
agent cu }
 Stările încadrate de { } sunt echilibre Nash pure

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 13


Exemple
Dilema deținutului

Bătălia sexelor

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 14


Tragedia pășunii comunale
 engl. “the tragedy of the commons”
 Pășunea este folosită în comun de 6 țărani,
fiecare cu câte o vacă

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 15


Tragedia pășunii comunale
 Fiecare vacă dă 20 de litri de lapte pe zi
 Capacitatea pășunii este de 8 vaci
 Pentru fiecare vacă peste 8, producția de
lapte scade cu 2 litri
 Există mai puțină iarbă de păscut pentru fiecare
vacă, deci și mai puțin lapte

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 16


20 litri 20 litri

20 litri
20 litri

20 litri 20 litri

Producția zilnică totală de lapte: 120 litri


Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm17
Țăranii vor să-și maximizeze producția de lapte

“O să cumpăr încă o vacă”

40 litri 20 litri

20 litri
20 litri

20 litri 20 litri

Producția zilnică totală de lapte: 140 litri (7 vaci)


Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm18
Acum s-a atins capacitatea maximă a pășunii. Dar țăranii nu se opresc.

“Atunci și eu o să-mi cumpăr”

40 litri 40 litri

20 litri
20 litri

20 litri 20 litri

Producția zilnică totală de lapte: 160 litri (8 vaci)


Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm19
36 litri 36 litri
“O să-mi iau încă una”

18 litri
36 litri

18 litri 18 litri

Producția zilnică totală de lapte: 162 litri (9 vaci)


Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm20
32 litri 32 litri

16 litri
32 litri

16 litri “Vaca produce acum mai puțin,


32 litri
dar 2 vaci o să rezolve problema”

Producția zilnică totală de lapte: 160 litri (10 vaci)


Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm21
28 litri 28 litri

14 litri
28 litri

“O să-mi cumpăr încă una”


28 litri 28 litri

Producția zilnică totală de lapte: 154 litri (11 vaci)


Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm22
“Toată lumea își cumpără
24 litri 24 litri
încă o vacă, deci și eu”

24 litri
24 litri

24 litri 24 litri

Producția zilnică totală de lapte: 144 litri (12 vaci)


Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm23
“Încă pot crește producția
dacă iau și a treia vacă”

30 litri 20 litri

20 litri
20 litri

20 litri 20 litri

Producția zilnică totală de lapte: 130 litri (10 vaci)


Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm24
200

Producția maximă de lapte


pentru pășune: 162 litri/zi

150
Producția totală
pentru toate vacile

100
Milk Production (in liters)

50

0
0 2 4 6 8 10 12 14 16 18 20

Nivelul inițial
Ţăranii vor continua să
cumpere vaci până când sunt
-50
15 vaci în total pe pășune
Câștigul sau pierderea
pentru un țăran la
cumpărarea unei noi vaci

-100
Numărul total
Total Cowde
s vaci

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm25


200

Producția maximă de lapte


pentru pășune: 162 litri/zi

150
Producția totală
pentru toate vacile
Diferența
100
Milk Production (in liters)

50

0
0 2 4 6 8 10 12 14 16 18 20

Nivelul inițial
Optimul Rezultatul
-50
social comportamentului
individual rațional
-100
Numărul total
Total Cowde
s vaci

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm26


Soluții?
 Acord de cooperare între țărani
 Împărțirea profitului pentru cele 3 vaci în plus
 Consolidare
 O firmă gestionează toate vacile și devine un singur centru de
profit
 Reglementări ale „statului”
 Stabilirea unui număr maxim de vaci pe pășune sau impunerea
redistribuirii profitului

 Proiectarea mecanismelor (mechanism design)


 Stimulente și penalizări pentru agenții individuali astfel încât să fie
tentați să atingă optimul social
 Problemă încă deschisă
Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 27
Beneficiul social și
beneficiul individual
 Partajarea (sharing) în rețele P2P
 Poluarea
 ... în general, managementul resurselor din
proprietatea comună

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 28


Teoria jocurilor (II)
Jocuri de sumă generală cu doi agenți
1. Reducerea la jocuri de sumă nulă
2. Echilibru Nash pur
3. Echilibru Nash mixt
4. Jocuri cooperante
Jocuri cooperante cu n agenți
5. Reprezentarea jocurilor în forma caracteristică
6. Nucleul
7. Valoarea Shapley
8. Nucleolus

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 29


Jocul ajutorului social
engl. “the welfare game”

 Guvernul vrea să ajute un cerșetor doar dacă acesta


vrea să muncească
 Cerșetorul își caută de lucru doar dacă nu ia ajutor de
la stat

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 30


Jocul ajutorului social

(Aid, Try to work) nu este EN Pauper preferă Be idle


(Aid, Be Idle) nu este EN: Govt preferă No Aid
(No Aid, Be Idle) nu este EN: Pauper preferă Try to Work
(No Aid, Try to Work) nu este EN: Govt preferă Aid
Jocul nu are echilibru Nash!
Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 31
Jocul ajutorului social

(Aid, Try to work) nu este EN Pauper preferă Be idle


(Aid, Be idle) nu este EN: Govt preferă No aid
(No Aid, Be Idle) nu este EN: Pauper preferă Try to Work
(No Aid, Try to Work) nu este EN: Govt preferă Aid
Jocul nu are echilibru Nash!
Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 32
Jocul ajutorului social

(Aid, Try to work) nu este EN Pauper preferă Be idle


(Aid, Be idle) nu este EN: Govt preferă No aid
(No Aid, Be idle) nu este EN: Pauper preferă Try to work
(No Aid, Try to work) nu este EN: Govt preferă Aid
Jocul nu are echilibru Nash!
Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 33
Jocul ajutorului social

(Aid, Try to work) nu este EN Pauper preferă Be idle


(Aid, Be idle) nu este EN: Govt preferă No Aid
(No Aid, Be idle) nu este EN: Pauper preferă Try to work
(No Aid, Try to work) nu este EN: Govt preferă Aid
Jocul nu are echilibru Nash (pur)!
Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 34
Strategii pure și mixte
 Strategie pură
 Agentul i alege strategia sij din mulțimea Si

 Strategie mixtă
 Agentul i alege strategia sij cu probabilitatea pij
 pij  0, j pij = 1
 Orice strategie pură este de asemenea și o strategie
mixtă
 Un joc finit are întotdeauna cel puțin un echilibru
Nash pur sau mixt
 O strategie mixtă are întotdeauna un echilibru Nash

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 35


Strategii mixte
 Câștigul în strategii mixte este câștigul așteptat
 Fie 1 câștigul cu strategia s1 și 4 cu strategia s2
 Strategia mixtă (0.3, 0.7) dă câștigul așteptat
0.3 · 1 + 0.7 · 4 = 3.1
 Un câștig sigur de 3.1 este echivalent cu un câștig
așteptat într-un joc cu câștiguri de 1 și 4 cu
probabilitățile 0.3 respectiv 0.7

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 36


Strategii mixte: interpretare
 Jocuri în care se pot aplica simultan strategii multiple
 Pariurile pe mai mulți cai
 Instanțe multiple ale aceluiași joc
 Scenariu de război: qij % din piloți urmează strategia sij
 Același joc repetat la infinit
 Pentru un singur joc: distribuția de probabilitate este
estimarea oponenților asupra deciziei unui agent

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 37


Metoda resturilor
 engl. “oddment method”
 Metodă simplă pentru calculul echilibrelor
Nash mixte
 Dacă jocul are un echilibru Nash pur,
metoda nu se aplică

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 38


Strategiile pentru Pauper

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 39


Strategiile pentru Government

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 40


Echilibrul Nash în jocul ajutorului
social cu strategie mixtă

 Dacă Government alege o probabilitate de 0.5 pentru


Aid, Pauper nu poate profita de pe urma acestei decizii
în alegerea uneia din acțiunile Work sau Be idle
 Câștigul Pauper (Work) = 0.5 · 2 + (1 – 0.5) · 1 = 1.5
 Câștigul Pauper (Be idle) = 0.5 · 3 + (1 – 0.5) · 0 = 1.5

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 41


Echilibrul Nash în jocul ajutorului
social cu strategie mixtă

 Dacă Pauper alege Try to work cu probabilitatea 0.2,


Government va fi indiferent între Aid și No aid
 Câștigul Govt (Aid) = 0.2 · 3 + (1 – 0.2) · (–1) = –0.2
 Câștigul Govt (No aid) = 0.2 · (–1) + (1 – 0.2) · 0 = –0.2

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 42


Echilibrul Nash în jocul ajutorului
social cu strategie mixtă

 Pentru probabilitățile 0.5 și 0.2, atât Government cât


și Pauper au câștiguri egale pentru ambele acțiuni,
ceea ce permite existența unui echilibru Nash

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 43


Metoda 2

 Determinarea strategiei pentru Pauper


 3 · x + (–1) · (1 – x) = (–1) · x + 0 · (1 – x)
 ⇒ x = 0.2, 1 – x = 0.8
 Determinarea strategiei pentru Government
 2 · y + 1 · (1 – y) = 3 · y + 0 · (1 – y)
 ⇒ y = 0.5, 1 – y = 0.5

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 44


Stabilitatea
 Dar dacă un agent părăsește strategia de
echilibru, oponentul poate profita pentru a
câștiga mai mult decât ar câștiga la echilibru

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 45


Optimalitatea Pareto
 Un rezultat este optim Pareto dacă este:
 mai bun sau la fel decât alt rezultat din toate punctele de
vedere și
 mai bun strict din cel puțin un punct de vedere
 Un rezultat R1 domină un rezultat R2 dacă și numai
dacă:
 R1 nu este inferior lui R2 în raport cu toate elementele:
i, R1(i) ≥ R2(i)
 R1 este strict superior lui R2 în raport cu cel puțin un
element: i, R1(i) > R2(i)
 Rezultatele nedominate sunt optime Pareto
Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 46
Stări optime Pareto
 Într-o stare optimă Pareto, agenții nu au motivația de
a devia în coaliție
 De exemplu: dilema deținutului
 Ambii agenți au câștig mai mare împreună dacă ambii neagă

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 47


Interpretare
 Optimalitatea Pareto înseamnă o situație mai bună
pentru cel puțin un agent fără a dezavantaja niciun
alt agent
 Optimalitatea Pareto nu înseamnă „egalitate”
 De exemplu împărțirea unui tort între 3 persoane A, B, C
 A ia 70%, B ia 30%, C nu ia nimic
 Această stare este un echilibru optim Pareto, deoarece
pentru a-i da lui C ceva, A sau B ar trebui să renunțe la ceva
 Totuși, implică alocarea tuturor resurselor
 O stare în care A ia 50%, B ia 30% și C nu ia nimic nu este
optimă Pareto
 C poate lua 20% fără a-i afecta pe A sau B

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 48


Aplicații ale optimalității Pareto
 Probleme de optimizare
 Traficul în rețele de calculatoare
 Planificarea task-urilor
 Planificarea producției
 Proiectarea componentelor
 Procesele de reacții chimice
 Economie
 Analiza eficienței de piață
 Îmbunătățirea sistemului de impozitare
 Etc.

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 49


Interpretarea grafică

Pentru jocul:

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 50


Câștiguri neliniare

Toți agenții joacă 1 cu


probabilitatea x și 2 cu
probabilitatea 1 – x

Câștigul așteptat pentru A

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 51


Soluția diferențială

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 52


Exploatarea soluției diferențiale
_
 Presupunem că B și C folosesc strategia cu x* = 1/√3
 A poate exploata acest fapt alegând y = 0

> 0.385

<0
Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 53
Interpretarea grafică

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 54


Exemplu mai complex

Intersecția se poate
determina prin
metode numerice

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 55


Teoria jocurilor (II)
Jocuri de sumă generală cu doi agenți
1. Reducerea la jocuri de sumă nulă
2. Echilibru Nash pur
3. Echilibru Nash mixt
4. Jocuri cooperante
Jocuri cooperante cu n agenți
5. Reprezentarea jocurilor în forma caracteristică
6. Nucleul
7. Valoarea Shapley
8. Nucleolus

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 56


Cooperarea
 În jocurile anterioare, agenții erau raționali și egoiști
 Prin cooperare, agenți pot obține un câștig mai mare
 Rezultatul în care suma utilităților este maximă
 Problema este împărțirea câștigului suplimentar
obținut
 Soluția corectă reprezintă pozițiile de negociere ale
celor doi agenți
 Poziția de negociere ≠ abilitatea de negociere

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 57


Exemplul 1

 Dacă nu există cooperare, jocul are:


 Echilibre Nash pure: (10, 40) și (40, 10)
 Echilibru Nash mixt: Renault (0.5, 0.5) și Peugeot (0.8, 0.2),
cu câștig 0 pentru ambele companii

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 58


Cooperarea
 Matricea sumă (sum matrix) a jocului reflectă câștigul
total care poate fi obținut prin cooperare

 Matricea amenințărilor (threat matrix) este utilizată


pentru descrierea puterii de negociere a agenților

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 59


Interpretare

 Prima linie cuprinde doar valori pozitive, deci R are o poziție


puternică de negociere (indiferent ce ar alege P, R câștigă mai
mult)
 Dacă nu se ajunge la o înțelegere, R amenință că va alege F
 P câștigă 10 în loc de 40
 P are o poziție slabă de negociere deoarece amenințarea de a
alege F poate fi contracarată de către R prin folosirea strategiei
mixte (0.5, 0.5), care este de asemenea un echilibru
 P câștigă 0 în loc de 40
 Diferențiala amenințării (threat differential) este valoarea jocului
pentru matricea amenințărilor, în acest caz, 30
Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 60
Soluția
 Soluția pentru un joc cooperant cu doi agenți:
 Câștigul total este valoarea maximă din matricea sumă
 Diferența de câștig dintre agenți este diferențiala amenințării
 Pentru exemplul anterior:
 Câștigul total = 50
 Diferența câștigurilor = 30
 R + P = 50 și R – P = 30
 Prin urmare, R obține 40 iar P obține 10
 Nu contează strategiile jucate, atât timp cât se obține câștigul
total și se respectă modul de împărțire a acestuia
 Pentru strategiile (R:F / P:M), câștigurile agenților sunt cele date direct de
rezultatul jocului
 Pentru strategiile (R:M / P:F), P trebuie să îi plătească 30 de unități lui R

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 61


Exemplul 2

 Câștigul total maxim este 5


 Matricea amenințărilor este:

 Diferențiala amenințării este 1, deoarece combinația de


strategii (1, 2) reprezintă un punct șa
 Soluția jocului: R câștigă 3, C câștigă 2
 Agenții joacă (R:2 / C:1) și Colin îi plătește 2 unități lui Rose

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 62


Teoria jocurilor (II)
Jocuri de sumă generală cu doi agenți
1. Reducerea la jocuri de sumă nulă
2. Echilibru Nash pur
3. Echilibru Nash mixt
4. Jocuri cooperante
Jocuri cooperante cu n agenți
5. Reprezentarea jocurilor în forma caracteristică
6. Nucleul
7. Valoarea Shapley
8. Nucleolus

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 63


Definiții
 Fie mulțimea de agenți { P1, P2, ..., Pn }
 Marea coaliție este mulțimea tuturor agenților:
G = { P1, …,Pn }
 O coaliție reprezintă orice submulțime nevidă a lui G
 Fiecare coaliție încearcă să-și maximizeze câștigul
 Funcția caracteristică v înregistrează câștigul maxim
pentru fiecare coaliție (valoarea coaliției)
 Joc superaditiv:
 v(S ⋃ T) ≥ v(S) + v(T), unde S și T sunt coaliții fără agenți
comuni

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 64


Alocare
 O alocare (imputation) este mulțimea de câștiguri
(x1, x2, ..., xn) care satisface următoarele condiții:
 Suma câștigurilor este maximul posibil
 Fiecare agent obține un câștig cel puțin
la fel de bun ca acela obținut dacă nu
ar coopera
 O alocare este o împărțire eficientă și individual
rațională

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 65


Exemplul 1
 Fie un joc cu 3 agenți: P1, P2, P3
 Fiecare poate alege cap (H) sau pajură (T)
 Dacă doi agenți aleg la fel iar al treilea diferit, acesta va plăti
câte 1 unitate fiecăruia din ceilalți doi. Altfel, toți agenții primesc
0 în total
 ν({P1, P2, P3}) = 0 (împreună nu pot câștiga nimic)
 Presupunem că se formează coaliția S = {P2, P3}
 Contra-coaliția va fi Sc = {P1}
 Rezultă un joc de sumă nulă cu matricea:

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 66


Exemplul 1 S dorește să-și
maximizeze câștigul

 Coloanele 2 și 3 sunt dominate


(0 < 1 și –2 < 1)

 Valoarea jocului este –1 (echilibru minimax mixt)


 ν({P1}) = –1 (cât se așteaptă să câștige P1)
 ν({P2, P3}) = 1 (cât se așteaptă să câștige coaliția S)
 Datorită simetriei jocului, funcția caracteristică este:

 Alocări: xi ≥ –1, i = 1, 2, 3; x1 + x2 + x3 = 0

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 67


Exemplul 2
 ν({P1, P2, P3}) este
câștigul total maxim
care poate fi câștigat
din cele 8 combinații
 ν({P1, P2, P3}) = 1

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 68


Exemplul 2
 Fie S = {P1, P3} și Sc = {P2}

 Sc: (1/3, 2/3)


 S: (1/3, 0, 2/3, 0)
 ⇒ v({P1, P3}) = 4/3, v({P2}) = –1/3
 Analog:
 v({P1, P2}) = 1, v({P3}) = 0
 v({P2, P3}) = 3/4, v({P1}) = 1/4

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 69


Teoria jocurilor (II)
Jocuri de sumă generală cu doi agenți
1. Reducerea la jocuri de sumă nulă
2. Echilibru Nash pur
3. Echilibru Nash mixt
4. Jocuri cooperante
Jocuri cooperante cu n agenți
5. Reprezentarea jocurilor în forma caracteristică
6. Nucleul
7. Valoarea Shapley
8. Nucleolus

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 70


Nucleul
 Nucleul (core) unui joc cu n agenți este mulțimea alocărilor
nedominate
 Nucleul unui joc cu funcția caracteristică v este mulțimea tuturor
alocărilor x = (x1, x2, ..., xn) astfel încât pentru orice coaliție
S = {Pi1, Pi2,…, Pim} avem: xi1 + xi2 + … + xim ≥ v(S)
 Orice alocare din nucleu poate fi privită ca o soluție a jocului
 Nucleul este stabil
 Dacă o alocare nu se află în nucleu, atunci există cel puțin o
coaliție ai cărei membri nu obțin câștigul maxim pe care l-ar
putea obține altfel. Acești agenți preferă o altă alocare

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 71


Exemplul 1
 3 studenți doresc să cumpere o carte, care costă 110$
 Pentru 2 cărți sau 3 cărți cumpărate împreună, există
o reducere de 10$, respectiv 20$ / exemplar
 Valorile coalițiilor exprimă banii economisiți

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 72


Exemplul 1

 Fie x = (x1, x2, x3) o alocare din nucleu. Atunci:

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 73


Exemplul 2

 Fiind un joc de sumă nulă, are nucleul vid (jocul este instabil)
 Fie x = (x1, x2, x3) o alocare din nucleu
 Vom avea:
 Deoarece x este o alocare:

 Prin urmare:
 Similar obținem x1 ≤ –1 și x2 ≤ –1
 Dar valorile obținute contrazic condiția: x1 + x2 + x3 = 0
 În concluzie, x nu poate fi o alocare și deci nucleul este vid
 Nu există o alocare astfel încât fiecare agent să fie mulțumit

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 74


Exemplul 3
 Un vânzător S vrea să vândă un cal. Pentru S, dacă
nu este vândut, calul nu valorează nimic
 Un fermier F și un măcelar B vor să îl cumpere
 Pentru F, calul valorează 1000$
 Pentru B, calul valorează 500$

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 75


Exemplul 3

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 76


Exemplul 3

B nu primește nimic, dar


prezența lui este importantă
pentru poziția de negociere
a vânzătorului S

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 77


Normalizarea unui joc
 Albert, Bobbie și Colin doresc să cumpere o
carte de 110$
 Albert are un card de reduceri
 Costul cărților este următorul:

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 78


Normalizarea unui joc

După normalizare, fiecare coaliție reprezintă câștigul suplimentar al jucătorilor


din coaliție în raport cu suma câștigurilor individuale

De exemplu: v({A, B}) = 100 + 110 – 140 = 70

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 79


Interpretarea grafică a nucleului

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 80


Nucleu vid
 Western Union (W),
Hughes Aircraft (H) și
General Telephone (G)
își pot lansa sateliți de
comunicație individuali,
sau pot folosi împreună
niște sateliți, în diverse
combinații
 Costurile sunt exprimate
în milioane de dolari

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 81


Teoria jocurilor (II)
Jocuri de sumă generală cu doi agenți
1. Reducerea la jocuri de sumă nulă
2. Echilibru Nash pur
3. Echilibru Nash mixt
4. Jocuri cooperante
Jocuri cooperante cu n agenți
5. Reprezentarea jocurilor în forma caracteristică
6. Nucleul
7. Valoarea Shapley
8. Nucleolus

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 82


Valoarea Shapley
 Nucleul oferă o mulțime de soluții pentru un joc
 Unele jocuri nu au nucleu
 Nu există o modalitate de a evalua „corectitudinea”
alocărilor din nucleu
 Ideea de bază a valorii Shapley:
 Fiecare agent trebuie să primească un câștig corespunzător
contribuției sale marginale la coaliție
 Pentru n agenți, există n! ordonări în care un agent
se poate alătura celorlalți
 Valoarea Shapley reprezintă media după toate ordonările
posibile

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 83


Valoarea Shapley: definiție

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 84


Exemplul 1
 Fie un joc cu doi agenți și următoarea formă
caracteristică: v({ }) = 0, v({1}) = 1, v({2}) = 3,
v({1, 2}) = 6
 Sunt 2! permutări posibile: (1, 2) și (2, 1)
 Valorile Shapley:

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 85


Exemplul 2

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 86


Calculul valorii Shapley pentru
un singur agent

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 87


Exemplu

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 88


Proprietăți
 Valoarea Shapley există întotdeauna, este unică și
este întotdeauna fezabilă (suma câștigurilor agenților
este maximă)
 Poate să nu aparțină nucleului, chiar dacă jocul are
nucleu; în acest caz, este instabilă
 Presupune un efort de calcul mare
 Poate fi folosită pentru un număr mic de agenți
 Dar există metode de calcul aproximative
 Într-un sistem multi-agent real, chiar calculul valorilor
sub-coalițiilor poate fi foarte complex

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 89


Teoria jocurilor (II)
Jocuri de sumă generală cu doi agenți
1. Reducerea la jocuri de sumă nulă
2. Echilibru Nash pur
3. Echilibru Nash mixt
4. Jocuri cooperante
Jocuri cooperante cu n agenți
5. Reprezentarea jocurilor în forma caracteristică
6. Nucleul
7. Valoarea Shapley
8. Nucleolus

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 90


Modul de calcul
 Pentru fiecare alocare x și coaliție S, definim excesul
lui S în x astfel:

 Excesul poate fi considerat o măsură a „nefericirii”


coaliției S în cazul alocării x
 Scopul este de a găsi alocarea care minimizează
cel mai mare exces es(x)
 Încercăm să facem cea mai nefericită coaliție cât mai
puțin nefericită

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 91


Exemplul 1
 Fie jocul cu următoarea formă caracteristică:
v(A) = v(B) = v(C) = 0
v(AB) = 60, v(AC) = 80, v(BC) = 100, v(ABC) = 105
 Începem cu o alocare arbitrară, x = (20, 35, 50)
 Calculăm excesele:

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 92


Exemplul 1
 Excesul cel mai mare este eBC(x) = 15
 Îl putem minimiza prin alegerea unei alocări care oferă
un câștig mai mare coaliției BC (mai puțin lui A)
 Deoarece eAC(x) > eAB(x), putem lua 5 de la A și să îi
dăm lui C
 Obținem o nouă alocare y = (15, 35, 55)

 Rezultatul obținut este minimul: orice exces micșorat în


continuare va conduce la mărirea altuia
Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 93
Interpretarea geometrică
 Nucleolus este
punctul cel mai
interior al nucleului

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 94


Exemplul 2
 Fie jocul cu următoarea formă caracteristică:
v(A) = v(B) = v(C) = 0
v(AB) = 4, v(AC) = 0, v(BC) = 3, v(ABC) = 6
 Începem cu x = (2, 3, 1)

cel mai mare exces


Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 95
Exemplul 2
 eABC(x) nu poate fi minimizat (excesul marii coaliții este
întotdeauna 0)
 Alegem următorul exces maxim:
eC(x) = eAB(x) = eBC(x) = –1
 Luăm 0.5 de la A și dăm lui B
 Obținem nucleolus y = (1.5, 3.5, 1)

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 96


Interpretarea geometrică

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 97


Proprietăți
 Există întotdeauna și este unic
 Se află în nucleu dacă nucleul nu este vid – este stabil
 Se calculează iterativ, rezolvând succesiv o serie de programe
liniare

 Pentru 3 agenți, există formule directe (vezi suportul de curs)

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 98


Valoarea Shapley vs. nucleolus

 Valoarea Shapley - φ  Nucleolus - ν

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 99


Aplicații în viața reală
 Distribuirea costurilor hidroelectrice în India

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 100


Costurile

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 101


Valorile coalițiilor

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 102


Valorile Shapley

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 103


Nucleul, nucleolus,
valoarea Shapley

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 104


Distribuția costurilor

 Tamil Nadu (T) ar trebui să plătească în jur de 75%


 Andhra Pradesh (A) restul de 25%
 Kerala-Mysore (K) are resurse importante și deci nu ar trebui
să plătească nimic

Florin Leon, Modelarea si analiza sistemelor multi-agent, http://florinleon.byethost24.com/curs_masma.htm 105

You might also like