Professional Documents
Culture Documents
Theory
Theory
BEOGRAD
SEMINARSKI RAD
Tema:
TEORIJA IGARA
(Neov ekvilibrijum)
Vladimir Mii
br. ind. 20/2000
Teorija igara
1 Uvod
U svakodnevnom ivotu, podjednako poslovnom i privatnom, okruenje esto nije
amorfna masa, ve po pravilu sreemo pojedince ili ( interesne ) grupe ije su aktivnosti
relevantne, a ponekad i presudne za nae odluke. Istovremeno, nae aktivnosti imaju
povratni uticaj na odluke istih subjekata ili grupa, pa konani rezultati koje svako od nas
postie predstavljaju proizvod brojnih individualnih odluka i njihovih interakcija.
Ponekad se ovi uticaji zasnivaju na saglasnim interasima, dobroj volji i elji da
pomognemo jedni drugima, dok u drugim sluajevima proistiu iz konfliktnih interesa,
animoziteta, pa i neprijateljstva. Situacije deliminog ili potpunog konflikta izmedju
razliitih donosilaca odluka nazivamo igrama.
Teorija igara predstavlja matematiku teoriju i metodologiju koja se koristi za
analizu i reavanje konfliktnih i delimino konfliktnih situacija u kojima uesnici imaju
suprotstavljene interese.Razmatranje situacija u kojima dva ili vise subjekata donose
odluke u uslovima sukoba interesa nazvano je teorijom igara zato to tipine primere
ovakvih situacija predstavljaju razliite drutvene igre, kao to su sportske utakmice,
kartake igre (poker, bridz, i sl.), ah, itd. Naravno, iako je vei deo termina koji se
koriste u okviru matematike teorije igara slian terminologiji drutvenih igara, teorija
igara ima mnogo iru primenu i koristi se za modeliranje konfliktnih situacija u
matematici, politici, ekonomiji, vojnoj strategiji, itd. Pri tome, neophodno je istai da
metodi teorije igara slue za analizu i reavanje takvih konfliktnih situacija koje
karakterie viekratno ponavljanje pojedinih odluka o moguem razreenju sukoba
interesa izmedju uesnika, tj. igraa.
Prvi radovi iz domena teorije igara datiraju jo od prve polovine devetnaestog veka,
od radova Cournot-a i Bertrand-a, koji su nagovestili mogunost korienja teorije igara
za potrebe ekonomske analize, posebno u analizi proizvodnje i cena. Meutim, ideju
opte teorije igara na teorijski konzistentan nain prvi su predstavili John von Neumann i
Oskar Morgenstern 1944. godine u svom fundamentalnom radu Teorija igara i
ekonomsko ponaanje. U tom radu pokazano je da se mnogi ekonomski problemi mogu
veoma uspeno modelirati korienjem teorije igara i predstavljene su igre u ekstenzivnoj
i normalnoj formi. U posleratnom periodu razvoj i usavravanje teorije igara predstavlja
predmet interesovanja mnogih istaknutih matematiara i ekonomista. Moe se slobodno
kazati da u posleratnom periodu skoro da nijedno podruje ekonomske analize i
matematikog modeliranja ekonomskih pojava nije ostvarilo toliku ekspanziju i razvoj
kao to je to sluaj sa teorijom igara.
Matematiki modeli i metodi u ekonomiji, Dr. Marko Backovi, Ekonomski fakultet, Beograd 2000
je ukupna suma plaanja jednaka nuli. Nasuprot ovome, u igrama sa nenultom sumom, u
kojima se obino prepliu odnosi konflikta i kooperacije igraa, suma ukupnog plaanja
je razliita od nule. Na primer, u igri lutrije organizator zadrava za sebe deo ukupnog
dobitka.
Zavisno od meusobnog odnosa igraa uesnika, sve igre delimo na kooperativne i
nekooperativne. Kooperativne igre predstavljaju takvu vrstu igara u kojima igrai
formiraju koalicije koje im slue za meusobno usklaivanje ponaanja i izbor
pojedinanih strategija koje im obezbeuju postizanje najpovoljnijih rezultata. Ukoliko u
toku igre ne postoji koordinacija u ponaanju ( izboru poteza ) od strane igraa, takva igra
predstavlja nekooperativnu, tj. antagonistiku igru.
Za potrebe matematikog modeliranja, analize i reavanja, igra moe biti
predstavljena na razliite naine. Jedan postupak primenjuje se za igre kod kojih ne
postoji potpuna informisanost igraa o potencijalnim odgovorima protivnika na njihov
izbor pojedinanih strategija. Za takve igre je karakteristino da se rezultat svih poteza u
toku neke igre obraunava tek na kraju igre, kada se obavi predvieni broj poteza,
odnosno realizuje jedna partija. Ovakva vrsta igre, koju koju nazivamo igrom
ekstenzivnog (opteg) oblika, predstavlja se obino preko odgovarajueg stabla igre, u
kome se predstavljaju odabrani potezi igraa. Tipian primer ovakve igre jeste poker.
Takoe, pregovarake igre, kao specijalna vrsta igara prikazuju se grafikim putem, tzv.
funkcijom koalicije, u prvom kvadrantu koordinatnog sistema. Upravo o ovoj vrsti igara
bie vie rei u narednom poglavlju.
Drugi postupak predstavljanja i analiziranja igreprimenjuje se u situaciji tzv. pune
informisanosti o potencijalnim rezultatima odabranih strategija od strane igraa. Kod
ovakve vrste igre, koju nazivamo igra u normalnoj (matrinoj) formi, za sve alternativne
kombinacije odabranih strategija od strane igraa unapred su poznata plaanja, odnosno
rezultat igre. Na primer, kod konane igre dva lica sa nultom sumom, ova plaanja
(funkcija plaanjan) predstavljena su matricom plaanja u kojoj su predstavljeni rezultati
koji e biti ostvareni izborom razliitih moguih kombinacija parova strategija od strane
dva igraa, uesnika u igri.
3 Pregovarake igre
u2
pregovaraki skup, P
N
D
D
u1
slika 1
Dostupna oblast sadri i taku neuspeha (status quo, taku nesporazuma), koja
prikazuje propast dogovora. Korisnosti pregovaraa u taki neuspeha obeleavamo sa
2
Nobelovu nagradu Ne je dobio 1994. god., za pionirsku analizu ravnotee u teoriji nekooperativnih
igara. O samom Neu i njegovom (veoma interesantnom) ivotu i radu bie vie rei u 4. poglavlju.
2.
Simetrinost (S): Ako je dostupna oblast simetrina (to znai, ako sadri taku
(a, b), onda ona mora da sadri i taku (b, a) i obrnuto), i ako je taka neuspeha
simetrina (n 1 = n 2 ), onda je i taka dogovora takoe simetrina, odnosno u
1 * = u 2 *.
3.
Par ishoda (u 1 , u 2 ) je Pareto optimalno reenje ako u skupu ne postoji reenje u kojem bi ishod po
jednog igraa bio bolji, pri emu se rezultat drugog igraa ne bi pogorao. Par strategija kojim
ostvarujemo Pareto optimalno reenje, nazivamo Pareto efikasnim parom., Teorija odluivanja, Dubravka
Pavlii, Ekonomski fakultet,Beograd 2000
4
Uz neznatne izmene preuzeto iz knjige Teorija odluivanja, Dubravka Pavlii, Ekonomski fakultet,
Beograd 2000
u1 = u 2
T
(u 1 *, u 2 *)=(T/2,T/2)
u 1 +u 2 =T
N=(0,0)
T
Slika 2
u1
Povrina trougla NTT predstavlja dostupnu oblast D, linija TT prikazuje sva Paretoefikasna reenjapregovora (odnosno, pregovaraki skup), dok se na liniji koja pod uglom
od 45 0 polazi od koordinatnog poetka nalaze sva simetrina reenja, kojima igrai
postiu jednake rezultate. Na osnovu uslova S, reenje simetrinog pregovarakog
problema mora da bude simetrino, odnosno, taka dogovora se mora nalaziti na ovoj
pravoj. Kao savreno racionalni, igrai posmatraju samo Pareto efikasne take (du TT),
pa je reenje pregovarakog problema taka preseka, tj. simetrian ekvilibrijum
(u 1 *, u 2 *) = (T/2,T/2) = (500, 500). Drugim reima, igrai koji su neutralni prema
riziku e se dogovoriti da podele novac.
Isti rezultat dobijamo izraunavanjem maksimuma funkcije (u 1 - n 1 )(u 2 - n 2 ).
Kako je u 1 = r i u 2 = k, n 1 = n 2 =0 i r+k=T, sledi da je u 2 = T-r = 1000-r, pa
odgovarajuim zamenama dobijamo:
max (u 1 - n 1 )(u 2 - n 2 )
max (r-0)[(1000-r)-0]
max (1000 r - r 2 ).
Reavanjem ove funkcije izraunavamo r = 500 i k = 1000 r = 1000 500 = 500. Tako
smo na osnovu uslova PO i S reili simetrian pregovaraki problem. Ovde emo ukratko
objasniti sadraj ovih uslova.
Uslov PO garantuje racionalne izbore, odnosno izbor Pareto-efikasnog reenja.
Budui da u teoriji posmatramo samo savreno racionalne pojedince (koji uvek biraju iz
skupa optimalnih reenja), uslov PO moemo prihvatiti kao veoma blag. Ali, ako
posmatramo realne pregovarake situacije, ovaj uslov racionalnosti je esto naruen,
odnosno, konani ishodi brojnih pregovora ne predstavljaju Pareto-efikasna reenja.
Razlozi su dvojake prirode: prvo, donosioci odluka esto naruavaju pretpostavke
savreno racionalnog odluivanja, i drugo, pregovarake situacije su veoma sloene i
nemogue je precizno odrediti skup Pareto-optimalnih reenja. Ali, injenica da je u
praksi uslov PO retko zadovoljen ne moe se tretirati kao nedostatak teorije. Naime,
Neova teorija je normativna, a ne deskriptivna, pa je naruenost polazne pretpostavke u
praksi ne ugroava.
1000
u1
Slika 3
max (u 1 - n 1 )(u 2 - n 2 )
max (u 1 - 250)(u 2 - 0) = max (u 1 u 2 - 250 u 2 ).
Zamenom u 2 = 1000 - u 1 u gornju jednainu dobijamo:
max (1250 u 1 - u 1 2 - 250 000),
i njenim reavanjem izraunavamo ishode pregovora, koji iznose u 1 =625 i u 2 =375.
Rezultat (625, 375) pokazuje da je postignuti dogovor asimetrian u korist pregovaraa
koji u pregovore ulazi sa povoljnijom startnom pozicijom.
Korisnosti merene na razliitim skalama
Primer 3: Vratimo se pregovorima u primeru 1, u kojima je taka nesporazuma N ponovo
simetrina i iznosi (0, 0). Pretpostavimo da su igrai i dalje neutralni prema riziku, ali da
oni izraavaju svoje predloge u razliitim valutama u kojima e, u sluaju dogovora, biti i
isplaeni. Na primer, igra R izraava ishode u dinarima, dok ih K izraava u dolarima
(pri emu je, na primer, 1 dinar = 0,01 dolara). Budui da se deli suma od 1000 dinara,
uporedivost predloga emo postii ako predloge igraa K, koji su izraeni u dolarima,
konvertujemo u dinare. Linija efikasne podele sada glasi:
r + (k/0,01) = 1000.
Igrai su neutralni prema riziku, zbog ega su njihove korisnosti jednake novanim
iznosima, iz ega sledi:
u 1 + ( u 2 /0,01) = 1000.
Slika prkazuje pregovaraki problem iz primera 1 u kojem su nepromenjene korisnosti
igraa sada izraene u razliitim jedinicama (odnosno, u razliitim valutama).
u2
u 1 +(u 2 /0,01)=1000
10
(u 1 *, u 2 *)=(500,5)
1000
u1
Slika 4
Ako bismo u sluaju asimetrine igre primenili simetriju, dobili bismo u 1 = u 2 = 9,9
to znai da bi igra R dobio 9,9 dinara, dok bi K dobio 9,9 dolara, odnosno 990 dinara.
Lako je zakljuiti da rezultat nije simetrino, fer reenje, pa bi igra R odbacio ovaj
predlog kao ekstremno nekorektan i dogovor bi propao.
Reenje pregovarake igre bie:
max (u 1 - n 1 )(u 2 - n 2 ),
9
max u 1 ( u 2 /0,01),
na pravoj efikasne podele, u 1 +(u 2 /0,01)=1000. Zamenom u 2 =(1000 - u 1 )0,01=10 0,01u 1 u gornju jednainu dobijamo:
max u 1 (10 0,01 u 1 ),
max (10 u 1 - 0,01 u 1 2 ),
ijim reavanjem izraunavamo ishode za oba igraa, u 1 =500 i u 2 =5. Reenje
pregovarake igre jeste dakle (500, 5) i ono pokazuje da e raspoloiva suma biti podeljena
na jednake delove, jer je 500 dinara jednako 5 dolara.
Isto reenje moemo dobiti kraim postupkom, na osnovu ve izraunatog rezultata u
primeru 1 i uslova EP. Rekli smo da se ove dve pregovarake igre razlikuju samo po
novanim jedinicama u kojima smo izrazili korisnost igraa K. U primeru 1 njegova
korisnost je merena na skali ija je jedinica mere dinar, a u primeru 3 na skali ija je
jedinica mere dolar. Ove dve skale su povezane linearnom transformacijom:
1 dinar = 0,01 dolara
Korisnostigraa R smo u oba sluaja izrazili u dinarima, odnosno:
u 1 ' (.) = u 1 (.),
dok je korisnost igraa K sada jednaka:
u 2 ' (.) = u 2 (.),
na osnovu ega je nova taka sporazuma jednaka linearnoj transformaciji prethodne,
(u
1 *, u 2 *) = (500, 500), odnosno:
(u 1 *, 0,01u 2 *) = (500, 5).
Uslov EP tako doputa da pregovarai slobodno izaberu skalu na kojoj e meriti svoje
kardinalne korisnosti, ali istovremeno spreava da ovi proizvoljni izbori utiu na konaan
rezultat. Zato je, pored uslova PO i S, uslov EP takoe opte prihvaen kao poeljna
karakteristika reenja pregovarakih problema.
Zamenom ovih korisnosti u liniju efikasne podele, r + k =1000, umesto prave dobijamo
krivu (slika):
u1 + u 2
= 1000.
u2
u 1 +u 2
u1
Slika 5
Zamenom u 2 = ( 1000 - u 1 )
max u 1 ( 1000 - u 1 )
+(4/5) u 1 ( 1000 - u 1 ) ( 4
1 5
5 ) 1
(-1) = 0.
1000 - u 1 = (4/5) u 1
ijim reavanjem izraunavamo rezultat pregovora za pojedinca koji je neutralan prema
riziku: u 1 = r = 555,5 , odakle sledi da je k = 444,5 dinara.
Reenje pregovarake igre, (555,5, 444,5), pokazuje da razliit odnos pregovaraa
prema riziku utie na rezultat pregovora i uslovljava nejednaku raspodelu. to je
pregovara odbojniji prema riziku, on vie strahuje da do dogovora nee doi, pa je
spreman da na svoju tetu odstupi od ravnopravne deobe novca. Ovo odustajanje e se
poveavati sa porastom odbojnosti prema riziku jednog od igraa. Na primer, ako je prvi
igra neutralan, u 1 = r, a drugi izrazito odbojan prema riziku, tako da je njegova funkcija
korisnosti jednaka u 2 = k 1 2 , reenje pregovora e biti (666,6, 333,3)(to se lako proveri
na prethodno opisani nain). Nejednakost u raspodeli e biti jo izraenija ako je
pregovara R sklon riziku, a K odbojan prema riziku; tada e konaan rezultat biti znaajno
asimetrian u korist pregovaraa R.
Mada se moemo sloiti da je rezultat logian, recimo da on izaziva brojne kritike pa i
osporavanja Neovog reenja. Na osnovu prethodnog primera vidimo da reenje favorizuje
11
pojedince koji su skloni riziku, zbog ega naki autori konstatuju da ono podstie igrae na
neiskrenost, odnosno na lano prikazivanje individualnih preferencija. Naime, pojedincima
koji su neutralni ili odbojni prema riziku je u interesu da prikriju svoje prave preferencije,
to e oni kao racionalni pojedinci i uiniti, i stupati u pregovore kao igrai naklonjeni
riziku. Ali, Neovo reenje ima smisla samo pod pretpostavkom da se ono bazira na
stvarnim, a ne lanim funkcijama korisnosti oba pregovaraa.
3.4 Igre bankrotstva i uslov nezavisnosti od irelevantnih alternativa
Za razliku od do sada posmatranih uslova (PO, S i EP), koji su opte prihvaeni kao
poeljne osobine reenja pregovora, uslov IA izaziva kontroverze.
Posmatrajmo tri pregovarake igre, prikazane na sledeim grafikonima (slika). Taka
nesporazuma N je u sva tri sluaja jednaka (0, 0) a pregovarai su neutralni prema riziku.
u2
T
u2
T
A
u 1 + u 2 =T
u2
T
A
B
(u 1 *,u 2 *)
(u 1 *,u 2 *)
(u 1 *,u 2
*)
D
N
u1
u1
C T
(a)
(b)
Slika 6
(c)
u1 = u 2
10 000
6 000
(u 1 *, u 2 *)=(5 000,5 000)
u 1 +u 2 =10 000
N=(0,0)
6 000 10 000
Slika 7
u1
Budui da ni jedan potrailac ne moe da trai vie novca od onog koji je uloio, na
liniji efikasne podele sredstava:
u 1 + u 2 = 10 000,
reenje e biti taka na segmentu ogranienom takama (6 000, 4 000) i (4 000, 6 000), pa
e simetrino reenje biti (u 1 *, u 2 *) = (5 000, 5 000).
Ali, ako R i K imaju razliita potraivanja, onda se sreemo sa asimetrinom igrom
bankrotstva, o emu govori sledei primer.
Primer 6: Pretpostavimo prvo da R potrauje 12000$, a K 6000$ (12000 + 6000 = 18000 >
10000). Igrai su neutralni prema riziku, a taka nesporazuma je N = (0, 0) (slika (a)).
u2
u2
10 000
10 000
13
6 000
(5 000, 5 000)
5 000
(5 000, 5 000)
0
12 000
u1
12 000 u
(a)
(b)
Slika 8
14
Jedan od svakako blistavih umova Dzon Ne, roen je 13. juna 1928. godine u
mestu Blufild, u amerikoj dravi Zapadna Virdzinija. Dobio je ime po ocu, koji je
bio elektro-inenjer. Njegova majka, Margaret radila je kao profesor engleskog i
(povremeno) latinskog jezika, ali je zbog gubitka sluha (posledica infekcije jo za
vreme studija) ubrzo prestala da predaje.
Jo u najranijem detinjstvu Dzon je mnogo itao. Od roditelja je dobio
Komptonovu ilustrovanu enciklopediju, a takoe je itao sve knjige koje je mogao
da nae u svojoj i kui njegove bake, a koje su, kako on kae, imale edukativnu
vrednost.
Dok je pohaao srednju kolu, proitao je klasik Men of Mathematics, E.T. Bell-a.
Ta kniga je jedan od glavnih krivaca to je zavoleo matematiku. U to vreme se bavio i
eksperimentima iz oblasti elektronike i hemije i eleo je da bude elektro-inenjer kao i
njegov otac.
Zatim na Karnegiju, u Pitsburgu Ne je studirao hemijski inenjering. Posle samo
jednog semestra, preao je da studira matematiku, iako mu je mantor objasnio da je
gotovo namogue imati dobru karijeru matematiara u Americi tog vremena.
Nakon sto je doplomirao, dobio je ponude za doktorske studije na Harvardu i
Prinstonu, dva velika i prestina univerziteta. Odluio se za Prinston, jer je, kako sam
kae, oseao da su oni vie zainteresovani da on doe ba tamo. Zanimljivo je
napomenuti da je u preporuci, njegov profesor sa Karnegija napisao samo jednu jedinu
reenicu: Ovaj ovek je genije!
Jo na Karnegiju sluao je kurs Meunarodna ekonomija, o ekonomskim idejama i
problamima. Kasnije, na doktorskim studijama na Prinstonu privukli su mu panju radovi
o teoriji igara, dva velika autora, von Neumann-a i Morgenstern-a. Poeo je da razvija
svoje ideje iz ove oblasti koje su, kako se kasnije ispostavilo, vodile ka teoriji
nekooperativnih igara. Konaan oblik ta teorija je dobila u knjizi Nash Equilibrium,
koja je objavljena 1950. godine. Iste godine, objavljena je i knjiga Nash Bargaining
Solution (NBS) (u kojoj je predstavljeno reenje kooperativne igre dva igraa). U
nekoliko narednih godina doao je do niza izvanrednih rezultata, kako iz oblasi teorije
igara i ekonomije, tako i matematike, i postao istinska zvezda, u strunim krugovima
pre svega.
Godine 1956-1957. dobio je posao predavaa na M.I.T-u (New York), gde je upoznao
svoju buduu enu, Alisiju (koja je u to vreme zavravala studije na M.I.T).Ve 1958., sa
nepunih trideset godina, Nea je na vrhuncu blistave karijere, sputala bolest. Dijagnoza je
zastraujua, paranoidna izofrenija (bio je opsednut tajnim slubama). Bolest je bila
naroito intenzivna poetkom 1959. godine, u vreme kada je Alisija bila u drugom
stanju.6 To su bili veoma teki trenuci u ivotu mlade ene koja se maksimalno trudila da
mu pomogne. Meutim, Ne je dugo krivio Alisiju, smatrajui da je zbog nje poslat na
6
Iz braka sa Alisijom, Ne ima dva sina; mlai od njih je takoe bio veoma talentovan matematiar, ali je
naalost i on poput oca oboleo od izofrenije.
15
leenje, to je bio glavni razlog raspada njihovog braka. Naravno, izgubio je posao na
M.I.T. Naredne dve decenije, prole su u (uglavom neuspenoj) borbi sa boleu. Posle
besciljnih putovanja po Evropi i Americi, najzad se vratio na Prinston, gde je uglavnom
izgledao tuan, poput duha, i dobio nadimak the Phantom of the Fine Hall.
Poetkom osamdesetih, bolest je poela da jenjava i Ne se vratio radu. Takoe,
ubrzo je ponovo uspostavio najpre prijateljski odnos sa Alisijom, a neto kasnije su i
obnovili brane zavete. Ustvari, Ne je uspeo da spoji svoje ludilo sa svojim ivotom
(da ivi sa njim) na jednom ultraloginom nivou.
Godine 1994. (44 godine nakon objave rezultata do kojih je doao u oblasti teorije
nekooperativnih igara, i koji su zauvek promenili svetsku ekonomiju), Ne je postao
laureat Nobelove nagrade i to tek poto ga je predstavnik komiteta za dodelu nagrada
posetio, da bi se uverio u njegovo zdravstveno stanje i psihiku stabilnost (to se moe
smatrati nekorektnim gestom).
Amerika spisateljica Silvija Nazar, napisala je po Neovom ivotu roman Blistavi
um, koji je kasnije adaptiran i posluio je kao scenario za istoimeni holivudski film.
Obzirom da je film doiveo veliki uspeh ( kod publike i kritike), Ne je postao poznat i
van strunih krugova i njegov ivot i rad ne prestaju da fasciniraju ljude irom planete.7
Sadraj
Vie o Neovom ivotu moe se proitati u pomenutoj knjizi Silvije Nazar, a o njegovim radovima iz
matematike (koji nisu nita manje znaajni niti izvanredni, ali su u ovoj kratkoj biografiji zapostavljeni) i
ekonomije moe se vie saznati na Web lokacijama, navedenim u literaturi.
16
1 Uvod .......................................................................................................................1
2 Osnovne karakteristike i vrste igara .......................................................................2
3 Pregovarake igre ...................................................................................................4
3.1 Neov ekvilibrijum ...................................................................................4
3.2 Simetrine igre ..........................................................................................6
3.3 Asimetrine igre ........................................................................................8
3.4 Igre bankrotstva i uslov nezavisnosti od irelevantnih alternativa ...........12
4 Blistavi um John F. Nash, Jr. .............................................................................15
Literatura
17
18