Nashova Ravnoteža

UNIVERZITET U SARAJEVU
PRIRODNO-MATEMATIČKI FAKULTET
ODSJEK: MATEMATIKA
SMJER: PRIMIJENJENA MATEMATIKA
Teorija igara
SEMINARSKI RAD
TEMA: NASHOVA RAVNOTEŽA
Predmetni profesor: Student:
Doc. dr. Fikret Čunjalo
Sarajevo, septembar 2017.g.

Sadržaj
1. Uvod.................................................................................................................................................3
2. Strateške igre....................................................................................................................................3
2.1. Definicija..................................................................................................................................3
2.2. Relacija preferencije.................................................................................................................4
2.1.1. Definicija.........................................................................................................................4
2.1.2. Definicija.........................................................................................................................4
2.1.3.Definicija:.........................................................................................................................5
2.1.4.Definicija:.........................................................................................................................5
2.1.5. Definicija.........................................................................................................................5
4. Nashova ravnoteža (equilibrium).....................................................................................................7
4.1. Definicija..................................................................................................................................7
4.2. Koraci do Nashovog equilibriuma...........................................................................................7
4.3. Primjeri....................................................................................................................................9
4.3.1. Bach ili Stravinsky (BoS)..................................................................................................9
4.3.2. Zatvorenikova dilema.......................................................................................................9
4.3.3. Jastreb-Golubica............................................................................................................10
4.3.4. Odgovarajući novčići......................................................................................................11
5. Egzistencija Nashovog Equilibriuma.............................................................................................11
5.1. Kakutanijev fiksni tačkasti teorem.........................................................................................12
5.2. Teorema.................................................................................................................................12
6. Strogo takmičarske igre..................................................................................................................14
6.1. Definicija...............................................................................................................................14
6.2. Definicija...............................................................................................................................15
7. Bayesove igre: Strateške igre sa nesavršenim (nepotpunim) informacijama................................15
7.1. Definicija...............................................................................................................................16
7.2. Definicija...............................................................................................................................17
7.3. Primjer...................................................................................................................................17
8. Zaključak........................................................................................................................................18
LITERATURA.....................................................................................................................................19
1. Uvod
Teorija igara je oblast primijenjene matematike koja je zvanicno pocela da se razvija 40-ih godina
XX veka, premda je u tragovima uocena jos u djelima grckih filozofa, spisima raznih vojskovođa
tokom srednjeg vijeka.
Konkretno, pocetkom moderne teorije igara smatra se knjiga Theory of Games and Economic
Behavior objavljena 1944. godine. Autori knjige su John Von Neumann, americki matematicar
mađarskog porijekla i Oskar Morgenstern, njemacki ekonomist koji je zbog drugog svjetskog rata
emigrirao u SAD.1
Sam pojam teorije igara se moze pronaci u razlicitim knjigama objasnjen na razlicite nacine, ali sve
te definicije sustinski oznacavaju sljedece:
Teorija igara analizira interakciju među skupinom racionalnih igraca koji se po nasaju strateski.
Radi se o teoriji koja povezuje nekoliko grana matematike i dala je vazne doprinose razumijevanju
ponasanja u ekonomiji (prilikom donosenja odluka) na nacin sto je uticala na promjene pogleda u
modernoj ekonomiji, zatim je također zbog sirine i primjenjivosti problema na koje pokusava naci
odgovor nasla svoju primjenu i u sociologiji, psihologiji, politici. Primjenjuje se također u vojnim
naukama, zatim biologiji, interesantni primjeri iz biologije mogu se naci u knjizi Richarda
Dawkonsa Sebicni gen.
Nashova ravnoteza je jedan od najosnovnijih koncepata u teoriji igre.
U ovom seminarskom radu Nashov equilibrium koji predstavlja koncept rjesenja objasnicemo u
kontekstu strateske, kao i u kontekstu Bayesove igre. Na pocetku cemo objasniti sta
podrazumijevaju strateske igre, te cemo iste potkrijepiti primjerima, zatim cemo u centralnom dijelu
rada objasniti pojam Nashove ravnoteze, kao i pojam strogo takmicarske igara, te se na kraju dotaci
pojma Bayesove igre.
2. Strateške igre
2.1. Definicija
Strateska igra je model interaktivnog donosenja odluka u kojem svaki donositelj odluka jednom i
zauvijek odabire svoj plan akcije, a ti se izbori događaju istovremeno. Znaci ovdje svi igraci donose
odluku na pocetku, a zatim svi simultano izvode svoje akcije.
Model se sastoji od konacnog skupa od N igraca, i za svakog igraca i, skupa akcija Ai i
preferencijalnog odnosa igraca prema skupu akcija.
Posmatramo akcijski profil a = (aj)j kao ishod i oznacavamo skup x j ∈ N Aj ishoda sa A.
1 Nashova ravnoteza, hrcak.srce.hr/file/168691, pristupljeno juli 2017

Zahtjev da se preferencije svakog igraca definiraju sa A, umjesto sa A i, je karakteristika koja
razlikuje stratesku igru od problema odlucivanja: svaki igrac moze se brinuti ne samo o vlastitoj
akciji, vec i o akcijama koje su poduzimali ostali igraci.
Definicija je sljedeca:
Strateska igra se sastoji od:
• konacnog skupa N (skup igraca)
• za svakog igrac i ∈ N nepraznog skupa Ai (skup akcija dostupnih igracu i)
• za svakog igrac i ∈ N relacije preferencije ≥ i na A = x J ∈ N Aj (preferencijalni odnos igraca i).
Ako je skup Ai akcija svakog igraca konacna onda je igra konacna.2
2.2. Relacija preferencije
Pozabavicemo se relacijom preferencije obzirom da je to pojam koji ce se provlaciti kroz citav rad.
Kada govorimo o preferencijalnom odnosu igraca govorimo o tome da pojedinac, entitet
odlucivanja pravi izbor u odlucivanju između dvije ili vise opcija. Preferirati nesto znaci izabrati
jednu mogucnost u odnosu na neku drugu. Iz ovoga vidimo da je relacija preferencije jedna binarna
relacija.
U tome smislu podsjecamo na sljedece (matematicke) definicije koje ce nas “odvesti” do pojma
relacije preferencije:
2.1.1. Definicija
Dekartov (direktan) proizvod n skupova A1, A2, . . . , An−1 i An, n ≥ 2, se definise na sljedeci nacin:
A1 ×...×An = {(a1,...,an): ai ∈ Ai, i=1,...,n}. A koje n = 2 , onda vazi A1 ×A2 ={(a1,a2): a1 ∈A1∧a2
∈A2}.
2.1.2. Definicija
Ako je n = 2 kazemo da je relacija binarna. Za binarnu relaciju ρ, umesto (a, b) ∈ ρ, koristimo i
sljedece ekvivalentne zapise:
a ρ b ρ ( a , b ) ab ∈ ρ . Skup svih binarnih relacija na A oznacavamo sa R(2).
Kazemo da je binarna relacija ρ ∈ R(2)
1. Refleksivna, ako (∀a ∈ A) (a, a) ∈ ρ,
2. Antirefleksivna, ako (∀a ∈ A) (a, a) ̸∈ ρ,
3. Simetricna: ako (∀a,b ∈ A) (a,b) ∈ ρ ⇒ (b,a) ∈ ρ,
4. Antisimetricna: ako(∀a,b∈A)(a,b)∈ρ∧(b,a)∈ρ⇒a=b,
2Martin J. Osborne and Ariel Rubinstein, A course in game theory, (Cambridge: MIT Press, 1994.) , str.11
5. Tranzitivna: ako (∀a,b,c ∈ A)(a,c)∈ρ∧(c,b)∈ρ⇒(a,b)∈ρ.
2.1.3.Definicija:
Relacija preferencije ≥ je binarna relacija na skupu X koja ima osobine:
1. za svako x koje pripada skupu X x≥x (refleksivnost)
2. za svako x,y koji pripadaju skupu X x≥y ili y≥x (kompletnost)
3. za svako x,y,z koji pripadaju skupu X x≥y, y≥z slijedi x≥z (tranzitivnost).3
2.1.4.Definicija:
Relaciju striktne preferencije > definisemo na sledeci nacin:
x>y ako i samo ako x≥y ∧ ˥(y≥x)
2.1.5. Definicija
Relaciju indiferetnosti definisemo na sledeci nacin:
x je indiferentno prema y ako i samo ako x ≥ y ∧ y ≥ x.
Apstraktnost ovog modela strateske igre omogucuje njegovu primjenu na veliki broj situacija.
Igrac moze biti individualno ljudsko bice ili bilo koji drugi entitet odlucivanja poput vlade,
upravnog odbora, vodstva revolucionarnog pokreta ili cak cvijeta ili zivotinje.
Model ne stavlja nikakva ogranicenja na skup akcija koje su dostupne igracu, sto znaci da taj skup
moze sadrzavati samo nekoliko elemenata ili biti veliki skup koji sadrzi kompleksne planove koji
pokrivaju razlicite faktore. Međutim, primjena modela ogranicena je uslovom da svakom igracu
pridruzujemo preferenciju. (Relacija preferencije je detaljno objasnjena u prethodnom odjeljku).
Preferencija igraca moze jednostavno biti odraz osjecaja igraca o mogucim ishodima.
Ovaj model je vazan alat koji pomaze npr. ekonomistima da saznaju kako konkurentske kompanije
određuju cijene, zatim vladama da modeliraju svoje javne tendere na nacin da dobiju najvise od
svojih ponuđaca, te se moze koristiti npr. da se objasne pojave poput one zasto neke grupe donese
odluke koje su na njihovu stetu.
Nedostatak u tome da implikacije modela ne mogu mnogo visiti o specificnim osobinama situacije.
Doista, vrlo malo zakljucaka se moze izvesti o ishodu igre na ovoj razini apstrakcije. Za
interesantnije rezultate, model morao biti mnogo specificniji.4
U nekim situacijama preferencije igraca se najcesce definiraju ne preko akcijskih profila, nego
preko njihovih posljedica. Da bismo to ucinili, uvodimo skup posljedica C, funkciju g : A→ C koja
povezuje posljedice s akcijskim profilima i profil ≥ i preferencijalnih odnosa nad skupom C.
Tada se preferencijalni odnos svakog igraca i u strateskoj igri definise kako slijedi:
3 Skupovi, relacije i funkcije, http://imft.ftn.uns.ac.rs/~vanja/old/P1.pdf, pristupljeno juli 2017
4 Martin J. Osborne and Ariel Rubinstein, A course in game theory, (Cambridge: MIT Press, 1994.)
a ≥ i b ako i samo ako g (a) ≥ i g (b).
Ponekad zelimo modelirati situaciju u kojoj na posljedicu akcijskog profila utjecu vanjski slucajni
faktori cija realizacija nije poznata igracima prije preduzimanja akcija.
Ovakvu situaciju mozemo modelirati kao stratesku igru uvođenjem skupa C posljedica, prostora
vjerojatnoce Ω i funkcije g : A x Ω → C sa intepretacijom da je g (a, ω) posljedica kada je akcijski
profil a ∈ A i realizacija slucajne varijable je ω ∈ A. Profil akcija inducira lutriju na C.
U sirokom rasponu okolnosti relacija preferencije ≥i igraca i u strateskoj igri moze se prikazati
preko funkcije isplate ui : A → R (također nazvanom funkcijom korisnosti), u smislu da ui (a) > ui
(b) kad god a ≥ i b. Posmatramo vrijednosti takve funkcije kao isplate (dobitke).
Konacna strateska igra u kojoj se nalaze dva igraca moze se jednostavno opisati u tablici kao na
sljedecoj slici 1:
L R
T w1,w2 x1,x2
B y1,y2 z1,z2
Slika 2.1.
Akcije jednog igraca sadrzane su u recima, a drugog igraca u stupcima.

Tako je u igri na slici 1 skup akcija igraca reda je {T, B}, a skup akcija je igraca stupca je {L, R}, i
na primjer, isplata reda igraca s ishodom (T, L) je w 1 i isplata igraca kolone je w2. Ako su imena
igraca "1" i "2", uobicajeno je da je igrac reda igrac 1, a igrac kolone je igrac 2
Svaki igrac zna detalje igre i cinjenicu da su svi igraci "racionalni" , a igraci odabiru svoje postupke
istovremeno i samostalno. Prema tom tumacenju, svaki igrac nije svjestan, pri odabiru svoje akcije,
odabira drugih igraca. Nema podataka na kojima igrac moze temeljiti svoja ocekivanje o ponasanju
drugih igraca.
Kada se govorimo o akcijama igraca u strateskoj igri kao "istovremenim”, ne mislimo nuzno znaciti
da su te radnje poduzete u istom trenutku. 5
Situacija koja se moze modelirati kao strateska igra je sljedeca:
Da bi se situacija oblikovala kao strateska igra, vazno je samo da igraci donose odluke samostalno,
a niti jedan igrac nije obavijesten o izboru bilo koji drugi igrac prije donosenja vlastite odluke.
5 Ibid , str 12
4. Nashova ravnoteža (equilibrium)
Najcesce koristen koncept rjesenja u teoriji igara je Nashova ravnoteza (ekvilibrijum). Ovaj pojam
podrazumijeva stabilno stanje igre strateske igre u kojoj svaki igrac ima ispravna ocekivanja o
ponasanju drugih igraca i djeluje racionalno. 6
Nashova ravnoteza ne znaci da je ovakav ishod idealan ili najbolji za igrace (to bi bio Pareto
optimum), vec samo da je to najbolji u postojecim uslovima, odnosno da bi svaki drugi ishod nastao
kao posledica jednostrane odluke pogorosao poziciju onoga ko donese takvu odluku.7
4.1. Definicija
Nashova ravnoteza strateske igre (N, (Ai)), ≥ i je profil a* ∈ A akcija s svojstvom da za svakog
igraca i ∈ N imamo:
(a*-i , a*i) ≥ i (a*-i, ai ) za sve ai ∈ Ai.
Sljedece korekcije definicije ponekada su korisne. Za bilo koji a -i ∈ Ai , definirati funkciju Bi (a-i)
tako da ista bude skup igracevih najboljih poteza danih a -i. Funkciju Bi nazivamo funkciju najboljih
odgovora igraca i. A Nashova ravnoteza je profil a* akcija za koje ai* ∈ Bi(a*i-1) za sve i ∈ N.
Ova alternativna formulacija definicije ukazuje na (ne nuzno ucinkovitu) metodu pronalazenja
Nashovog equilibria, najprije izracunati najbolju funkciju najboljih odgovora svakog igraca, a
zatim pronaci profil a* akcija za koje ai* ∈ Bi(a*-i) za sve i ∈ N. Ako su funkcije Bi jednoclani
skupovi, onda drugi korak ukljucuje rjesavanje | N | jednadzbi u | N | nepoznatih (ai*) i∈N.8
4.2. Koraci do Nashovog equilibriuma9

Sljedecim koracima je na praktican nacin prikazan nacin dolazenja do Nashove ravnoteze.
Korak 1
Pogledati matricu placanja i ustanoviti cija je cija isplata:
Igrac B
Saradnja Nema saradnje
Saradnja 2000 (B) 4000(B)

1500 (A) 50 (A)
Igrac A
100 (B) 101(B)
Nema saradnje 2000 (A) 60(A)
6 Ibid, str 14.

7 Dusan Pavlovic, http://www.dusanpavlovic.in.rs/mypage/Blog/Entries/2015/5/26_Nesova_ravnoteza.html, juli 2017
8 Martin J. Osborne and Ariel Rubinstein, A course in game theory, (Cambridge: MIT Press, 1994.)
9 Step by step guide on how to find a Nash Equilibrium or Equilibria,

http://www.uwyo.edu/shogren/jaysho/nashnotes.pdf, pristupljeno juli 2017.
Korak 2.
Ustanoviti najbolji odgovor igraca A na sve akcije igraca B.
Igrac B

1500 (A) 50 (A)
Igrac A
100 (B) 101(B)
Posto je 2000>1500 i posto je 60>50

Korak 3.
Ustanoviti najbolji odgovor igraca B na sve akcije igraca A.
Igrac B

1500 (A) 50 (A)
Igrac A
100 (B) 101(B)
Posto je 4000>2000 i posto je 101>100.

Korak 4.
Nashova ravnoteza je situacija kada najbolji odgovor igraca B jednak najboljem odgovoru igraca A.
Igrac B

1500 (A) 50 (A)
Igrac A
100 (B) 101(B)
4.3. Primjeri
Sljedece klasicne igre predstavljaju razlicite strateske situacije.
4.3.1. Bach ili Stravinsky (BoS)10

Dvije osobe zele izaci zajedno na koncert glazbe Bacha ili Stravinskog. Njihov glavni cilj je da
izađu zajedno, ali jedna osoba preferira Bacha, a druga osoba preferira Stravinski. Predstavljajuci
preferencije pojedinaca funkcijama isplata, imamo igru na slici 4.1.
BoS modelira situaciju u kojoj igraci zele koordinirati njihovo djelovanje, ali imaju sukobljene
interese. Igra ima dvije Nashove ravnoteze: (Bach, Bach) i (Stravinsky, Stavinsky). To znaci da
postoje dva stabilna stanja: jedan u kojem oba igraca uvijek odabiru Bach i jednu u kojoj uvijek
odabiru Stravinskog.
Bach Stravinsky
Bach 2,1 0,0
Stravinsky 0,0 1,2
Slika 4.1.
4.3.2. Zatvorenikova dilema
Ovo je veoma poznat problem.Dva osumnjicenika, P i M, su pritvorenici u odvojenim celijama.

Svaki ima dvije mogucnosti: priznati ili ne priznati zlocin. Ako oba priznaju, dobijaju po 5 godina
zatvora. Ako jedan prizna, odlazi slobodan i svjedoci protiv drugog koji dobije 15 godina zatvora.
Ako nijedan ne prizna, oba dobijaju kaznu od godinu dana za neki manji prekrsaj (nesto kao Al
Capone za utaju poreza). Igru mozemo prikazati prilozenom tablicom.
Kako je rijec o godinama provedenim u zatvoru, ovdje smo ocito popisali gubitke, a ne profite. U
nastavku, pod “optimum” smatramo “minimum”. Alternativno, mogli smo samo vrijednosti u tablici
pomnoziti s 1.
Razmisljanje zatvorenika P je ovakvo: Ako ja ne priznam, a M prizna, “odgulit” ću 15 godina
umjesto samo jedne. Ako odlučim priznati onda se mogu izvući ili, ako M prizna, dobiti samo 5
godina. U oba slučaja, bolje mi je priznati. Na slican nacin razmislja i zatvernik M.
Takvo razmisljanje pokazuje da je za zatvorenika P, neovisno o odluci zatvorenika M, bolje
priznati. To znaci da je za njega strategija “priznati” dominantna strategiji “ne priznati”. Drugim
rijecima, P nece strategiju “priznati” uopce uzimati u obzir. Time igru svodimo na igru s prilozene
tablice.
10
No, sada je odluka zatvorenika M jednostavna: njemu se također vise isplati priznati. Time smo
dosli do jedinstvene strategije koju ce odigrati oba igraca: obojica priznaju.
Postupak smo mogli zapoceti i sa zatvorenikom M. Također, postupak mozemo ponavljati dok god
jedan od igraca ima dominantnu strategiju. Dobivena reducirana igra ce biti ista, neovisno o
redoslijedu izvođenja eliminacija (osim u slucaju kad su dvije strategije za nekog igraca jednake).
Ovo je igra u kojoj se dobija ako igraci sarađuju - najbolji rezultat je taj da nijedan prizna- ali svaki
igrac ima poticaj da bude "slobodan igrac". Bez obzira sta uradi jedan igrac, drugi preferira priznati
ili ne priznati, tako da igra ima jedinstvenu Nash Ravnotezu (priznati, priznati).
Opisani postupak zovemo eliminacija dominiranih strategija i on predstavlja prvi korak u
rjesavanju mnogih matricnih igara.11
4.3.3. Jastreb-Golubica12
Dvije zivotinje se bore za neki plijen. Svaka se moze ponasati poput golubice ili poput jastreba.
Najbolji ishod za svaku zivotinju u kojem se ona ponasa kao jastreb dok se druga zivotinja ponasa
poput golubice. Najgori je ishod u kojem se obje zivotinje ponasaju kao jastrebovi. Svaka zivotinja
preferira da se ponasa poput jastreba ako se njegov protivnik ponasa kao golubica, ili poput
golubice ako se njegov protivnik poput jastreba.
Igra koja obuhvaca ovu situaciju prikazana je na sljedecoj slici:

Golubica Jastreb
Golubica 3,3 1,4

Jastreb 4,1 0,0
Slika 4.3.
Igra ima dvije Nashove ravnoteze, (Golubica, Jastreb) i (Jastreb, Golubica), sto odgovara dvije
razlicite konvencije o igracu koji doprinosi.
4.3.4. Odgovarajući novčići

Svaka od dvije osobe odabire bilo glavu ili pismo. Kad se izbore razlikuju, osoba 1 placa osobu 2
dolara, a ako su isti, osoba 2 placa osobu 1 dolar. Svaka osoba brine samo o iznosu novca koji
prima. Igra koja modelira ovu situaciju prikazana je na sljedecoj slici:
11 Primjeri Nashovog equilibriuma, http://decision.math.hr/nastava/vjezbe/02%20-%20Primjeri%20Nashovog

%20equilibriuma.pdf, juli 2017
12 Martin J. Osborne and Ariel Rubinstein, A course in game theory, (Cambridge: MIT Press, 1994.), str. 17
glava pismo
glava 1, -1 -1,1
pismo -1,1 1,-1
Slika 4.4.
Takva igra, u kojoj su interesi igraca dijametralno suprotni, naziva se "strogo konkurentnim". Igra
“odgovarajucih novcica” nema Nashovu ravnotezu.
Pojam strateske igre obuhvaca situacije mnogo slozenije od onih opisanih u zadnjim primjerima.
Nakon navedenih primjera navescemo i sljdece definicije:
Definicija 1 Strategiju si′ ∈ Si nazivamo dominantnom strategijom igrača i ukoliko, neovisno o
izboru strategija ostalih igrača s1, . . . , si−1, si+1, . . . , sn, vrijedi ui(s1,...,si′,...,sn) ≥ ui(s1,...,si,...,sn),
za sve si ∈ Si \{si′},tj. isplate za si′ su veće ili jednake od isplata za bilo koje druge strategije igrača
i.
Napomena: Ako u prethodnoj definiciji umjesto veće stavimo strogo veće tada kažemo da je
strategija striktno dominantna strategija.
Ekvivalentno na temelju ove definicije definirajmo i pojam podređene strategije.
Definicija 2 Strategiju si′ ∈ Si nazivamo podređenom strategijom igrača i ukoliko, neovisno o
izboru strategija ostalih igrača s1, . . . , si−1, si+1, . . . , sn, vrijedi
ui(s1,...,si′,...,sn) ≤ ui (s1,...,si,...,sn),za sve si ∈Si \{s′} ,t j.isplate za si′ su manje ili jednake od isplata za
bilo koje druge strategije igrača I.
5. Egzistencija Nashovog Equilibriuma
Šta je potrebno da igra ima mogucnosti za Nashovu ravnotezu? Jer ne posjeduje svaka strateska igra
Nashovu ravnotezu, kao sto to pokazuje igra “odgovarajucih novcica”.
Predstavicemo dvije tvrdnje koje sluze za provjeravanje da li neka igra ima potencijala da bude
ravnotezna, tj. da li da uopste ulazemo napore za pronalezenje ravnoteznih stanja.
Drugo, i jos vaznije, postojanje ravnoteze pokazuje da igra sadrzi stabilno rjesenje. Nadalje,
postojanje ravnoteze za familiju igara dopusta nam da proucimo svojstva ove ravnoteze.
Da bi se pokazalo da igra ima Nashovu ravnotezu, dovoljno je pokazati da postoji profil a * akcija
takvih da ai*∈ Bi (a*i-1) u E za sve i ∈ N.
Definisimo funkciju sa jednoclanom vrijednosti Bi : A →A sa B(a)=xi ∈ N Bi(a-i).
Teoremi s fiksnim tackama daju uslove na B pod kojima postoji doista vrijednost a * za koju je a *
∈ B (a *).
Fiksni teorem tocke koji koristimo je Kakutanijev fiksni tackasti teorem:
5.1.Kakutanijev fiksni tačkasti teorem
Neka je X kompaktni konveksni podskup od Rn i neka f: X → X bude funkcija za koju vazi:

• za svako x ∈ X skup f (x) je neprazan i konveksan
• graf funkcije f je zatvoren (tj. za svaki niz {xn} i {yn}, takav da yn ∈ f(xn) za svako n,
kada xn →x i yn →y, važi da y ∈ f(x)).
Tada postoji x∗ ∈ X, takva da x∗ ∈ f(x∗).
5.2. Teorema
Strateska igra (N, (Ai) ,( ≥i )) ma Nashov ekvilibrijum ako je za svako i ∈ N

- skup akcija igraca Ai, neprazan, kompaktan, konveksan podskup Euklidskog prostora
i ako je relacija preferencije ≥i
- neprekidna,
-konveksna na Ai.
Ova teorema u terminu funkcije korisnosti glasi na sljedeci nacin:
Strateska igra (N, (Ai) ,( ≥i )) ima Nashovu ravnotezu ako za sve i ∈ N vrijedi:
-skup Ai akcija igraca i, Ai je neprazan kompaktni konveksni podskup Euklidskog prostora
i ako za relaciju preferencije ≥i vrijedi da je:
-kontinuirano-neprekidna
-kvazi-konkavna na Ai.
Dokaz:
Kako bismo dokazali ovu teoremu, koristicemo kasto smo rekli teoremu Kakutani, tj. pokazacemo
da pod uslovima iz ove teoreme preslikavanje B ima osobine da je B(a) neprazan i konveksan skup
i da je preslikavanje B semi neprekidno od gore.
Bi(a−i) je neprazan skup jer je Ai neprazan i kompaktan skup i funkcija korisnosti definisana na
njemu, ui, neprekidna. Ovo vazi za svako i ∈ N, pa je samim tiim i B(a) neprazno.
Dalje pokazujemo da je skup B(a) konveksan, tj. pokazacemo da su skupovi B i(a−i) konveksni, pa
ce na osnovu teoreme slijediti konveksnost skupa B(a).
Neka su a′ i a′′ najbolji odgovori za akcije svih drugih igraca a−i, tj. neka a′ , a′′ ∈ Bi(a−i).
Treba da pokazemo da ce i
αai′ +(1−α)ai΄΄∈ B(ai-1).
Kako a′ , a′′ ∈ Bi(a−i) imamo da je
ui(a′i,a-i ) ≥ ui (ai,a-i), ∀ai ∈ Ai i
ui(a΄΄i, a-i ) ≥ ui (ai, a-i), ∀ai ∈ Ai (1)
Dakle imamo da je ui(a′, a−i) ≥ ui(a′′i, a−i), odakle kako je funkcija ui kvazi-konkavna imamo da vazi
ui(αa′ +(1−α)a′′,ai-1 ) ≥ui (a′′,ai-1 ),
pa iz (1) dobijamo
ui(αai′ +(1−α)ai′′,a-i )≥ui(ai,a-i ), ∀ai ∈ Ai
Dakle, αa′ + (1 − α)a′′ ∈ Bi(a−i).
Preostalo je jos da se pokaze da je preslikavanje B semi neprekidno od gore. Pretpostavimo
suprotno, tj. neka postoje konvergentni nizovi
ak→a, ∀k∈N, (2)

ak → ầ∀ai ∈ Ai , ∀k ∈ N, (3)
takvi da ậk ∈ B(ak), ali ậ ne pripada B(a). Kako vazi ậk ∈ B(ak) imamo da za svako i ∈ N,
ậi k ∈ Bi(ak-i) (4)
Na granici, kako ậ nije najbolji odgovor za a, sledi da postoji bolja akcija za nekog igraca i, tj.
postoji i ∈ N,postoji a´ ∈ Ai,tako daje
ui(a′i, a−i) > ui(ai, a−i).
Kako vazi (2), vazi i ak-i→a-i, pa mozemo uzeti dovoljno veliko k, tako da u i(a′i, ak−i) bude dovoljno
blizu ui(a′i, a−i). Kako vaze (2) i (3) mozemo uzeti k dovoljno veliko da ucinimo u i(ậi k,, ak-i)
proizvoljno blizu ui(ậi, a−i). Tada za svako k dovoljno veliko imamo
ui(a′i, a−i) > ui(ậi k,, ak-i)
ali ovo znaci da nije najbolji odgovor za ak−i,a to je kontradikcija sa (4).
Dakle, zadovoljeni su uslovi leme Kakutani, pa preslikavanje B ima fiksnu tacku, sto znaci da
postoji Nashova ravnoteza normalne forme igre. 13
6. Strogo takmičarske igre
U ovom poglavlju se govori o posebnoj klasi dvostrukih igara, te da bismo ih proucavali, korisno je
da pomenemo sigurnosne strategije.
13 Aleksandra Radanovic, Neki aspekti teorije igara i njihova primena u ekonomiji,
http://www.dmi.uns.ac.rs/site/dmi/download/master/primenjena_matematika/AleksandraRadanovic.pdf,
pristupljeno juli 2017.
Koncept strategije sigurnosti omogucava izdvajanje zajednicke strategije kao najrazumljivijeg
ishoda za oba igraca. Kada igrac bira svoju strategiju on mora da uzme u obzir koje ce strategije
njegovi protivnici da odaberu. Najgore sto bi se moglo desiti za igraca je kada on napravi svoj izbor
strategije, da njegovi protivnici odaberu zajednicku strategiju za koju ce njegova isplata biti
najniza.14
Ovaj koncept mozemo formalizovati definisanjem funkcije:
fi : Si →R sa fi(si) := min pi (si, s−i).
Ova funkcija daje minimalnu isplatu koja je igracu garantovana ako izabere strategiju si.
U suštini igrač odabire akciju koja maksimizira najgoru moguću dobit koju agent može ostvariti.
6.1. Definicija
Strateska igra ({1, 2}, (Ai) (≥i)) je strogo konkurentna ako za bilo koji a ∈ A i b ∈ A imamo da je
a ≥1 b ako i samo ako je b ≥2 a.
Strogo konkurentna igra se ponekad naziva igra nulte sume, jer ako je prva preferencija igraca 1
predstavljena sa funkcijom isplate u1, onda je druga preferencija igraca je predstavljena sa u2 sa
u1+u2=0.
Kazemo da igrac i maksminimizira ako izabere akciju koja je najbolja za njega pod pretpostavkom
da sta god da radi, igrac j ce izabrati svoju akciju da mu nanese stetu sto je moguce vise.
Sada pokazujemo da je za strogo takmicarsku igru koja poseduje Nahovu ravnotezu, par akcija je
predstavlja Nashovu ravnoteza, ako i samo ako je akcija svakog igraca maxminizovana. Ovdje
dokazujemo da sve strogo takmicarske igre koje poseduju ravnotezu Nasha, donose iste dobitke.
Ova osobinu Nashoove ravnoteze rijetko posjeduju igre koje nisu striktno konkurentne.
6.2. Definicija
Neka ({I, 2}, (Ai), (ui)) bude striktno takmicarska strateska igra. Akcija x * ∈ A1 je maxminimizer za
igraca 1 ako:
min u1 (x *, y) > = min u1 (x, y) za sve x e A1
y∈A2 y∈A2
Slicno tome, akcija y *∈ A2 je maxminimizer za igraca 2 ako:

min u2 (x, y *) ≥ min u2 (x, y) za sve y e A2.
x∈A1 x∈A1
Znaci maxminimizer za igraca i je akcija koja maksimizira isplatu koja se igracu moze jamciti.
14 Aleksandra Mracevic, http://www.dmi.uns.ac.rs/site/dmi/download/master/primenjena_matematika/AleksandraMracevic.pdf,

master rad, pristupljeno juli 2017
7. Bayesove igre: Strateške igre sa nesavršenim informacijama
Termin "Bayesova" potice iz 18. vijeka matematicar i teolog Tomas Bayes, koji je obezbedio prvi
matematicki tretman netrivijalnom problemu Bajesovog zakljucivanja. Matematicar Pjer Simon
Laplas je razvio i popularisao ono sto se sada zove Bajesova verovatnoce.
Uopsteno govoreci, postoje dva pogleda na Bayesovu verovatnocu koja tumaci koncept verovatnoce
na razlicite nacine. Prema objektivistickom misljenju, pravila Bayesove statistike mogu biti
opravdana zahtevima racionalnosti i dosljednosti i mogu se tumaciti kao nastavak logike. Prema
subjektivistickom misljenju, verovatnoca je kvantifikovana kao "licno uverenje".15
Model Bayesovih igara, koja je blisko povezana sa strateskom igrom, je osmisljen kako bi se mogle
modelirati situacije u kojima neke od strana nisu sigurne u karakteristike u druge strane.
Dva glavna elementa Bayesove igre su skup od N igraca i profil (A i) skupova akcija. Modeliramo
nesigurnost igraca jednih u druge uvođenjem skupa Ω mogucih stanja prirode, od kojih je svaki opis
svih relevantnih karakteristika igraca.
Pretpostavimo da je Ω konacan. Svaki igrac i ima prethodno uverenje o stanju prirode datom sa
mjerom vjerovatnosti pi na Ω . Sa svakim odigranom potezu u igri neko stanje prirode ω e Ω se
realizuje. Modeliramo informacije igraca o stanju prirode uvođenjem profila (τi) signalnih funkcija,
τi (ω) je signal koji igrac i prati, prije izbora svog poteza, kada je stanje prirode ω.
Neka Ti bude skup svih mogucih vrijednosti (τi ); Ti nazivamo kao skup tipova igraca i.
Pretpostavimo da pi (τi-1(ti)) > 0 za sve τ i e Ti (igrac dodeljuje pozitivnu prethodnu verovatnocu
svakom clanu Ti). Ako igrac i dobije signal ti e Ti tada on zakljucuje da je stanje u skupu τ i-1(ti):
njegovo naknadno misljenje o stanju koje je realizovano dodjeljuje svakom stanju ω e Ω
vjerovatnost pi (ω ) / pi ( τi-1 (ti)) ako ω e τi-1(ti) i verovatnocu nula inace.
Kao i u strateskoj igri, svaki igrac vodi racuna o akcijskom profilu. Pored toga, on vodi racuna o
stanju prirode. Sada, cak i ako je upoznat sa potezima koje poduzima svaki igrac u svakom stanju
prirode, igrac moze biti nesiguran u odnosu na par (a, ω) koji ce se realizovati s obzirom na bilo
kakvu akciju koju preduzima, posto ima nepotpune informacije o stanju prirode.
Stoga u model ukljucujemo profil ≥i preferencijalnih odnosa nad lutrijama na A x Ω.
Da sumiramo, donosimo sljedecu definiciju:
7.1. Definicija
Bayesova igra se sastoji od:
1) konacnog skupa N (skupa igraca)
2) konacnog skupa Ω (skupa stanja)
3) i za svakog igraca i e N
15 Bayesisan probability, http://www.maria-online.com/information/article.php?lg=sh&q=Bayesova_vjerovatnoca,

juni 2017.g.
4) skup Ai (skup poteza dostupnih igracu i)
5) konacnog skupa Ti (skup znakova koje pratiti posmatrati igrac i) i funkcije
τi : Ω → Ti (signalna funkcija igraca i)
6) mjera vjerovatnoce pi na Ω (prethodno uvjerenje igraca i) za koju pi ( τi-1(ti))> 0 za sve
ti ∈ Ti
7) preferencija ≥i na skupu mjera vjerovatnoce nad A x Ω (preferencijalni odnos igraca i), gde
A = X j ∈ N A j.
Potrebno je imati na umu da ova definicija omogucava igracima da imaju razlicita prethodna
uverenja.
Ova uvjerenja mogu biti povezana.
Sada se okrenemo definiciji ravnoteze za Bayesovu igru. U svakom potezu igre svaki igrac zna svoj
tip i ne mora da planira sta bi uradio u slucaju da je igrac nekog drugog tipa.
Shodno tome, moze se pomisliti da bi za svako stanje prirode trebalo izolovano definisati
ravnotezu. Međutim, u bilo kojem stanju igrac koji zeli da povuce svoje najbolje poteze mozda ce
morati da se drzi uvjerenja o tome sta bi drugi igraci ucinili u drugim stanjima, jer on mozda nije
dovoljno informisan o stanju. Dalje, formiranje takvog uvjerenja moze zavisiti od poteza koji bi
igrac odabrao da povuce u drugim stanjima, s obzirom da drugi igraci mogu biti i nepotpuno
informirani.
Navedeno nas dovodi do toga definisemo Nashov equilibrium Bayesove igre (N, Ω, (Ai) (Ti), (τi),
(pi), (≥i) ) kao ravnotezu Nash strateske igre G* u kojoj za svaki i ∈ N i za svaki moguci signal ti ∈
Ti, postoji igrac, koga oznacavamo kao (i, ti) ('tip ti, igraca i').
Skup aktivnosti svakog takvog igraca (i, ti) je Ai, tako da je skup akcijskih profila u G * je X j ∈ N
(xtj∈TjAj).16
7.2. Definicija
Nashova ravnoteza Bayesove igre (N, n, (Ai), (Ti),(τi), (pi), (≥i )) je definisana na sljedeci nacin.
1) skup igraca je skup svih parova (i, ti) za i e N i ti e Ti:
2) skup poteza svakog igraca (i, ti) je Ai;
3) poredak preferencija ≥ *(i,ti) svakog igraca (i, ti) je definisana sa:
a * ≥ *(i,ti) b * ako i samo ako L i (a *, ti) Li (b *, ti), gde je Li (a*,ti) je lutrija nad A x Ω koja
oznacava vjerovatnocu pi (ω) / pi (τi-1 (ti)) do ((a * (j, τj (ω))) j∈N,ω) ako ω ∈ τi-1 (ti ), u
suprotnom je nula.
Ukratko, u ravnotezi Nasha sa Bayesovom igrom, svaki igrac bira najbolju akciju koja mu je
dostupna s obzirom na signal koji dobije i njegovo uvjerenje o stanju i potezima drugih igraca.
16 Martin J. Osborne and Ariel Rubinstein, A course in game theory, (Cambridge: MIT Press, 1994.), str.
7.3. Primjer
Aukcija druge cijene17
Razmotrimo varijantu druge cijene kojoj svaki igrac poznaje vlastitu vrijednost v i, ali nije siguran u
procjene drugih igraca.
Konkretno, pretpostavimo da je skup mogucih vrednovanja konacan skup V, i svaki igrac smatra da
je vrednovanje od strane drugih igraca nezavisno od iste raspodjele nad V.
Ovu situaciju mozemo modelirati kao Bayesova igra u kojoj je:
• skup od N igraca je {I, ..., n}
• skup Ω je skup stanja je Vn
• skup Ai poteza svih igraca i je IR +
• skup Ti znakova koje igrac i moze dobiti je V
• tzv. signalna funkcija je definisana sa Ti (v1,....,vn) = vi
• prethodno uvjerenje pi od i je dato sa pi(v1,...,vn)= Пnn=1π(vi) za neku raspodelu vjerovatnoce π nad
V.
• preferencijalni odnos igraca i je predstavljen ocekivanjem slucajne varijable cija je vrijednost u
stanju (v1,....,vn) vi-maxjeN/(i)aj ako i igrač sa najnižim indeksom za koji ai>=aj za sve j ∈ N i u
drugom slucaju.
Ova igra ima Nashovu ravnotezu a * u kojoj a * (i, v i) = vi za sve i ∈ N i v i ∈ V = Ti (svaki igrac
ponudi svoju procenu).
17 Ibid, str. 27.

8. Zaključak
Tema ovog rada je bila Nashova ravnoteza objasnjena u kontekstu strateskih igara i Bayesovih
igara.
Na pocetku je pojasnjen pojam strateske igre koji u sustini oznacava model donosenja odluka gdje
svi igraci donose odluku na pocetku, a zatim svi simultano izvode svoje akcije. To je bilo prijeko
potrebno prije samog uvođenja pojma Nashove ravnoteze koji oznacava koncept rjesenja u teoriji
igara, koji prije podrazumijeva svega stabilno stanje igre strateske igre u kojoj svaki igrac ima
ispravna ocekivanja o ponasanju drugih igraca i djeluje racionalno. Upravo je naglasak na stabilnom
stanju kao sto se moglo zakljuciti iz svih definicija, teorema i primjera koje su navedeni u vezi
Nashove ravnoteze.
Znaci, Nashova ravnoteza ne znaci da je ovakav ishod idealan ili najbolji za igrace vec samo da je
najbolji u postojecim uslovima.
Zatim, u kontekstu strogo takmicarskih igara vidjeli smo da je njihova posebna karakteristika da
par akcija predstavlja Nashovu ravnotezu, ako i samo ako je akcija svakog igraca maxminizovana,
sto dokazuje da sve strogo takmicarske igre koje poseduju ravnotezu Nasha, donose iste dobitke.
Bayesove igre su vazne zato sto su uvele koncept vjerovatnoce, jer je jako puno primjera gdje igraci
jedni o drugima nemaju sve informacije.
Iz svega naprijed navedenog, a narocito iz navedenih primjera, koji su bili relativno jednostavni i
koji su posluzili kao ogledni primjer, moze se barem nazrijeti znacajan doprinos Nashove ravnoteze
u rjesavanju daleko kompleksnijih problema odlucivanja i njegovu ulogu prije svega u savremenoj
ekonomiji, ali i drugim oblastima zivota.
LITERATURA
- Čalija Matijevic Mirna, Bojan Radisic, Nashova ravnoteza, hrcak.srce.hr/file/168691, Osjecki

matematicki list 13 (2013).
- Berger, James O. (1985). Statistical Decision Theory and Bayesian Analysis. Springer Series in
Statistics (Second ed.). Springer-Verlag.
- Bayesisan probability, http://www.maria-online.com/information/article.php?
lg=sh&q=Bayesova_vjerovatnoca, posjeceno juni 2017.
- Martin J. Osborne and Ariel Rubinstein, A course in game theory, (Cambridge: MIT Press, 1994.)
- Mracevic Aleksandra,
http://www.dmi.uns.ac.rs/site/dmi/download/master/primenjena_matematika/AleksandraMracevic.p
df, master rad., posjeceno juli 2017
- Pavlovic Dusan,
http://www.dusanpavlovic.in.rs/mypage/Blog/Entries/2015/5/26_Nesova_ravnoteza.html
- Primjeri Nashovog equilibriuma, http://decision.math.hr/nastava/vjezbe/02%20-%20Primjeri
%20Nashovog%20equilibriuma.pdf, posjeceno juli 2017
- Radanovic Aleksandra, Neki aspekti teorije igara i njihova primena u ekonomiji,
http://www.dmi.uns.ac.rs/site/dmi/download/master/primenjena_matematika/AleksandraRadanovic.
pdf., posjeceno juni 2017
- Skupovi, relacije i funkcije, http://imft.ftn.uns.ac.rs/~vanja/old/P1.pdf., posjeceno maj 2017
- Step by step guide on how to find a Nash Equilibrium or Equilibria ,
http://www.uwyo.edu/shogren/jaysho/nashnotes.pdf, posjeceno maj 2017

Nashova Ravnoteža

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Nashova Ravnoteža

Uploaded by

Copyright:

Available Formats

UNIVERZITET U SARAJEVU

TEMA: NASHOVA RAVNOTEŽA

Predmetni profesor: Student:

Doc. dr. Fikret Čunjalo

Sarajevo, septembar 2017.g.

1 Nashova ravnoteza, hrcak.srce.hr/file/168691, pristupljeno juli 2017

2.2. Relacija preferencije

Akcije jednog igraca sadrzane su u recima, a drugog igraca u stupcima.

4.2. Koraci do Nashovog equilibriuma9

Saradnja 2000 (B) 4000(B)

6 Ibid, str 14.

9 Step by step guide on how to find a Nash Equilibrium or Equilibria,

Saradnja 2000 (B) 4000(B)

Posto je 2000>1500 i posto je 60>50

Saradnja 2000 (B) 4000(B)

Posto je 4000>2000 i posto je 101>100.

Saradnja 2000 (B) 4000(B)

Sljedece klasicne igre predstavljaju razlicite strateske situacije.

4.3.1. Bach ili Stravinsky (BoS)10

Bach 2,1 0,0

Stravinsky 0,0 1,2

4.3.2. Zatvorenikova dilema

Ovo je veoma poznat problem.Dva osumnjicenika, P i M, su pritvorenici u odvojenim celijama.

Igra koja obuhvaca ovu situaciju prikazana je na sljedecoj slici:

Golubica 3,3 1,4

4.3.4. Odgovarajući novčići

11 Primjeri Nashovog equilibriuma, http://decision.math.hr/nastava/vjezbe/02%20-%20Primjeri%20Nashovog

5. Egzistencija Nashovog Equilibriuma

5.1.Kakutanijev fiksni tačkasti teorem

Neka je X kompaktni konveksni podskup od Rn i neka f: X → X bude funkcija za koju vazi:

Strateska igra (N, (Ai) ,( ≥i )) ma Nashov ekvilibrijum ako je za svako i ∈ N

ui(a′i,a-i ) ≥ ui (ai,a-i), ∀ai ∈ Ai i

ui(a΄΄i, a-i ) ≥ ui (ai, a-i), ∀ai ∈ Ai (1)

ak→a, ∀k∈N, (2)

6. Strogo takmičarske igre

Slicno tome, akcija y *∈ A2 je maxminimizer za igraca 2 ako:

14 Aleksandra Mracevic, http://www.dmi.uns.ac.rs/site/dmi/download/master/primenjena_matematika/AleksandraMracevic.pdf,

15 Bayesisan probability, http://www.maria-online.com/information/article.php?lg=sh&q=Bayesova_vjerovatnoca,

17 Ibid, str. 27.

- Čalija Matijevic Mirna, Bojan Radisic, Nashova ravnoteza, hrcak.srce.hr/file/168691, Osjecki

You might also like