You are on page 1of 45

1. Pojam i definicija teorije igara.

Statičke igre s
potpunom informacijom (01.03.2012.)

Uvod

 Teorija igara je matematička disciplina koja se razvila
sredinom 20. stoljeća.
 Prva knjiga objavljena na tu temu je Theory of games and
economic behavior (Teorija igara i ekonomsko ponašanje)
autora matematičara Johna von Neumanna i ekonomista
Oskara Morgensterna.
 Fundamentalni doprinos teoriji igara dao je i John Nash u
svome radu: Non-cooperative games, Annals of Mathematics
54 (1951), 286-295, za koji mu je kasnije dodijeljena
Nobelova nagrada za ekonomiju.
 O Johnu Nashu snimljen je i biografski film: Genijalni um.

 Glavna motivacija za razvoj teorije igara bila je ekonomska.
 MeĎutim, teorija igara je našla primjene i udrugim društvenim
znanostima. Primjenjuje se u vojnim znanostima, a zabilježene
su primjene i u biologiji. Interesantni primjeri iz biologije
mogu se naći u knjizi Richarda Dawkonsa Sebični gen.
 Teorija igara se bavi situacijama konflikta izmeĎu dvaju ili
više sudionika.
 Osnovni cilj teorije igara jeste definirati najpovoljnije
ponašanje sudionika , pod pretpostavkom njihove
racionalnosti.
 Konflikt izmeĎu sudionika reguliran je strogo definiranim
pravilima kao u društvenim igrama poput pokera, monopola,
“čovječe ne ljuti se” i sličnim.

 Teorija igara je dobila naziv po tome što ona omogućava
preciznu analizu takvih igara.
 Teorija igara je uglavnom ostala u okvirima akademskih
primjera, zbog toga što konflikti u stvarnom životu obično nisu
podložni jednostavnim pravilima.
 Bez obzira na nedostatke, radi se o teoriji koja povezuje
nekoliko grana matematike i dala je važne doprinose
razumijevanju ponašanja u ekonomiji, sociologiji,
psihologiji i teoriji evolucije.

Strateška interakcija

 Ako promatramo tržište, strateška interakcija predstavlja
stanje u kojem poslovna strategija svakog od poduzeća ovisi o
poslovnim planovima njegovih suparnika, odnosno
konkurenata.
 Ona “tjera” menadžera svakog poduzeća da razmišlja o
tome kako će konkurenti reagirati na njegovu strategiju.



 Tako u situaciji kad menadžer poduzeća npr. treba odrediti
strategiju cijene, on mora razmišljati o tome kako će
konkurenti reagirati na njegovu cijenu i hoće li oni smanjiti
svoju cijenu, ako on to uradi.

 S druge strane, prije povećanja cijene menadžer mora biti
siguran da će i konkurenti povećati cijenu, jer u protivnom on
gubi kupce.



• U svakom slučaju, odluka povećati ili smanjiti cijenu ovisi o
menadžerovom razmišljanju o tome kako će njegovi suparnici
reagirati.

• Promatrajmo ovu interakciju u slučaju duopola grafički na
sljedećoj slici.


Cijena









A





D
1
D
2



Q
0
Količina potražnje
P
0


Ravnoteža u strateškoj interakciji


 Poduzeća mogu i surađivati ako osjete priliku da će
zajedničkim djelovanjem povećati vlastitu korist.
 MeĎutim, suradnja je veoma rijetko u interesu konkurenata i
svaki od njih će prestati suraĎivati odmah nakon što osjeti
priliku da poveća vlastiti profit na račun suradnje. Suradnja je
posebno otežana kad je broj konkurenata veliki.
 Svako poduzeće vodi računa isključivo o svom profitu, tako da
se ne ustručava poduzeti akcije kojima će povećati svoj profit,
a pri tome ne vodeći računa hoće li na taj način umanjiti profit
konkurenata.




 Kada se poduzeća u interakciji ne mogu pouzdati u zakon
ili neku drugu silu koja će ih obvezati da sarađuju radi
zajedničkog interesa, ne preostaje im ništa drugo nego da budu
racionalni, odnosno da izaberu onu strategiju kojoj će se sami
povinovati.
 Ako svaki od konkurenata izabere takvu strategiju, onda
nijedan od njih nema interesa promijeniti svoju strategiju, ako
želi maksimizirati svoj profit.


 Na taj način konkurenti nesvjesno sklapaju samopoticajni
sporazum i nikakav vanjski mehanizam nije potreban da ga
kontrolira [Katz (1994), str. 510].

 Sporazum u ovom kontekstu ne treba shvaćati kao dokument
koji obvezuje strane u interakciji što da rade, nego više kao
opće (uzajamno) shvaćanje o tome kako će se ponašati.


Nashova ravnoteža


• Nashova ravnoteža je prisutna pri onoj kombinaciji strategija
koja je stabilna tako da nijedna strana u interakciji nema
interesa da odstupi od svoje vlastite strategije ako se svi ostali
pridržavaju kombinacije strategija.
• Tada svaka strana faktički odgovara svojom najboljom
strategijom na strategije ostalih, odnosno svojim najboljim
odgovorom.

Strategija
drugog
ponuđača
(z)

Krivulja funkcije reakcije y (z)


Točka ravnoteže

Krivulja funkcije reakcije z (y)




Strategija prvog ponuđača (y)

Slika 2. Krivulje funkcije reakcije i ravnotežna točka

Osnovni pojmovi i terminologija

 Za igru kažemo da je pojednostavljeni model konflikta koji
obuhvaća ukupnost pravila ponašanja različitih strana u igri
koja odreĎuju njihove moguće poteze kao i potencijalne
rezultate njihovog izbora.
 Pojam igrača u teoriji igara je znatno širi od pojma sudionika
u igri, tako da on obuhvaća jednog ili više sudionika u igri koji
imaju zajednički interes, a koji se razlikuje od interesa drugih
igrača.



• Igrači mogu biti pojedinci, poduzeća, sportski timovi kao i
grupe pojedinaca. Svi igrači imaju različite interese, a cilj im
je da u igri doĎu do takvog rješenja koje će im osigurati
najpovoljniji rezultat.
• Potencijalni rezultati su najčešće predstavljeni funkcijom
plaćanja koja predstavlja numerički izraz dobitaka ili gubitaka
igrača.



 Strategija predstavlja skup pravila ponašanja igrača kao i
potencijalne rezultate izbora pojedinih alternativa u svakoj
konkretnoj situaciji.
 Tako se izborom strategije ostvaruje jedan korak u igri
odnosno potez. Nakon svakog koraka, odnosno izborom
strategije od svakog igrača, dobiva se situacija.
 Broj mogućih situacija je odreĎen brojem mogućih strateških
kombinacija koji predstavlja proizvod broja strategija svakog
igrača.



 Prihvatljiva situacija za nekog igrača je ona situacija u kojoj
on ne može ostvariti povoljniji rezultat izborom neke druge
strategije.
 Ona situacija koja je prihvatljiva za sve igrače je situacija
ravnoteže.
 Optimalne strategije su one strategije koje dovode do
situacije ravnoteže.


Oblici predstavljanja igre

 Igra, odnosno strateška interakcija, može biti predstavljena na
različite načine u zavisnosti od toga kako želimo vršiti analizu.
U tu svrhu je neophodno razlikovati ekstenzivni (opći),
strateški (normalni) i koalicijski (forma sa karakterističnom
funkcijom) oblik igre.



 Ekstenzivni oblik se predstavlja u vidu stabla igre.
 Igra u ekstenzivnoj formi počinje kada jedan igrač preduzme
jednu od mogućih akcija. Nakon toga, ostali igrači odgovaraju
svojim akcijama.
 Postupak se obnavlja sve dok se igra ne završi, a tada svaki
igrač dobiva svoj payoff (plaćanje, obračun).



• Ukoliko na odvijanje igre utječe i priroda sa različitim
stanjima, onda se ista javlja kao igrač 0, koji bira stanja
prirode na osnovi distribucije vjerovatnosti, koja je poznata
svim ostalim igračima.
• Kada neki igrač treba poduzeti akciju on se nalazi u točki
odlučivanja.
• Istovremeno poduzimanje akcija dva ili više igrača se modelira
na osnovi informacijskih skupova.



 Ukoliko igrač prije poduzimanja akcije točno zna u kojoj točki
odlučivanja se nalazi, onda ta točka predstavlja
informacijski skup.
 Ako se nakon poduzimanja akcije igrač može naći u m novih
točaka odlučivanja, gdje svaka poduzeta akcija vodi do
različite točke, onda ovih m točaka će predstavljati
informacijski skup, pošto ostali igrači ne znaju u kojoj točki se
nalaze nakon njegovog poduzimanja akcije. Predstavljanje igre
u ekstenzivnom obliku pogodno je samo za jednostavnije igre.



 Za pojašnjenje strateškog oblika predstavljanja igre najbolje je
promatrati jednostavnu situaciju igre dva igrača koji polažu
novčiće, a od izbora strane na koju polože novčić (P - pismo,
G - glava) ovisi i rezultat igre. Možemo pretpostaviti da igrač
treba odigrati igru, a da mu nije omogućeno prisustvovanje
samom polaganju novčića. Tada on može izabrati neku osobu
da ga zamijeni, ali u tom slučaju on mora svom zamjeniku dati
sve instrukcije o tome koje izbore on treba izvršiti.



• To znači da on treba svom zamjeniku dati pravila za
odlučivanje za svaki informacijski skup koji njemu pripada.
• On može dati različita pravila odlučivanja za različite
informacijske skupove.
• Recimo da prvi igrač daje instrukcije svom zamjeniku. One
mogu imati slijedeću formu: Prvi put izaberi P i ako protivnik
odgovori sa P onda izaberi G, a ako drugi igrač odgovori sa G
onda u drugoj fazi izaberi P.



 Ovakav skup instrukcija u teoriji igara se naziva strategija.
Ona specificira akcije koje igrač treba poduzeti u svakoj točki
odlučivanja ukoliko u igri doĎe do te točke. Stoga, strategija
igrača opisuje kako će se igrač ponašati za vrijeme igre [Azhar
(2000), str. 16].
 Iako se igre igraju nizom akcija, svaka akcija je važna toliko
koliko ona doprinosi realizaciji strategije. Strategija može
specificirati da se izbor akcija vrši u skladu sa nekom
distribucijom vjerovatnsti.



• Tako npr., strategija za prvog igrača može glasiti: prvi put
izabrati P i ako drugi igrač odgovori sa P onda izabrati P sa
vjerojatnošću 0,3 i G sa vjerojatnošću 0,7, a ako drugi igrač
odgovori sa G onda u drugoj fazi izabrati P sa vjerojatnošću
0,6 i G sa vjerojatnošću 0,4.
• Ovako se za svaku strategiju može utvrditi očekivana
vrijednost plaćanja za svakog igrača na osnovi
vjerojatnosti dolaska u svaku od završnih točaka.



• Ako je izbor akcije odreĎen sa distribucijom vjerojatnosti u
pitanju su mješovite strategije. U suprotnom slučaju, kada
nema slučajnog izbora, radi o čistim strategijama.
• Za svaki mogući par strategija koji igrači mogu izabrati njima
odgovarajuća plaćanja se predstavljaju u matrici plaćanja i
njeni reci predstavljaju strategije prvog igrača, a stupci
predstavljaju strategije drugog igrača.



• Kao treća forma u kojoj se vrši predstavljanje igara javlja se
forma sa karakterističnom funkcijom, odnosno koalicijska
forma igre.
• Za ovu vrstu igara karakteristično je da igrači, odnosno
podgrupa igrača pregovaraju prije igranja igre o tome što raditi
u igri. Kao rezultat pregovaranja može biti zaključen i potpisan
sporazum koji je obligatoran za potpisnike.
• Ova podgrupa igrača koja pravi sporazum naziva se koalicija.


• Zbog suradnje meĎu igračima u središtu pažnje su payoff
mogućnosti koje stoje na raspolaganju svakom igraču,
odnosno koaliciji.
• Zato se ove igre predstavljaju pomoću karakteristične
funkcije koja se dodjeljuje svakoj mogućoj koaliciji.
• Karakteristične funkcije pokazuju preferencijsku strukturu igre
koja determinira sporazume koji su izvodljivi [Peters (1992),
str. 193].



Vrste igara

• U ovisnosti o meĎusobnom odnosu izmeĎu igrača razlikujemo
nekooperativne i kooperativne igre. Igre u kojima izmeĎu
igrača ne postoji suradnja, odnosno svaki igrač vrši izbor
samostalno bez koordinacije s drugim igračima, nazivaju se
nekooperativne.
• Kod kooperativnih igara igrači na osnovu sporazuma
formiraju koalicije.

Igrač B
Strategija Priznati Ne priznati
Priznati 3,3 0,6
Igrač A
Ne priznati 6,0 1,1
Zatvorenikova dilema
Tabela 2. Zatvorenikova dilema


• Jednopotezna igra se igra samo jednom tako da se rezultati
analize ne mogu primijeniti ako se ista igra ponavlja dva ili
više puta.
• Kod igara sa ponavljanjem ista igra se ponavlja sa istim
igračima.
• U zavisnosti od broja ponavljanja razlikujemo igre sa
beskonačnim i igre sa konačnim ponavljanjem.



• Ako igrači odluke donose istovremeno tako da nijedan igrač
prilikom donošenja odluke nije upoznat sa odlukama koje su
donijeli drugi igrači, u pitanju je igra sa simultanim izborom.
• Naprotiv, ako jedan igrač donosi odluku nakon što vidi koju
odluku je donio drugi igrač, onda je u pitanju igra sa
sekvencijalnim izborom.



• Veoma važna je i klasifikacija igara u ovisnosti o
informacijama o igri s kojima igrači raspolažu. Klasifikacija
igara sa ovog stajališta vrši se u ovisnosti o tomu ima li svaki
igrač informaciju o najvažnijim elementima igre odnosno zna
li:
1. tko su igrači u igri,
2. koje strategije stoje na raspolaganju svakom igraču i
3. koja su potencijalna plaćanja za sve igrače.




• Ako svaki igrač zna odgovore na ova tri pitanja, u pitanju je
igra s potpunom informacijom. Ako igru promatramo u
ekstenzivnoj formi, kod ovih igara svaki igrač u potpunosti je
upoznat s cijelim stablom igre kao i sa plaćanjima na svakoj
završnoj točki.
• Nasuprot tome, ukoliko jedan ili više igrača ne poznaje neki
dio stabla odlučivanja odnosno, ne zna odgovor na neko od
gore navedena tri pitanja, u pitanju je igra sa nepotpunom
informacijom.




• Ako se svaki informacijski skup sastoji od samo jedne točke
odlučivanja radi se o igri sa savršenom informacijom.

• U protivnom, ako neki igrač mora napraviti izbor, a da
prethodno ne može utvrditi ranije ili simultane izbore nekog
drugog igrača, u pitanju je igri s nesavršenom informacijom.



Ostali kriteriji za klasifikaciju igara

• Pored navedenih klasifikacija, razlikovanje igara se može
izvršiti i u ovisnosti o slijedećim kriterijima:
1. broj strategija,
2. karakter funkcije plaćanja i
3. broj igrača.

Statičke igre s potpunom informacijom – igre sa sumom
nula
 Prethodno smo objasnili osnovne termine iz teorije igara.
Objasnimo osnovne pojmove na primjeru igre dva grača sa
sumom nula.
 Riječ igra odnosi se na bilo kakav konflikt dviju
suprostavljenih strana koji se želi analizirati. Ne mora to biti
neka društvena igra, a sudionici ne moraju biti osobe.
 Kod igara sa sumom nula dobitak prvog igrača jednak je
gubitku drugog igrača, i obrnuto.
 Taj dobitak/gubitak treba biti izražen numerički, što u realnim
situacijama nije tako jednostavno učiniti.
 TakoĎer, igrači imaju konačan broj strategija (mogućnosti) za
ponašanje u sukobu.


 Razmotrimo jednostavan primjer, igru “par – nepar”. U ovoj
igri igrači pokazuju šaku s nekoliko ispruženih prstiju. Ako je
broj ispruženih prstiju paran, pobjeĎuje prvi igrač (“par”), u
suprotnom pobjeĎuje drugi igrač, “nepar”. Ovdje igrači imaju
samo dvije bitno različite mogućnosti: pokazati paran broj
prstiju ili pokazati neparan broj prstiju. Prema tome, svaki
igrač ima dvije strategije: 1. pokazati paran broj prstiju, i 2.
pokazati neparan broj prstiju. Igrač koji je pobijedio dobija
određenu količinu novca od igrača koji je izgubio, recimo
jednu kunu. Radi se o igri sa sumom nula, pošto je iznos koji
osvaja pobjednik jednak iznosu koji njegov protivnik gubi. U
nekim igrama to nije slučaj, npr. dio novca može zadržati
organizator igre (kockarnica).

 Sa stajališta prvog igrača svi mogući ishodi igre par - nepar su:
o Ako pokažem paran broj, a protivnik takoĎer, dobivam jednu kunu;
o Ako pokažem paran broj, a protivnik neparan, gubim jednu kunu;
o Ako pokažem neparan broj, a protivnik paran, gubim jednu kunu;
o Ako pokažem neparan broj, a protivnik takoĎer, dobivam jednu kunu.







 Ova se tablica naziva matrica isplata i njome je igra
potpuno odreĎena.



Prvi igrač
(“par)
Drugi igrač (“nepar”)
Paran broj Neparan broj
Paran broj 1 -1
Neparan broj -1 1

 Općenito, igra sa sumom nula u kojoj prvi igrač ima m čistih
strategija, a drugi igrač n čistih strategija zadaje se m x n
matricom:





 Reci odgovaraju strategijama prvog igrača, a broj
odreĎuje isplatu prvom igraču ako on odabere i-tu, a njegov
protivnik j-tu strategiju.
 Pozitivan broj znači da prvi igrač dobiva odgovarajući iznos, a
negativan da ga gubi.


11 12 1
21 22 2
1 2
...
...
...
n
n
m m mn
a a a
a a a
A
a a a
(
(
(
=
(
(
¸ ¸
ij
a

 Važna pretpostavka koju do sada nismo spomenuli je da se
igra ponavlja. Ako se par – nepar igra samo jednom, nema
smisla govoriti o optimalnom ponašanju igrača.
 U slučaju kad se igra ponavlja, igrači mogu igrati dobro ili
loše i daljnja analiza ima smisla.
 Pretpostavimo da prvi igrač uvijek pokazuje paran broj
prstiju. Njegov će protivnik brzo shvatiti da pokazivanjem
neparnog broja uvijek pobjeĎuje. Zapravo, ako samo malo
češće pokazuje parne nego neparne brojeve, drugi igrač
može uvijek pokazivati neparne brojeve i pobjeĎivat će
češće.
 Zaključujemo da prvi igrač treba jednakom
frevencijom birati parne i neparne brojeve, a isto
naravno vrijedi i za drugog igrača.

 Pretpostavimo sada da prvi igrač pokazuje redom paran broj,
zatim neparan, pa paran, pa neparan itd. Čim drugi igrač uoči
pravilnost, pokazivat će brojeve suprotne parnosti i uvijek
pobjeĎivati. Prema tome, igrači ne smiju dopustiti da protivnik
uoči pravilnost u njihovom nizu brojeva. Najbolje za njih je
parnost brojeva birati na slučajan način, bacanjem novčića
i sl. Tako dolazimo do pojma miješane strategije. Radi se o
vjerojatnostima prema kojima igrači biraju retke, odnosno
stupce matrice isplata. Uobičajeno je za prvog igrača
vjerojatnosti zapisivati u vektor redak P, a za drugog u vektor
stupac Q. Optimalne miješane strategije u igri par – nepar su,
dakle,
i .


| |
1/ 2 1/ 2 P =
1/ 2
1/ 2
Q
(
=
(
¸ ¸

 Zaključak vrijedi općenito: igračima nije u interesu da
protivnik uoči pravilnost u njihovoj igri, zato retke i stupce
matrice isplata biraju slučajno. Miješanu strategiju čine
vjerojatnosti prema kojima ih biraju. Za prvog igrača
zapisujemo ih horizontalno, a za drugog vertikalno:


i .


 Brojevi p
i
, q
j
su vjerojatnosti, tj ne smiju biti negativni ni veći
od jedan. Osim toga mora vrijediti
jer igrači u svakom ponavljanju igre biraju točno jednu čistu
strategiju.

| |
1 2
...
m
P p p p =
1
2
n
q
q
Q
q
(
(
(
=
(
(
¸ ¸
1 1
... ... 1
m n
p p q q + + = + + =

 Miješane strategije zapisuju se na opisan način da bismo mogli
množiti matrice P, A i Q. Produkt jednak je
matematičkom očekivanju dobitka prvog igrača i označava se
E(P,Q). Radi se o broju koji mjeri prosječan dobitak prvog
igrača. Prvom je igraču u interesu da taj broj bude što veći, a
drugom da bude što manji. Igrači utječu na njega izborom
svojih miješanih strategija (prvi igrač bira P, a drugi Q).
 Za igru par – nepar već smo našli optimalne strategije.
Vrijednost igre je očekivani dobitak kad oba igrača igraju
optimalno, u našem slučaju


 Ako je vrijednost igre jednaka nuli, igra je poštena.



P A Q · ·
| |
1 1 1/ 2
( , ) 1/ 2 1/ 2 0.
1 1 1/ 2
E P Q
÷
( (
= · · =
( (
÷
¸ ¸ ¸ ¸

 Ako je vrijednost igre pozitivna prvi igrač ima prednost, a ako
je negativna drugi igrač ima prednost. To, naravno, ne znači da
u igri pozitivne vrijednosti prvi igrač uvijek pobjeĎuje.
MeĎutim, što se više puta igra ponavlja veća je vjerojatnost da
njegov prosječni dobitak bude pozitivan. Prosječni dobitak
prvog igrača teži vrijednosti igre kad broj ponavljanja igre
raste.