Algoritamska Teorija Igara

PMF Sarajevo
Odsjek za matematiku
Odabrana poglavlja kompjuterskih nauka
Algoritamska teorija igara
Autor:
Harun Hindija
5. decembar 2014.
Sažetak
U ovom radu je dat kratak uvod u teoriju igara sa primjenom
na neke oblasti kompjuterske nauke, posebno na modeliranje nekih
situacija koje dolaze u kontekstu interneta. Nakon toga su predeni
neki aspekti Algoritamske teorije igara.
1 Uvod
Kako se drugi svjetski rat približavao kraju, von Neumann, tada nedvojbeno
najistaknutiji matematičar svijeta, se bavio dvjema naučnim disciplinama
koje će oblikovati ostatak dvadesetog stoljeća: Teorijom igara i algoritmima.
Godine 1944. sa Oskarom Morgensternom objavljuje knjigu Games and Eco-
nomics Behavior i tako nastaje Teorija igara, disciplina koja je našla veliku
primjenu u ekonomiji. U 1952. godini objavljuje naučni rad u kom se prvi
put spominje polinomijalni algoritam kao posebna prednost. Rješivost pro-
blema u polinomijalnom vremenu postaje jedan od zadataka koji još uvijek
predstavlja izazov svim naučnicima koji se bave algoritmima(došlo je vrijeme
kada efikasan i rješiv u polinomijalnom vremenu postaju skoro pa nerazdvojni
pojmovi).
Da li je von Neumann mogao predvidjeti da će se dvije potpuno različite
discipline koje je zasnovao pola vijeka kasnije spojiti. Amir Ronen i Nisan
Noam 1999. godine prvi put na Simpoziju o teoriji izračunljivosti STOC ’99
govore o dizajniranju algoritama za sebične korisnike.Oni kažu:
“Posmatrajmo algoritamske probleme u distribuiranom sistemu, gdje ne
možemo pretpostaviti da učesnici prate algoritam, gdje učesnike zanima samo
njihov interes.Budući da su ti učesnici u mogućnosti da manipuliraju i izmi-
jenjuju algoritam, dizajner algoritma mora osigurati da će agenti(učesnici)
najbolje zadovoljiti svoje interese ako slijede algoritam.”
Ono što von Neumann vjerovatno nije mogao pretpostaviti je nevjero-
vatna ekspanzija interneta. Internet je totalno promijenio ekonomiju, pro-
mijenio, ubrzao i stvorio dotada nezamislive forme tržišta. Algoritmi su
postali prirodno okruženje i platforma strateškog donošenja odluka. S druge
strane, internet je prvo kompjutersko djelo koje nije nastalo od jednog iz-
vora, već od strateške interakcije mnogih strana. Naučnici koji su se bavili
kompjuterskom naukom su po prvi put bili suočeni sa istim onim osjećajem
neizvjesnosti, straha i zbunjenosti sa kojim su već odavno ekonomisti posma-
trali tržište. Naravno, okrenuli su se teoriji igara za inspiraciju. Fascinantni
1
spoj ideja iz obe discipline - teorije igara i algoritama - je bio spreman da
se iskoristi da bi se osvijetlile misterije interneta. Nazvan je Algoritamska
teorija igara.
2
Slika 1: Zatvorenička dilema
2 Osnove teorije igara

2.1 Primjeri klasičnih igara
U uvodu smo spomenuli kako teoriju igara možemo koristiti da modeliramo
neke situacije koje se dešavaju na Internetu. Počet ćemo izlaganje o teoriji
igara sa nekim klasičnim igrama i pokazat ćemo kako se one mogu pojaviti
u kontekstu Interneta.
2.1.1 Zatvorenička dilema

Nemoguće je započeti izlaganje o teoriji igara, a ne spomenuti igru koja je
najpoznatija i najviše izučavana. Zamislimo sljedeću situaciju:
Pred dvojicu privedenih kriminalaca koji su bili saučesnici u izvršenju
krivičnog djela se u odvojenim prostorijama stavlja sljedeći izbor, svaki od
njih može da izda drugog ili da šuti. Ako jedan od njih dvojice odluči da izda
drugog, a drugi odluči da šuti, tada će se taj drugi kazniti kaznom zatvora
od 5 mjeseci, a prvi kaznom zatvora od 1 mjesec. Ako obojica izdaju jedan
drugog, čeka ih po 4 mjeseca zatvora. Ako ipak obojica odluče da šute, čeka
ih po 2 mjeseca zatvora. Ovo je predstavljeno tabelom na slici 1.
Iako nam se na prvi pogled čini da kriminalci trebaju da šute, ako posma-
tramo jednog od njih, neka je on K1(drugi je K2), K1 može izvršiti sljedeće
rezonovanje: ako K2 mene izda tada ću ja bolje proći ako izdam njega(dobit
ću 4 mjeseci zatvora umjesto 5), a ako K2 bude šutio meni je opet bolje da
3
Slika 2: ISP problem rutiranja
ga izdam(dobit ću 1 mjesec umjesto 4). Ali sada primijetimo da ako su oba
kriminalca racionalna, izdat će jedan drugog i obojica će završiti u zatvoru
4 mjeseca. Razlog zbog kojeg ovo i jeste dilema je što je očigledno bolja za
njih varijanta u kojoj oba šute i tako dobijaju po 2 mjeseca zatvora.
Ova situacija zatvoreničke dileme se javlja u dosta situacija, pogledajmo
jednu od njih:
Primjer 1 Posmatrajmo dva ISP-a(Internet Service Provider) koji razmje-

njuju poruke. U rutiranju poruke koja nastaje u jednom ISP čije je odredište
u drugom ISP-u, izbor rutiranja kojeg pravi ISP u kojem nastaje poruka utiče
na opterećenje drugog ISP-a. Sada ćemo vidjeti kako se u ovoj situaciji može
pojaviti zatvorenička dilema koju smo već opisali.
Pretpostavimo da imamo dva ISP-a od kojih svaki ima svoju mrežu i oni
komuniciraju kroz dvije tačke C i S, kao na slici 2. Primijetimo da imamo dva
para si i ti , odredišni čvor - čvor u koji poruka stiže. Pretpostavimo da ISP
1 treba da pošalje poruku od čvora s1 do t1 . ISP1 ima dva načina da pošalje
svoju poruku ISP2(koji će dalje uručiti poruku t1 ). Može da koristi tačku
C i tačku S. Ono što rade tipično ISP-ovi je da minimiziraju svoju putanju
do ISP2(u ovom slučaju do neke od tačaka C i S) ne vodeći računa o tome
koliko će ISP2 trebati da poruku prebaci do odredišta. U ovom slučaju će on
poruku proslijediti do C(jer će ga to koštati 1, za razliku od proslijedivanja
do tačke S, koje bi ga koštalo 2.
4
Ali ono što primijetimo je da je na ovaj način ISP2 ovo koštalo 3, a da
je ISP1 poruku poslao kroz tačku S, ISP 2 bi proslijedivanje poruke koštalo
0(jer je t1 jako blizu S). Odnosno, slično kao u zatvoreničkoj dilemi, ”sebična”
odluka jednog igrača je za njega dobra, ali šteti drugom igraču. Ono što je još
važno je da je ukupna predena udaljenost poruke veća. Da bi ova situacija
bila primjer zatvoreničke dileme, pretpostavimo još da imamo simetričnu
situaciju na drugoj strani. Neka ISP2 sada želi da proslijedi poruku od s2
do t2 . On takoder ima dvije mogućnosti i jasno je da odabirom ”sebične”
opcije njega proslijedivanje poruke košta 1, a ISP1 3. Sada primijetimo da je
ova situacija analogna zatvoreničkoj dilemi, jer oba igrača biraju ”sebične”
strategije i na taj način biraju dosta lošiji rezultat za obojicu od onog koji
su mogli postići ako bi obojica proslijedivali poruku kroz tačku S.
Budući da u stvarnom životu češće imamo situaciju u kojoj učestvuju
više od dva učesnika, posmatrajmo sada poopštenje zatvoreničke dileme na
proizvoljan broj sudionika. Ova igra se javlja u više okolnosti, mi ćemo
predstaviti onu sa zagadenjem zraka. Posmatrajmo sljedeću situaciju:
Primjer 2 U svijetu se nalazi n država. Svaka država ima mogućnost da

kontroliše zagadenje ili da ne kontroliše zagadenje. Pretpostavimo da kon-
trola zagadenja košta svaku državu 3 kredita i da svaka država koja zagaduje
nekontrolisano košta sve države 1 kredit. Pogledajmo sada na koji način je
ova situacija poopštenje Zatvoreničke dileme za proizvoljan broj učesnika.
Pogledajmo ovu situaciju opet iz ugla jedne države. Primijetimo da jenjoj

u svakoj situaciji bolje da zagaduje(nebitno šta ostale države radile, nju će
uvijek kontrola zagadenja koštati za dva više), pa je logično pretpostaviti da
će ta država zagadivati. Ali ovakvo rezonovanje može provesti svaka država,
pa možemo pretpostaviti da će sve države zagadivati.
Ali primijetimo da će u tom slučaju sve države plaćati n kredita, a puno
bolja situacija je kada sve države kontrolišu zagadenje, jer tada svaka država
plaća samo 3 kredita. Zbog tog razloga je ovo poopštenje zatvoreničke dileme
za n igrača.
U igrama koje smo dosad posmatrali smo uvijek imali situaciju da svaki
igrač ima jedinstvenu ”sebičnu” strategiju, neovisno od toga šta ostali radili
njemu je bolje da igra tu strategiju. Sada ćemo posmatrati igru u kojoj
”sebična” strategija jednog igrača ovisi od toga šta igraju ostali igrači.
5
Primjer 3 Pretpostavimo da n igrača želi da pošalje informaciju kroz ka-
nal maksimalnog kapaciteta 1. Svaki igrač ima beskonačno mnogo strategija,
igrač i može da pošalje xi jedinica za bilo koje xi izmedu 0 i 1. Pretposta-
vimo da svaki igrač želi da koristi što više kanala, ali i to da propusni opseg
kanala opada kako raste iskorištenost kanala.
Pn Igrač i koji pošalje xi jedinica
informacija dobija vrijednost 0 ako je i=1 xi veće od 1(možemo reći Pnda in-
formacija ne prode kroz kanal). U suprotnom igrač dobija xi (1 − j=1 xj )
kanala. Primijetimo da igrač povećavanjem ukupnog korištenja kanala os-
talih igrača gubi vrijednost kanala koju dobija, dok povećavanjem jedinica
koje pošalje kroz kanal u zavisnosti od vrijednosti ostalih xk jedinica se može
povećati i smanjiti vrijednost koju će dobiti igrač i.
Da bi našli optimalnu ”sebičnu”

P strategiju igrača i fiksirajmo strategije
ostalih igrača - neka je t = j!=i xj . Ako igrač i pošalje x jedinica dobit
će vrijednost x(1 − t − x). Ono što trebamo sad odrediti je maksimum ove
funkcije za x izmedu 0 i 1. Primijetimo da je prvi izvod ove funkcije jednak
1 − t − 2x, pozitivan za x < (1 − t)/2 i negativan za x < (1 − t)/2. Ovo
znači da funkcija raste do (1 − t)/2 i opada od (1 − t)/2, odnosno maksimum
funkcije se dostiže u tački (1−t)/2. Skup strategija je stabilan ako svaki igrač
igra svoju optimalnu sebičnu strategiju, čak iako su mu poznate strategije
ostalih igrača. U ovom stabilnom stanju sigurno nijedan od igrača sam ne bi
mijenjao strategiju.
Sada,
P pretpostavimo da smo u stabilnom stanju, to znači da vrijedi xi =
(1 − j!=i xj )/2 za svako
P i. Pomnožimo sa 2 i oduzmemo xi na obe strane
i dobijamo xi = 1 − j xj . Pošto ovo vrijedi za svako i, a desna strana ne
ovisi od i, dobijamo da su svi xi jednaki. Ali tada, xi = 1 − nxi odnosno
xi = 1/(n + 1) za svako i. Tada svaki igrač dobija 1/(n + 1)2 i primijetimo
da je ukupna iskorištenost kabla jednaka n/(n + 1)2 što je približno 1/n.
S druge strane, ako P igrači ne koriste optimalne ”sebične” strategije i ko-
n
riste kanal tako da je i=1 xi = 1/2(neovisno od toga koji koliko kanala
dobija) iskorištenost kanala postaje 1/4, što je otprilike n/4 puta više.
Primijetimo da se u ovoj igri dešava nešto slično kao u igri zagadenja.
Zajednički resurs svi igrači sebično iskorištavaju maksimalno i tako preop-
terećuju taj resurs do toga da svima postaje puno gore nego da su svi manje
koristili resurs.
6
Slika 3: Igra koordinacije
2.1.2 Igre koordinacije

Za razliku od dosadašnjih primjera, kod igara koordinacije imamo više ”sta-
bilnih” dogadaja. Najpoznatiji primjer ovakve igre je takozvana bitka spo-
lova.
Primjer 4 Muž i žena odlučuju šta će raditi u subotu naveče, oboje biraju
izmedu dvije opcije: odlazak na fudbalsku utakmicu i odlazak na balet. Muž
želi da ide na utakmicu, žena želi da ide na balet, ali oboje više od toga žele
da budu zajedno. Možemo reći da ako oboje odu na fudbal muž će dobiti
6 kredita, a žena 5 kredita. Ako ipak bude onako kako bi žena željela muž
dobija 5, a žena 6 kredita. Ako muž ode na fudbal, a žena na balet dobijaju
po 2 kredita. Ako eventualno muž ode na balet, a žena na fudbal dobijaju
po 1 kredit(kreditom ovdje podrazumijevamo količinu sreće igrača). Ovo je
predstavljeno tabelom na slici 3.
Jasno je da dva stanja u kojima oni idu na različita mjesta nisu stabilna
jer u oba slučaja bi oboje htjeli promijeniti odluku(jer im to donosi više
kredita). S druge strane oba stanja u kojima oni biraju isto su stabilna, jer
nijedno promjenom svoje odluke(pretpostavljajući da partner neće mijenjati
odluku) ne može povećati broj dobijenih kredita.
7
Slika 4: Igra rutiranja
Ova igra se takoder pojavljuje u raznim situacijama. Ovdje ćemo dati

primjer igre koordinacije koja se javlja u kontekstu rutiranja. U tom kon-
tekstu će za razliku od bitke spolova biti povoljno da igrači izaberu različite
putanje.
Primjer 5 Pretpostavimo da imamo dvije poruke koje se nalaze u čvoru O

i trebaju biti rutirane dalje u ostatak mreže kao što je prikazano na slici 4.
Pretpostavimo da je O povezan sa ostatkom mreže sa dvije tačke, tačkom A
i tačkom B, pri čemu je tačka A malo bliža čvoru O od tačke B,. Obe tačke
se lahko zaguše, pa ako obe poruke odu u jednu tačku to prouzrokuje dodatno
kašnjenje. Ono što žele oba igrača u ovoj igri je da pošalju poruku preko bliže
tačke, ali ono što još više žele je da pošalju dvjema različitim tačkama, da ne
bi bilo dodatnog kašnjenja. Ovu situaciju modeliramo igrom čija su moguća
kašnjenja prikazana na Slici 4 u tabeli.
2.1.3 Slaganje novčića

U dosadašnjim igrama je uvijek postojalo stabilno stanje, takvo da ako
se dogodi to stanje, nijedan od igrača ne želi da promijeni strategiju, jer
promjenom strategije može samo izgubiti. Takvo stanje pak, ne postoji u
svakoj igri i sljedeći primjer igre će to demonstrirati.
8
Slika 5: Igra slaganja novčića
Primjer 6 Dva igrača imaju po novčić i svaki od njih istovremeno bira

izmedu dvije strategije: Pismo i Glava. Ako oni oboje izaberu isto, pobjeduje
jedan igrač, a ako odaberu različito, pobjeduje drugi igrač.Možemo reći da
ako izaberu isto igrač 1 dobija jedan kredit, a igrač 2 gubi jedan kredit, u
suprotnom igrač 2 dobija jedan kredit a igrač 1 gubi jedan kredit. Tabela ove
igre je prikazana na slici 5.
Primijetimo da u svakom ishodu postoji igrač koji može promijeniti svoju

strategiju i tako povećati svoju zaradu(ako su odigrali oba Pismo ili oba
Glavu igrač 2 bi promijenio strategiju, u suprotnom igrač 1). Takoder, pri-
mijetimo da je dovoljno da igrač predvidi strategiju protivnika da bi ga po-
bijedio. Zbog toga je najbolji pristup igrača da randomizuje svoju strategiju
i da tako onemogući da drugi igrač otkrije njegovu strategiju.
9
2.2 Definisanje igara
Dosad smo pričali o primjerima nekih klasičnih igara. Spominjali smo stra-
tegije, troškove i kredite, ali sad ćemo o tome govoriti formalnije. Tačnije,
definisat ćemo simultane jednopotezne igre, igre u kojima svaki igrač ima
skup mogućih strategija koje može igrati i bira jednu od tih strategija. U
zavisnosti od toga koju strategiju je odigrao svaki od igrača, igrači dobivaju
svoje nagrade i troškove.
Formalno, igra se sastoji od skupa od n igrača, {1, 2, 3, ..., n}. Svaki igrač
i ima skup mogućih strategija Si . Da bi igrao, svaki igrač bira strategiju si
iz Si .Označavat ćemo sa s = (s1 , s2 , ..., sn ) vektor strategija odabranih od
igrača i sa S =×i Si skup svih mogućih načina na koje igrači mogu izabrati
strategije.
Vektor strategija s iz S odabranih od igrača jednoznačno odreduje na-
gradu(odnosno trošak) svakog od igrača na kraju igre. Generalno će svaki
od igrača imati različitu nagradu(odnosno trošak). Za svakog igrača i de-
finišemo funkciju ui = ui (s) koja uzima vrijednosti iz skupa S i koja daje
vrijednosti iz skupa realnih brojeva. Primijetimo da je moguće da ova funk-
cija prima pozitivne vrijednosti(kada igrač i dobija nagradu), kao i da je
moguće da prima negativne vrijednosti(kada igrač i ima kaznu) i naravno
funkcija može davati i nulu(kada igrač i nema ni nagradu ni kaznu). Ovu
funkciju ćemo u daljem radu zvati funkcija utilitarnosti ili funkcija korisnosti.
Objasnimo sada na primjeru igre Slaganja novčića definisane pojmove.
U ovoj igri imamo dva igrača, igrač 1 i igrač 2. Skup mogućih strategija
S1 igrača 1 je {H, T }(H-Pismo i T-Glava). Primijetimo da u ovoj igri oba
igrača imaju isti skup strategija. Ako igrač 1 odabere Pismo, a igrač 2
Glavu tada je vektor strategija (H, T ) i igrač 1 dobija u1 ((H, T )) = −1, a
igrač 2 u2 ((H, T )) = 1. Skup svih mogućih strategija igrača sadrži 4 člana,
(H, H),(H, T ),(T, H) i (T, T ).
Ono što smo mogli uočiti kod zatvoreničke dileme i sličnih igara(igra
kontrole zagadenja) je da je svaki igrač imao dominantnu strategiju, što znači
da je za svakog igrača postojala strategija bolja od bilo koje druge neovisno
od toga koje strategije ostali igrači koristili. Ovo zadovoljava jako mali broj
igara. Ako za igru vrijedi da svaki igrač ima dominantnu strategiju, kažemo
da ima rješenje dominantnih strategija.
Formalno rečeno, za vektor strategija s iz S sa si označavamo strategiju
igrača i, neka je s−i (n − 1)-dimenzionalni vektor strategija igranih od ostalih
igrača. Funkciju utilitarnosti sada možemo napisati i kao ui = ui (si , s−i )
10
i ovu oznaku ćemo koristiti kada je to prigodnije. Koristeći ovu notaciju
možemo reći da je vektor strategija s iz S rješenje dominantnih strategija
ako za svakog igrača i, i za svaki alternativni vektor strategija s′ vrijedi
ui (si , s’−i )≥ui (s’i , s’−i )(svaki igrač ima dominantnu strategiju).
Ono što je važno je da primijetimo da rješenje dominantnih strategija
ne mora biti optimalno ni za jednog igrača(ustvari u zatvoreničkoj dilemi i
sličnim igrama i nije), iako na prvi pogled nam izgeda da je optimalno za sve
igrače.
Sada posmatrajmo igre kod kojih ne postoji rješenje dominantnih strate-
gija. To znači da postoji barem jedan igrač koji nema dominantnu strategiju.
Pokušavajući predvidjeti najvjerovatniji ishod ovih igara dolazimo do defi-
nicije Nešovog ekvilibrijuma, odnosno Nešove ravnoteže. Nešov ekvilibrijum
neke igre je ustvari stabilno stanje igre o kojem smo govorili u igri Bitka
polova. Stanje igre je Nešov ekvilibrijum te igre ako nijedan igrač ne može
promjenom svoje strategije poboljšati svoju nagradu(smanjiti trošak) pret-
postavljajući da će ostali igrači igrati isto.
Formalno rečeno, vektor strategija s iz S je Nešov ekvilibrijum igre ako za
sve igrače i i za sve alternativne strategije s’i vrijedi ui (si , s−i ) >=ui (s’i , s−i ).
Drugim riječima, ako igrač i promijeni strategiju si u s’i , pretpostavljajući
da će ostali igrači igrati isto, vrijednost koju daje njegova funkcija korisnosti
se može samo smanjiti. Zbog toga smo dosad spominjali Nešov ekvilibrijum
u kontekstu stabilnih stanja, jer primijetimo da jednom kada igrači dodu u
Nešov ekvilibrijum, nijednom od njih se ne isplati da mijenja svoju strategiju.
Sada primijetimo da je Nešov ekvilibrijum proširenje pojma rješenja do-
minantnih strategija, jer ako je neko stanje rješenje dominantnih strategija,
to stanje je i Nešov ekvilibrijum. Ako je to rješenje ustvari rješenje strik-
tno dominantnih strategija(mijenjajući svoju strategiju igrač uvijek smanjuje
svoju nagradu), Nešov ekvilibrijum je jedinstven. To u generalnom ne vrijedi,
vidjeli smo na primjeru igre Bitka spolova kada imamo 2 Nešova ekvilibri-
juma(naravno, može ih biti i više).
Sada možemo da se zapitamo, da li Nešov ekvilibrijum uvijek postoji?
Odgovor je negativan i to vidimo na primjeru igre Slaganja novčića(već smo
konstatovali da ova igra nema stabilno stanje). Ovo nas dovodi do proširenja
definicije Nešovog ekvilibrijuma, Nešov ekvilibrijuma za mješovite strategije.
Već smo spominjali da je najbolja strategija igrača u igri Slaganja novčića
bila da randomizuje svoju strategiju kako ga drugi igrač ne bi mogao pre-
dvidjeti. Tačnije najbolja moguća strategija je da igra oba poteza sa vjero-
vatnoćom 1/2(ako bi neki potez igrao više to bi drugi igrač mogao iskoris-
11
titi). Ako bi neki od igrača igrao tu strategiju primijetimo da će drugi igrač
imati očekivanu dobit 0 nebitno kako igrao. I sada primijetimo da u slučaju
da oba igrača igraju ovu strategiju nijedan promjenom svoje strategije ne
može povećati nagradu. Strategije koje igraju igrači u ovom slučaju zovemo
mješovite strategije.
Mješovita strategija nekog igrača je, formalno rečeno, distribucija vjero-
vatnoće na skupu njegovih strategija. Vektor mješovitih strategija je u ovom
slučaju distribucija vjerovatnoće na skupu vektora strategija S. Za kraj
uvoda u Teoriju igara navodimo jedan od najfascinantnijih rezultata teorije
igara - Nešova teorema.
Teorema 1 Bilo koja igra sa konačnim skupom igrača i sa konačnim izborom

strategija za svakog igrača ima Neš ekvilibrijum za mješovite strategije.
12
3 Algoritamski dizajn mehanizama
Kao što smo već naveli, algoritamski dizajn mehanizama je nova oblast,
oblast čiji su temelji postavljeni 1999. godine u radu Noam Nisana i Amir
Ronena. Ova oblast proučava probleme optimizacije u kojima neke informa-
cije poput količine ili troška nekog resursa dizajneru algoritma nisu poznate i
moramo ih na neki način saznati od ”sebičnih” agenata, agenata koji gledaju
samo svoju korist.
Klasični primjeri su primjeri aukcija u kojima nam je nepoznata želja
onih koji kupuju proizvod(koliko bi ga najviše platili) i u kojima je problem
optimiziranja rasporediti proizvode koje prodajemo da bi maksimizirali pri-
hode. ”Mehanizam” je protokol po kojem radimo sa učesnicima(”sebičnim”
agentima) i koji na kraju rješava problem optimiziranja.
U nastavku ćemo se upoznati sa najpoznatijim protokolom za aukcije sa
jednim proizvodom.
3.1 Wickrey-ova aukcija za jedan proizvod

Posmatrajmo proizvod koji je na aukciji u kojoj je uključeno n igrača. Svaki
igrač i ima svoju cijenu wi - maksimalan iznos koji bi platio za proizvod.
Naravno, on želi da plati što manje. Iznos wi svakog igrača i je privatan, ni
prodavac, a ni ostali kupci ga ne znaju. Njegova funkcija korisnosti ui iznosi
0 ako izgubi aukciju(ako ga prodavac ne izabere), a ako osvoji aukciju i plati
cijenu p za proizvod, njegova funkcija korisnosti je jednaka wi − p.
Mi želimo da dizajniramo mehanizam tako da proizvod bude dodijeljen
igraču koji ga najviše vrednuje(igraču sa maksimalnim wi ). Problem je u
tome što mi ne znamo njihove vrijednosti wi . Želimo da onemogućimo
strateško manipulisanje igrom. Ne smijemo dozvoliti da neki igrač može
strateški ponuditi vrijednost različitu od njegove stvarne cijene wi i na taj
način sebi donijeti korist veću od one koju bi dobio ako bi rekao svoju stvarnu
cijenu. Ono na što mi možemo uticati u aukciji je to ko će biti pobjednik i
vrijednost koju pobjednik mora platiti. Prirodno je da pobjednik bude osoba
koja je najviše ponudila. Sada ćemo vidjeti dvije prirodne ideje o cijeni koju
pobjednik mora platiti i objasnit ćemo zašto one nisu dobre:
• Bez plaćanja: Ako bi pobjednik bio osloboden plaćanja, svaki igrač

bi ponudio puno više od svoje stvarne cijene i pobjednik ne bi ovisio
od toga koliko igrači cijene proizvod.
13
• Plati svoju ponudu: Druga prirodna ideja je da jednostavno po-
bjednik plati onoliko koliko je ponudio. Ovaj mehanizam bi takoder
bio podoban za manipulaciju. Naime, problem je što pobjednik u tom
slučaju, ako je ponudio svoju stvarnu cijenu, dobija nagradu 0. Jasno je
da mu je logičnije da ponudi neki broj koji je manji, jer tako povećava
mogućnost da zaradi(a i dalje ni na koji način ne može izgubiti). Nije
očigledno koliko bi igrač trebao da ponudi. Kakogod, ne isplati mu se
da nudi svoju stvarnu cijenu.
Nakon što smo vidjeli dvije prirodne ideje koje nisu zadovoljile, prelazimo
na jednu koja iznenadujuće dobro rješava naš problem.
Definicija 1 Wickrey-ova aukcija: Neka je pobjednik igrač koji najviše

ponudi i neka on plaća najveću cijenu koju su ponudili ostali igrači(drugu
najveću cijenu ukupno).
Pod ovim uslovima, nemoguće je umjesto stvarne cijene ponuditi neku

drugu cijenu i na taj način povećati svoju nagradu. To nam govori sljedeća
propozicija:
Propozicija 1 Ako igrač i želi da maksimizira svoju nagradu u Wickrey-ovoj

aukciji, mora ponuditi svoju stvarnu cijenu wi .
Dokaz:
Pretpostavimo da će igrač i pobijediti ako kaže svoju stvarnu cijenu wi .
Ako bi ponudio bilo koju vrijednost veću od druge najveće ponude, njegova
nagrada se ne bi promijenila(zaradio bi wi −p, gdje je p druga najveća ponuda
na aukciji), a ako bi ponudio manje od nje tada bi dobio 0 što je još manje.
Pretpostavimo sada da će igrač izgubiti ako kaže svoju stvarnu cijenu. Tada,
ako ponudi bilo koju vrijednost manju od najveće ponude, dobit će 0, a
ako kaže vrijednost veću od najveće ponude osvojit će aukciju, ali će dobiti
nagradu manju ili jednaku 0, budući da je tada platio više od svoje stvarne
cijene. Zaključujemo da igrač ni u kojem slučaju ne može poboljšati svoju
nagradu tako što ponudi cijenu različitu od svoje stvarne cijene wi .
Da bi mogli zaključiti da smo ovim protokolom aukcije dobili ono što
želimo, da svi igrači kažu svoju stvarnu cijenu proizvoda, moramo dodati
neke pretpostavke. Inače, nije moguće predvidjeti ishod neke igre bez pret-
postavki o ponašanju igrača. Ono što je dobro za ovu aukciju je da ne
moramo pretpostavljati da igrači igraju racionalno(da u svakom momentu
14
biraju ono što je bolje za njih). Dovoljno je pretpostaviti da će igrač ako
ima dominantnu strategiju uvijek izabrati nju. Naime, to znači da ako igrač
ima strategiju koja je bolja od svih ostalih kako god ostali igrači igrali, on će
koristiti tu strategiju.
Navedimo nekoliko važnih osobina Wickrey-ove aukcije:
• Već smo rekli da je nudenje stvarne cijene dominantna strategija u

Wickrey-ovoj aukciji. Ovome dodajmo činjenicu da u Wickrey-ovoj
aukciji igrač koji kaže svoju stvarnu cijenu mora dobiti nenegativnu
funkciju korisnosti.
• Druga osobina je da maksimizira ukupni prihod svih Pnigrača ako igrači

ponude stvarnu cijenu. Ukupni prihod je jednak i=1 vi xi gdje je xi
jednak 1 kod onog igrača koji osvoji aukciju i jednak 0 kod svih ostalih.
• Ono što još vrijedi je da možemo završiti aukciju u polinomijalnom

vremenu(ustvari, aukcija se završava u linearnom vremenu).
U nastavku ćemo govoriti o aukcijama koje odvijaju na Internetu, tačnije

na stranicama za pretraživanje
3.2 Aukcije za sponzorisanu pretragu

Stranica koja nam izbaci rezultate Web pretraživanja izbacuje dvije različite
vrste rezultata. Jedna vrsta rezultata je bazirana na riječima koje smo uni-
jeli, koriste se algoritmi da bi odredili stranice koje su najpodobnije za ono
što smo tražili. Druga vrsta rezultata su sponzorisani linkovi, prikazani sa
desne strane na Slici 6, koje plaćaju oni koji žele reklamu Web pretraživaču.
Svaki put kada mi pokrenemo pretragu, u isto vrijeme se održava aukcija
kojom se odlučuje koji od oglašivačkih linkova će biti prikazan i na kojem
mjestu. Nevjerovatno je koliko su aukcije za sponzorisanu pretragu utjecale
na ekonomiju Interneta. Nevjerovatna informacija je da je kompanija Google
2006. godine 98 posto svojih prihoda ostvarila na sponzorisanim aukcijama.
Iako se online reklamiranje danas realizuje na jako puno različitih načina,
aukcije za sponzorisanu pretragu još uvijek donose milijarde dolara prihoda.
U nastavku ćemo pričati o pojednostavljenoj verziji modela aukcija za
sponzorisanu pretragu.
15
Slika 6: Google pretraga
3.2.1 Jednostavni model aukcija za sponzorisanu pretragu

Proizvodi koji se prodaju su ustvari k ”mjesta” za sponzorisane linkove
na stranici koja sadrži rezultate Web pretraživanja. Igrači na aukciji su
oglašivači koji imaju odredenu ponudu za ključnu riječ koja je unesena. Za
različite ključne riječi su zainteresovani različiti oglašivači(najčešće kompa-
nije). Ove aukcije su dosta komplikovanije nego aukcije za jedan proizvod. S
jedne strane, imamo više proizvoda koji se prodaju. S druge strane, ono što
je još važnije, proizvodi nisu identični, ”mjesta” na stranici su vrijednija ako
su bliže vrhu(budući da Web stranicu korisnici pregledavaju od vrha).
Razliku medu proizvodima(”mjestima” na stranici) predstavljamo pomoću
vrijednosti ai za svako i, vjerovatnoće da će korisnik usluge pretraživača klik-
nuti na link koji se nalazi na tom mjestu. Pretpostavimo da je a1 ≥a2 ≥...≥an (već
smo rekli da su vrijednija mjesta koja su bliže vrhu stranice). Pretpostavimo
da na vjerovatnoću klikanja korisnika ne utiče koliki rejting ima oglašivač.
Dodajmo još da je moguće i bez ove pretpostavke, ali olakšava dalji rad.
Pretpostavimo da svaki oglašivač ima privatni iznos vi kojim on vrednuje
”klik” na njegovu stranicu. Funkcija korisnosti igrača i je onda vi aj (ako je
dobio ”mjesto” sa rednim brojem j ).
Ono što nas interesuje je pitanje da li postoji aukcija dobra kao Wickrey-
16
ova aukcija u ovom slučaju. Ta aukcija bi trebala zadovoljavati osobine:
1. Prvo što treba da vrijedi je da je ponuda stvarne cijene svih oglašivača

dominantna strategija i da svi oglašivači ako ponude stvarnu cijenu u
svakom slučaju imaju nenegativne funkcije korisnosti.
2. Drugo je da podjela ”mjesta” oglašivačima mora maksimizirati Pukupni

prihod svih oglašivača. Ukupni prihod možemo prikazati kao ni=1 vi xi
pri čemu je xi jednak aj , ako je oglašivač i dobio j -to mjesto od vrha
stranice, ili jednak 0 ako oglašivač i nije dobio nijedno mjesto. Ono što
treba napomenuti je da svako mjesto dobija tačno jedan oglašivač i da
svaki oglašivač dobija najviše jedno mjesto.
3. Ono što još treba da vrijedi je da možemo rasporediti ”mjesta” u po-

linomijalnom vremenu budući da se nevjerovatan broj aukcija svake
sekunde mora izvršavati.
Teškoća dizajniranja mehanizama leži u tome što moramo da donesemo

dvije odluke, ko će šta osvojiti i ko će koliko platiti. Vidjeli smo i u aukcijama
za jedan proizvod da nije dovoljno odlučiti da će proizvod dobiti onaj koji
najviše ponudi, da bi spriječili manipulaciju aukcijom morali smo na pametan
način odrediti i koliko će pobjednik dobiti.
Srećom, u mnogim primjenama, uključujući i ovu(aukcije za sponzorisanu
pretragu) je moguće ove dvije odluke razdvojiti u dva koraka i završiti jednu
po jednu.
Korak 1: Ako pretpostavimo da su svi ponudili stvarnu cijenu, na koji
način trebamo rasporediti ”mjesta” da bi vrijedili uslovi 2 i 3.
Korak 2: Sa datim odgovorima iz koraka 1, na koji način moramo pos-
taviti prodajne cijene da bi osobina 1. vrijedila.
Primijetimo da za Korak 1 imamo prirodnu greedy ideju, rasporedimo
k -to najviše(najbolje) ”mjesto” k -tom najvećem ponudivaču(onom čija je
ponuda bila k -ta najveća). S ovim pristupom će biti ispunjeni uslovi 2 i 3,
očigledno ovaj algoritam radi u linearnom vremenu(samo k puta odaberemo
najveći element i izbacimo ga iz niza). S druge strane lagano se dokaže da
na ovaj način maksimiziramo ukupan prihod svih takmičara, ako igrači nude
stvarne cijene.
Sada prelazimo na teži korak, kako postaviti prodajne cijene da bi svim
igračima nudenje stvarne cijene bila dominantna strategija?. Pokušajmo tako
što ćemo poopštiti Wickrey-ovu aukciju za jedna proizvod.
17
Neka su ponude oglašivača bile b1 ≥b2 ≥...≥bn . Već smo rekli da ćemo
oglašivaču koji je ponudio bi davati i-to mjesto od vrha stranice. Neka on za
to mjesto plati bi+1 , ponudu koju je ponudio oglašivač koji je bio odmah iza
njega.
Budući da je ova aukcija generalizacija Wickrey-ove aukcije, za očekivati
je bilo da dobijemo osobine koje nam trebaju. Ova aukcija zaista ima neke
osobine(već smo vidjeli da zadovoljava osobine 2 i 3 Wickrey-ove aukcije), ali
u slučaju ove aukcije nudenje stvarne cijene igračima i nije uvijek dominantna
strategija. Pogledajmo to na sljedećem primjeru:
Pretpostavimo da k od n oglašivača ima otprilike istu stvarnu procjenu
”mjesta” dok ostalih n-k igrača puno manje vrednuje ”mjesta”. Sada pret-
postavimo da su svi ponudili svoju stvarnu cijenu. Tada će igrač koji osvoji
k-to mjesto platiti puno manje od ostalih igrača jer on plaća bk+1 . Sada je
jasno da će svaki od igrača prije željeti da dobije k-to ”mjesto” ako će platiti
puno manje, nego neka od prvih k-1 mjesta, pošto bi tada platio otprilike
svoju stvarnu cijenu. Konkretno možemo staviti vi = M za i≤k i vi = m za
i > k, pri čemu je M neki veliki broj, a m neki mali broj. Sada primijetimo
da je puno bolje za nekog od k igrača koji cijene ”mjesta” više da ponudi
neki broj manji od M, jer ako svi ostali ponude svoju stvarnu cijenu, on će
za k-to mjesto platiti m, što je puno bolje nego za neka od prvih k-1 mjesta
platiti M i ovo vrijedi neovisno od n,k i vrijednosti a1 , a2 , ..., an za dovoljno
veliko M(ili dovoljno malo m).
Iz ovog zaključujemo da igraču koji igra ovu aukciju nije dominantna
strategija da ponudi svoju stvarnu cijenu, jer smo naveli primjer kada je
igraču puno bolje da ponudi neku drugu cijenu. Uprkos ovome, ova aukcija
se koristi na većini pretraživača. Već smo naveli da ova aukcija ima neke fine
osobine i ne bi bilo čudno to što je pretraživači koriste da ne postoji aukcija
kod koje su zadovoljene sve tri osobine Wickrey-ove aukcije. U ovom radu
mi je nećemo navoditi, samo ćemo kazati da je jedinstvena.
18
4 Zaključak
Prvo poglavlje ovog rada upućuje čitatelja u svijet teorije igara i prikazuje
kako se situacije koje dolaze u kontekstu Interneta mogu modelirati nekim
klasičnim igrama. Cilj prvog dijela rada nije samo da predstavi osnove teorije
igara, nego i da predstavi čitatelju drugačiji pogled na neke životne situacije.
Drugo poglavlje rada bi trebalo da upozna čitatelja sa oblasti algoritam-
ske teorije igara, relativno nove oblasti. Kako je algoritamska teorija igara
značajna oblast u modernoj nauci i predmet aktivnih istraživanja, vrijedi se
upoznati sa osnovnim konceptima ove discipline.
5 Literatura
[1] Noam Nisan, Tim Roughgarden, Eva Tardos, Vijay V. Vazirani: Algorit-
hmic Game Theory, 2007
[2] Joseph Y. Halpern: Computer Science and Game Theory: A Brief
Survey, 2007
[3] Tim Roughgarden: Algorithmic Game Theory, 2009
19

Algoritamska Teorija Igara

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Algoritamska Teorija Igara

Uploaded by

Copyright:

Available Formats

PMF Sarajevo

Algoritamska teorija igara

2 Osnove teorije igara

2.1.1 Zatvorenička dilema

Primjer 1 Posmatrajmo dva ISP-a(Internet Service Provider) koji razmje-

Primjer 2 U svijetu se nalazi n država. Svaka država ima mogućnost da

Pogledajmo ovu situaciju opet iz ugla jedne države. Primijetimo da jenjoj

Da bi našli optimalnu ”sebičnu”

2.1.2 Igre koordinacije

Ova igra se takoder pojavljuje u raznim situacijama. Ovdje ćemo dati

Primjer 5 Pretpostavimo da imamo dvije poruke koje se nalaze u čvoru O

2.1.3 Slaganje novčića

Primjer 6 Dva igrača imaju po novčić i svaki od njih istovremeno bira

Primijetimo da u svakom ishodu postoji igrač koji može promijeniti svoju

Teorema 1 Bilo koja igra sa konačnim skupom igrača i sa konačnim izborom

3.1 Wickrey-ova aukcija za jedan proizvod

• Bez plaćanja: Ako bi pobjednik bio osloboden plaćanja, svaki igrač

Definicija 1 Wickrey-ova aukcija: Neka je pobjednik igrač koji najviše

Pod ovim uslovima, nemoguće je umjesto stvarne cijene ponuditi neku

Propozicija 1 Ako igrač i želi da maksimizira svoju nagradu u Wickrey-ovoj

• Već smo rekli da je nudenje stvarne cijene dominantna strategija u

• Druga osobina je da maksimizira ukupni prihod svih Pnigrača ako igrači

• Ono što još vrijedi je da možemo završiti aukciju u polinomijalnom

U nastavku ćemo govoriti o aukcijama koje odvijaju na Internetu, tačnije

3.2 Aukcije za sponzorisanu pretragu

3.2.1 Jednostavni model aukcija za sponzorisanu pretragu

1. Prvo što treba da vrijedi je da je ponuda stvarne cijene svih oglašivača

2. Drugo je da podjela ”mjesta” oglašivačima mora maksimizirati Pukupni

3. Ono što još treba da vrijedi je da možemo rasporediti ”mjesta” u po-

Teškoća dizajniranja mehanizama leži u tome što moramo da donesemo

You might also like