You are on page 1of 20

PMF Sarajevo

Odsjek za matematiku
Odabrana poglavlja kompjuterskih nauka

Algoritamska teorija igara

Autor:
Harun Hindija

5. decembar 2014.
Sažetak
U ovom radu je dat kratak uvod u teoriju igara sa primjenom
na neke oblasti kompjuterske nauke, posebno na modeliranje nekih
situacija koje dolaze u kontekstu interneta. Nakon toga su predeni
neki aspekti Algoritamske teorije igara.

1 Uvod
Kako se drugi svjetski rat približavao kraju, von Neumann, tada nedvojbeno
najistaknutiji matematičar svijeta, se bavio dvjema naučnim disciplinama
koje će oblikovati ostatak dvadesetog stoljeća: Teorijom igara i algoritmima.
Godine 1944. sa Oskarom Morgensternom objavljuje knjigu Games and Eco-
nomics Behavior i tako nastaje Teorija igara, disciplina koja je našla veliku
primjenu u ekonomiji. U 1952. godini objavljuje naučni rad u kom se prvi
put spominje polinomijalni algoritam kao posebna prednost. Rješivost pro-
blema u polinomijalnom vremenu postaje jedan od zadataka koji još uvijek
predstavlja izazov svim naučnicima koji se bave algoritmima(došlo je vrijeme
kada efikasan i rješiv u polinomijalnom vremenu postaju skoro pa nerazdvojni
pojmovi).
Da li je von Neumann mogao predvidjeti da će se dvije potpuno različite
discipline koje je zasnovao pola vijeka kasnije spojiti. Amir Ronen i Nisan
Noam 1999. godine prvi put na Simpoziju o teoriji izračunljivosti STOC ’99
govore o dizajniranju algoritama za sebične korisnike.Oni kažu:
“Posmatrajmo algoritamske probleme u distribuiranom sistemu, gdje ne
možemo pretpostaviti da učesnici prate algoritam, gdje učesnike zanima samo
njihov interes.Budući da su ti učesnici u mogućnosti da manipuliraju i izmi-
jenjuju algoritam, dizajner algoritma mora osigurati da će agenti(učesnici)
najbolje zadovoljiti svoje interese ako slijede algoritam.”
Ono što von Neumann vjerovatno nije mogao pretpostaviti je nevjero-
vatna ekspanzija interneta. Internet je totalno promijenio ekonomiju, pro-
mijenio, ubrzao i stvorio dotada nezamislive forme tržišta. Algoritmi su
postali prirodno okruženje i platforma strateškog donošenja odluka. S druge
strane, internet je prvo kompjutersko djelo koje nije nastalo od jednog iz-
vora, već od strateške interakcije mnogih strana. Naučnici koji su se bavili
kompjuterskom naukom su po prvi put bili suočeni sa istim onim osjećajem
neizvjesnosti, straha i zbunjenosti sa kojim su već odavno ekonomisti posma-
trali tržište. Naravno, okrenuli su se teoriji igara za inspiraciju. Fascinantni

1
spoj ideja iz obe discipline - teorije igara i algoritama - je bio spreman da
se iskoristi da bi se osvijetlile misterije interneta. Nazvan je Algoritamska
teorija igara.

2
Slika 1: Zatvorenička dilema

2 Osnove teorije igara


2.1 Primjeri klasičnih igara
U uvodu smo spomenuli kako teoriju igara možemo koristiti da modeliramo
neke situacije koje se dešavaju na Internetu. Počet ćemo izlaganje o teoriji
igara sa nekim klasičnim igrama i pokazat ćemo kako se one mogu pojaviti
u kontekstu Interneta.

2.1.1 Zatvorenička dilema


Nemoguće je započeti izlaganje o teoriji igara, a ne spomenuti igru koja je
najpoznatija i najviše izučavana. Zamislimo sljedeću situaciju:
Pred dvojicu privedenih kriminalaca koji su bili saučesnici u izvršenju
krivičnog djela se u odvojenim prostorijama stavlja sljedeći izbor, svaki od
njih može da izda drugog ili da šuti. Ako jedan od njih dvojice odluči da izda
drugog, a drugi odluči da šuti, tada će se taj drugi kazniti kaznom zatvora
od 5 mjeseci, a prvi kaznom zatvora od 1 mjesec. Ako obojica izdaju jedan
drugog, čeka ih po 4 mjeseca zatvora. Ako ipak obojica odluče da šute, čeka
ih po 2 mjeseca zatvora. Ovo je predstavljeno tabelom na slici 1.
Iako nam se na prvi pogled čini da kriminalci trebaju da šute, ako posma-
tramo jednog od njih, neka je on K1(drugi je K2), K1 može izvršiti sljedeće
rezonovanje: ako K2 mene izda tada ću ja bolje proći ako izdam njega(dobit
ću 4 mjeseci zatvora umjesto 5), a ako K2 bude šutio meni je opet bolje da

3
Slika 2: ISP problem rutiranja

ga izdam(dobit ću 1 mjesec umjesto 4). Ali sada primijetimo da ako su oba
kriminalca racionalna, izdat će jedan drugog i obojica će završiti u zatvoru
4 mjeseca. Razlog zbog kojeg ovo i jeste dilema je što je očigledno bolja za
njih varijanta u kojoj oba šute i tako dobijaju po 2 mjeseca zatvora.
Ova situacija zatvoreničke dileme se javlja u dosta situacija, pogledajmo
jednu od njih:

Primjer 1 Posmatrajmo dva ISP-a(Internet Service Provider) koji razmje-


njuju poruke. U rutiranju poruke koja nastaje u jednom ISP čije je odredište
u drugom ISP-u, izbor rutiranja kojeg pravi ISP u kojem nastaje poruka utiče
na opterećenje drugog ISP-a. Sada ćemo vidjeti kako se u ovoj situaciji može
pojaviti zatvorenička dilema koju smo već opisali.

Pretpostavimo da imamo dva ISP-a od kojih svaki ima svoju mrežu i oni
komuniciraju kroz dvije tačke C i S, kao na slici 2. Primijetimo da imamo dva
para si i ti , odredišni čvor - čvor u koji poruka stiže. Pretpostavimo da ISP
1 treba da pošalje poruku od čvora s1 do t1 . ISP1 ima dva načina da pošalje
svoju poruku ISP2(koji će dalje uručiti poruku t1 ). Može da koristi tačku
C i tačku S. Ono što rade tipično ISP-ovi je da minimiziraju svoju putanju
do ISP2(u ovom slučaju do neke od tačaka C i S) ne vodeći računa o tome
koliko će ISP2 trebati da poruku prebaci do odredišta. U ovom slučaju će on
poruku proslijediti do C(jer će ga to koštati 1, za razliku od proslijedivanja
do tačke S, koje bi ga koštalo 2.

4
Ali ono što primijetimo je da je na ovaj način ISP2 ovo koštalo 3, a da
je ISP1 poruku poslao kroz tačku S, ISP 2 bi proslijedivanje poruke koštalo
0(jer je t1 jako blizu S). Odnosno, slično kao u zatvoreničkoj dilemi, ”sebična”
odluka jednog igrača je za njega dobra, ali šteti drugom igraču. Ono što je još
važno je da je ukupna predena udaljenost poruke veća. Da bi ova situacija
bila primjer zatvoreničke dileme, pretpostavimo još da imamo simetričnu
situaciju na drugoj strani. Neka ISP2 sada želi da proslijedi poruku od s2
do t2 . On takoder ima dvije mogućnosti i jasno je da odabirom ”sebične”
opcije njega proslijedivanje poruke košta 1, a ISP1 3. Sada primijetimo da je
ova situacija analogna zatvoreničkoj dilemi, jer oba igrača biraju ”sebične”
strategije i na taj način biraju dosta lošiji rezultat za obojicu od onog koji
su mogli postići ako bi obojica proslijedivali poruku kroz tačku S.
Budući da u stvarnom životu češće imamo situaciju u kojoj učestvuju
više od dva učesnika, posmatrajmo sada poopštenje zatvoreničke dileme na
proizvoljan broj sudionika. Ova igra se javlja u više okolnosti, mi ćemo
predstaviti onu sa zagadenjem zraka. Posmatrajmo sljedeću situaciju:

Primjer 2 U svijetu se nalazi n država. Svaka država ima mogućnost da


kontroliše zagadenje ili da ne kontroliše zagadenje. Pretpostavimo da kon-
trola zagadenja košta svaku državu 3 kredita i da svaka država koja zagaduje
nekontrolisano košta sve države 1 kredit. Pogledajmo sada na koji način je
ova situacija poopštenje Zatvoreničke dileme za proizvoljan broj učesnika.

Pogledajmo ovu situaciju opet iz ugla jedne države. Primijetimo da jenjoj


u svakoj situaciji bolje da zagaduje(nebitno šta ostale države radile, nju će
uvijek kontrola zagadenja koštati za dva više), pa je logično pretpostaviti da
će ta država zagadivati. Ali ovakvo rezonovanje može provesti svaka država,
pa možemo pretpostaviti da će sve države zagadivati.
Ali primijetimo da će u tom slučaju sve države plaćati n kredita, a puno
bolja situacija je kada sve države kontrolišu zagadenje, jer tada svaka država
plaća samo 3 kredita. Zbog tog razloga je ovo poopštenje zatvoreničke dileme
za n igrača.
U igrama koje smo dosad posmatrali smo uvijek imali situaciju da svaki
igrač ima jedinstvenu ”sebičnu” strategiju, neovisno od toga šta ostali radili
njemu je bolje da igra tu strategiju. Sada ćemo posmatrati igru u kojoj
”sebična” strategija jednog igrača ovisi od toga šta igraju ostali igrači.

5
Primjer 3 Pretpostavimo da n igrača želi da pošalje informaciju kroz ka-
nal maksimalnog kapaciteta 1. Svaki igrač ima beskonačno mnogo strategija,
igrač i može da pošalje xi jedinica za bilo koje xi izmedu 0 i 1. Pretposta-
vimo da svaki igrač želi da koristi što više kanala, ali i to da propusni opseg
kanala opada kako raste iskorištenost kanala.
Pn Igrač i koji pošalje xi jedinica
informacija dobija vrijednost 0 ako je i=1 xi veće od 1(možemo reći Pnda in-
formacija ne prode kroz kanal). U suprotnom igrač dobija xi (1 − j=1 xj )
kanala. Primijetimo da igrač povećavanjem ukupnog korištenja kanala os-
talih igrača gubi vrijednost kanala koju dobija, dok povećavanjem jedinica
koje pošalje kroz kanal u zavisnosti od vrijednosti ostalih xk jedinica se može
povećati i smanjiti vrijednost koju će dobiti igrač i.

Da bi našli optimalnu ”sebičnu”


P strategiju igrača i fiksirajmo strategije
ostalih igrača - neka je t = j!=i xj . Ako igrač i pošalje x jedinica dobit
će vrijednost x(1 − t − x). Ono što trebamo sad odrediti je maksimum ove
funkcije za x izmedu 0 i 1. Primijetimo da je prvi izvod ove funkcije jednak
1 − t − 2x, pozitivan za x < (1 − t)/2 i negativan za x < (1 − t)/2. Ovo
znači da funkcija raste do (1 − t)/2 i opada od (1 − t)/2, odnosno maksimum
funkcije se dostiže u tački (1−t)/2. Skup strategija je stabilan ako svaki igrač
igra svoju optimalnu sebičnu strategiju, čak iako su mu poznate strategije
ostalih igrača. U ovom stabilnom stanju sigurno nijedan od igrača sam ne bi
mijenjao strategiju.
Sada,
P pretpostavimo da smo u stabilnom stanju, to znači da vrijedi xi =
(1 − j!=i xj )/2 za svako
P i. Pomnožimo sa 2 i oduzmemo xi na obe strane
i dobijamo xi = 1 − j xj . Pošto ovo vrijedi za svako i, a desna strana ne
ovisi od i, dobijamo da su svi xi jednaki. Ali tada, xi = 1 − nxi odnosno
xi = 1/(n + 1) za svako i. Tada svaki igrač dobija 1/(n + 1)2 i primijetimo
da je ukupna iskorištenost kabla jednaka n/(n + 1)2 što je približno 1/n.
S druge strane, ako P igrači ne koriste optimalne ”sebične” strategije i ko-
n
riste kanal tako da je i=1 xi = 1/2(neovisno od toga koji koliko kanala
dobija) iskorištenost kanala postaje 1/4, što je otprilike n/4 puta više.
Primijetimo da se u ovoj igri dešava nešto slično kao u igri zagadenja.
Zajednički resurs svi igrači sebično iskorištavaju maksimalno i tako preop-
terećuju taj resurs do toga da svima postaje puno gore nego da su svi manje
koristili resurs.

6
Slika 3: Igra koordinacije

2.1.2 Igre koordinacije


Za razliku od dosadašnjih primjera, kod igara koordinacije imamo više ”sta-
bilnih” dogadaja. Najpoznatiji primjer ovakve igre je takozvana bitka spo-
lova.

Primjer 4 Muž i žena odlučuju šta će raditi u subotu naveče, oboje biraju
izmedu dvije opcije: odlazak na fudbalsku utakmicu i odlazak na balet. Muž
želi da ide na utakmicu, žena želi da ide na balet, ali oboje više od toga žele
da budu zajedno. Možemo reći da ako oboje odu na fudbal muž će dobiti
6 kredita, a žena 5 kredita. Ako ipak bude onako kako bi žena željela muž
dobija 5, a žena 6 kredita. Ako muž ode na fudbal, a žena na balet dobijaju
po 2 kredita. Ako eventualno muž ode na balet, a žena na fudbal dobijaju
po 1 kredit(kreditom ovdje podrazumijevamo količinu sreće igrača). Ovo je
predstavljeno tabelom na slici 3.

Jasno je da dva stanja u kojima oni idu na različita mjesta nisu stabilna
jer u oba slučaja bi oboje htjeli promijeniti odluku(jer im to donosi više
kredita). S druge strane oba stanja u kojima oni biraju isto su stabilna, jer
nijedno promjenom svoje odluke(pretpostavljajući da partner neće mijenjati
odluku) ne može povećati broj dobijenih kredita.

7
Slika 4: Igra rutiranja

Ova igra se takoder pojavljuje u raznim situacijama. Ovdje ćemo dati


primjer igre koordinacije koja se javlja u kontekstu rutiranja. U tom kon-
tekstu će za razliku od bitke spolova biti povoljno da igrači izaberu različite
putanje.

Primjer 5 Pretpostavimo da imamo dvije poruke koje se nalaze u čvoru O


i trebaju biti rutirane dalje u ostatak mreže kao što je prikazano na slici 4.
Pretpostavimo da je O povezan sa ostatkom mreže sa dvije tačke, tačkom A
i tačkom B, pri čemu je tačka A malo bliža čvoru O od tačke B,. Obe tačke
se lahko zaguše, pa ako obe poruke odu u jednu tačku to prouzrokuje dodatno
kašnjenje. Ono što žele oba igrača u ovoj igri je da pošalju poruku preko bliže
tačke, ali ono što još više žele je da pošalju dvjema različitim tačkama, da ne
bi bilo dodatnog kašnjenja. Ovu situaciju modeliramo igrom čija su moguća
kašnjenja prikazana na Slici 4 u tabeli.

2.1.3 Slaganje novčića


U dosadašnjim igrama je uvijek postojalo stabilno stanje, takvo da ako
se dogodi to stanje, nijedan od igrača ne želi da promijeni strategiju, jer
promjenom strategije može samo izgubiti. Takvo stanje pak, ne postoji u
svakoj igri i sljedeći primjer igre će to demonstrirati.

8
Slika 5: Igra slaganja novčića

Primjer 6 Dva igrača imaju po novčić i svaki od njih istovremeno bira


izmedu dvije strategije: Pismo i Glava. Ako oni oboje izaberu isto, pobjeduje
jedan igrač, a ako odaberu različito, pobjeduje drugi igrač.Možemo reći da
ako izaberu isto igrač 1 dobija jedan kredit, a igrač 2 gubi jedan kredit, u
suprotnom igrač 2 dobija jedan kredit a igrač 1 gubi jedan kredit. Tabela ove
igre je prikazana na slici 5.

Primijetimo da u svakom ishodu postoji igrač koji može promijeniti svoju


strategiju i tako povećati svoju zaradu(ako su odigrali oba Pismo ili oba
Glavu igrač 2 bi promijenio strategiju, u suprotnom igrač 1). Takoder, pri-
mijetimo da je dovoljno da igrač predvidi strategiju protivnika da bi ga po-
bijedio. Zbog toga je najbolji pristup igrača da randomizuje svoju strategiju
i da tako onemogući da drugi igrač otkrije njegovu strategiju.

9
2.2 Definisanje igara
Dosad smo pričali o primjerima nekih klasičnih igara. Spominjali smo stra-
tegije, troškove i kredite, ali sad ćemo o tome govoriti formalnije. Tačnije,
definisat ćemo simultane jednopotezne igre, igre u kojima svaki igrač ima
skup mogućih strategija koje može igrati i bira jednu od tih strategija. U
zavisnosti od toga koju strategiju je odigrao svaki od igrača, igrači dobivaju
svoje nagrade i troškove.
Formalno, igra se sastoji od skupa od n igrača, {1, 2, 3, ..., n}. Svaki igrač
i ima skup mogućih strategija Si . Da bi igrao, svaki igrač bira strategiju si
iz Si .Označavat ćemo sa s = (s1 , s2 , ..., sn ) vektor strategija odabranih od
igrača i sa S =×i Si skup svih mogućih načina na koje igrači mogu izabrati
strategije.
Vektor strategija s iz S odabranih od igrača jednoznačno odreduje na-
gradu(odnosno trošak) svakog od igrača na kraju igre. Generalno će svaki
od igrača imati različitu nagradu(odnosno trošak). Za svakog igrača i de-
finišemo funkciju ui = ui (s) koja uzima vrijednosti iz skupa S i koja daje
vrijednosti iz skupa realnih brojeva. Primijetimo da je moguće da ova funk-
cija prima pozitivne vrijednosti(kada igrač i dobija nagradu), kao i da je
moguće da prima negativne vrijednosti(kada igrač i ima kaznu) i naravno
funkcija može davati i nulu(kada igrač i nema ni nagradu ni kaznu). Ovu
funkciju ćemo u daljem radu zvati funkcija utilitarnosti ili funkcija korisnosti.
Objasnimo sada na primjeru igre Slaganja novčića definisane pojmove.
U ovoj igri imamo dva igrača, igrač 1 i igrač 2. Skup mogućih strategija
S1 igrača 1 je {H, T }(H-Pismo i T-Glava). Primijetimo da u ovoj igri oba
igrača imaju isti skup strategija. Ako igrač 1 odabere Pismo, a igrač 2
Glavu tada je vektor strategija (H, T ) i igrač 1 dobija u1 ((H, T )) = −1, a
igrač 2 u2 ((H, T )) = 1. Skup svih mogućih strategija igrača sadrži 4 člana,
(H, H),(H, T ),(T, H) i (T, T ).
Ono što smo mogli uočiti kod zatvoreničke dileme i sličnih igara(igra
kontrole zagadenja) je da je svaki igrač imao dominantnu strategiju, što znači
da je za svakog igrača postojala strategija bolja od bilo koje druge neovisno
od toga koje strategije ostali igrači koristili. Ovo zadovoljava jako mali broj
igara. Ako za igru vrijedi da svaki igrač ima dominantnu strategiju, kažemo
da ima rješenje dominantnih strategija.
Formalno rečeno, za vektor strategija s iz S sa si označavamo strategiju
igrača i, neka je s−i (n − 1)-dimenzionalni vektor strategija igranih od ostalih
igrača. Funkciju utilitarnosti sada možemo napisati i kao ui = ui (si , s−i )

10
i ovu oznaku ćemo koristiti kada je to prigodnije. Koristeći ovu notaciju
možemo reći da je vektor strategija s iz S rješenje dominantnih strategija
ako za svakog igrača i, i za svaki alternativni vektor strategija s′ vrijedi
ui (si , s’−i )≥ui (s’i , s’−i )(svaki igrač ima dominantnu strategiju).
Ono što je važno je da primijetimo da rješenje dominantnih strategija
ne mora biti optimalno ni za jednog igrača(ustvari u zatvoreničkoj dilemi i
sličnim igrama i nije), iako na prvi pogled nam izgeda da je optimalno za sve
igrače.
Sada posmatrajmo igre kod kojih ne postoji rješenje dominantnih strate-
gija. To znači da postoji barem jedan igrač koji nema dominantnu strategiju.
Pokušavajući predvidjeti najvjerovatniji ishod ovih igara dolazimo do defi-
nicije Nešovog ekvilibrijuma, odnosno Nešove ravnoteže. Nešov ekvilibrijum
neke igre je ustvari stabilno stanje igre o kojem smo govorili u igri Bitka
polova. Stanje igre je Nešov ekvilibrijum te igre ako nijedan igrač ne može
promjenom svoje strategije poboljšati svoju nagradu(smanjiti trošak) pret-
postavljajući da će ostali igrači igrati isto.
Formalno rečeno, vektor strategija s iz S je Nešov ekvilibrijum igre ako za
sve igrače i i za sve alternativne strategije s’i vrijedi ui (si , s−i ) >=ui (s’i , s−i ).
Drugim riječima, ako igrač i promijeni strategiju si u s’i , pretpostavljajući
da će ostali igrači igrati isto, vrijednost koju daje njegova funkcija korisnosti
se može samo smanjiti. Zbog toga smo dosad spominjali Nešov ekvilibrijum
u kontekstu stabilnih stanja, jer primijetimo da jednom kada igrači dodu u
Nešov ekvilibrijum, nijednom od njih se ne isplati da mijenja svoju strategiju.
Sada primijetimo da je Nešov ekvilibrijum proširenje pojma rješenja do-
minantnih strategija, jer ako je neko stanje rješenje dominantnih strategija,
to stanje je i Nešov ekvilibrijum. Ako je to rješenje ustvari rješenje strik-
tno dominantnih strategija(mijenjajući svoju strategiju igrač uvijek smanjuje
svoju nagradu), Nešov ekvilibrijum je jedinstven. To u generalnom ne vrijedi,
vidjeli smo na primjeru igre Bitka spolova kada imamo 2 Nešova ekvilibri-
juma(naravno, može ih biti i više).
Sada možemo da se zapitamo, da li Nešov ekvilibrijum uvijek postoji?
Odgovor je negativan i to vidimo na primjeru igre Slaganja novčića(već smo
konstatovali da ova igra nema stabilno stanje). Ovo nas dovodi do proširenja
definicije Nešovog ekvilibrijuma, Nešov ekvilibrijuma za mješovite strategije.
Već smo spominjali da je najbolja strategija igrača u igri Slaganja novčića
bila da randomizuje svoju strategiju kako ga drugi igrač ne bi mogao pre-
dvidjeti. Tačnije najbolja moguća strategija je da igra oba poteza sa vjero-
vatnoćom 1/2(ako bi neki potez igrao više to bi drugi igrač mogao iskoris-

11
titi). Ako bi neki od igrača igrao tu strategiju primijetimo da će drugi igrač
imati očekivanu dobit 0 nebitno kako igrao. I sada primijetimo da u slučaju
da oba igrača igraju ovu strategiju nijedan promjenom svoje strategije ne
može povećati nagradu. Strategije koje igraju igrači u ovom slučaju zovemo
mješovite strategije.
Mješovita strategija nekog igrača je, formalno rečeno, distribucija vjero-
vatnoće na skupu njegovih strategija. Vektor mješovitih strategija je u ovom
slučaju distribucija vjerovatnoće na skupu vektora strategija S. Za kraj
uvoda u Teoriju igara navodimo jedan od najfascinantnijih rezultata teorije
igara - Nešova teorema.

Teorema 1 Bilo koja igra sa konačnim skupom igrača i sa konačnim izborom


strategija za svakog igrača ima Neš ekvilibrijum za mješovite strategije.

12
3 Algoritamski dizajn mehanizama
Kao što smo već naveli, algoritamski dizajn mehanizama je nova oblast,
oblast čiji su temelji postavljeni 1999. godine u radu Noam Nisana i Amir
Ronena. Ova oblast proučava probleme optimizacije u kojima neke informa-
cije poput količine ili troška nekog resursa dizajneru algoritma nisu poznate i
moramo ih na neki način saznati od ”sebičnih” agenata, agenata koji gledaju
samo svoju korist.
Klasični primjeri su primjeri aukcija u kojima nam je nepoznata želja
onih koji kupuju proizvod(koliko bi ga najviše platili) i u kojima je problem
optimiziranja rasporediti proizvode koje prodajemo da bi maksimizirali pri-
hode. ”Mehanizam” je protokol po kojem radimo sa učesnicima(”sebičnim”
agentima) i koji na kraju rješava problem optimiziranja.
U nastavku ćemo se upoznati sa najpoznatijim protokolom za aukcije sa
jednim proizvodom.

3.1 Wickrey-ova aukcija za jedan proizvod


Posmatrajmo proizvod koji je na aukciji u kojoj je uključeno n igrača. Svaki
igrač i ima svoju cijenu wi - maksimalan iznos koji bi platio za proizvod.
Naravno, on želi da plati što manje. Iznos wi svakog igrača i je privatan, ni
prodavac, a ni ostali kupci ga ne znaju. Njegova funkcija korisnosti ui iznosi
0 ako izgubi aukciju(ako ga prodavac ne izabere), a ako osvoji aukciju i plati
cijenu p za proizvod, njegova funkcija korisnosti je jednaka wi − p.
Mi želimo da dizajniramo mehanizam tako da proizvod bude dodijeljen
igraču koji ga najviše vrednuje(igraču sa maksimalnim wi ). Problem je u
tome što mi ne znamo njihove vrijednosti wi . Želimo da onemogućimo
strateško manipulisanje igrom. Ne smijemo dozvoliti da neki igrač može
strateški ponuditi vrijednost različitu od njegove stvarne cijene wi i na taj
način sebi donijeti korist veću od one koju bi dobio ako bi rekao svoju stvarnu
cijenu. Ono na što mi možemo uticati u aukciji je to ko će biti pobjednik i
vrijednost koju pobjednik mora platiti. Prirodno je da pobjednik bude osoba
koja je najviše ponudila. Sada ćemo vidjeti dvije prirodne ideje o cijeni koju
pobjednik mora platiti i objasnit ćemo zašto one nisu dobre:

• Bez plaćanja: Ako bi pobjednik bio osloboden plaćanja, svaki igrač


bi ponudio puno više od svoje stvarne cijene i pobjednik ne bi ovisio
od toga koliko igrači cijene proizvod.

13
• Plati svoju ponudu: Druga prirodna ideja je da jednostavno po-
bjednik plati onoliko koliko je ponudio. Ovaj mehanizam bi takoder
bio podoban za manipulaciju. Naime, problem je što pobjednik u tom
slučaju, ako je ponudio svoju stvarnu cijenu, dobija nagradu 0. Jasno je
da mu je logičnije da ponudi neki broj koji je manji, jer tako povećava
mogućnost da zaradi(a i dalje ni na koji način ne može izgubiti). Nije
očigledno koliko bi igrač trebao da ponudi. Kakogod, ne isplati mu se
da nudi svoju stvarnu cijenu.

Nakon što smo vidjeli dvije prirodne ideje koje nisu zadovoljile, prelazimo
na jednu koja iznenadujuće dobro rješava naš problem.

Definicija 1 Wickrey-ova aukcija: Neka je pobjednik igrač koji najviše


ponudi i neka on plaća najveću cijenu koju su ponudili ostali igrači(drugu
najveću cijenu ukupno).

Pod ovim uslovima, nemoguće je umjesto stvarne cijene ponuditi neku


drugu cijenu i na taj način povećati svoju nagradu. To nam govori sljedeća
propozicija:

Propozicija 1 Ako igrač i želi da maksimizira svoju nagradu u Wickrey-ovoj


aukciji, mora ponuditi svoju stvarnu cijenu wi .

Dokaz:
Pretpostavimo da će igrač i pobijediti ako kaže svoju stvarnu cijenu wi .
Ako bi ponudio bilo koju vrijednost veću od druge najveće ponude, njegova
nagrada se ne bi promijenila(zaradio bi wi −p, gdje je p druga najveća ponuda
na aukciji), a ako bi ponudio manje od nje tada bi dobio 0 što je još manje.
Pretpostavimo sada da će igrač izgubiti ako kaže svoju stvarnu cijenu. Tada,
ako ponudi bilo koju vrijednost manju od najveće ponude, dobit će 0, a
ako kaže vrijednost veću od najveće ponude osvojit će aukciju, ali će dobiti
nagradu manju ili jednaku 0, budući da je tada platio više od svoje stvarne
cijene. Zaključujemo da igrač ni u kojem slučaju ne može poboljšati svoju
nagradu tako što ponudi cijenu različitu od svoje stvarne cijene wi .
Da bi mogli zaključiti da smo ovim protokolom aukcije dobili ono što
želimo, da svi igrači kažu svoju stvarnu cijenu proizvoda, moramo dodati
neke pretpostavke. Inače, nije moguće predvidjeti ishod neke igre bez pret-
postavki o ponašanju igrača. Ono što je dobro za ovu aukciju je da ne
moramo pretpostavljati da igrači igraju racionalno(da u svakom momentu

14
biraju ono što je bolje za njih). Dovoljno je pretpostaviti da će igrač ako
ima dominantnu strategiju uvijek izabrati nju. Naime, to znači da ako igrač
ima strategiju koja je bolja od svih ostalih kako god ostali igrači igrali, on će
koristiti tu strategiju.
Navedimo nekoliko važnih osobina Wickrey-ove aukcije:

• Već smo rekli da je nudenje stvarne cijene dominantna strategija u


Wickrey-ovoj aukciji. Ovome dodajmo činjenicu da u Wickrey-ovoj
aukciji igrač koji kaže svoju stvarnu cijenu mora dobiti nenegativnu
funkciju korisnosti.

• Druga osobina je da maksimizira ukupni prihod svih Pnigrača ako igrači


ponude stvarnu cijenu. Ukupni prihod je jednak i=1 vi xi gdje je xi
jednak 1 kod onog igrača koji osvoji aukciju i jednak 0 kod svih ostalih.

• Ono što još vrijedi je da možemo završiti aukciju u polinomijalnom


vremenu(ustvari, aukcija se završava u linearnom vremenu).

U nastavku ćemo govoriti o aukcijama koje odvijaju na Internetu, tačnije


na stranicama za pretraživanje

3.2 Aukcije za sponzorisanu pretragu


Stranica koja nam izbaci rezultate Web pretraživanja izbacuje dvije različite
vrste rezultata. Jedna vrsta rezultata je bazirana na riječima koje smo uni-
jeli, koriste se algoritmi da bi odredili stranice koje su najpodobnije za ono
što smo tražili. Druga vrsta rezultata su sponzorisani linkovi, prikazani sa
desne strane na Slici 6, koje plaćaju oni koji žele reklamu Web pretraživaču.
Svaki put kada mi pokrenemo pretragu, u isto vrijeme se održava aukcija
kojom se odlučuje koji od oglašivačkih linkova će biti prikazan i na kojem
mjestu. Nevjerovatno je koliko su aukcije za sponzorisanu pretragu utjecale
na ekonomiju Interneta. Nevjerovatna informacija je da je kompanija Google
2006. godine 98 posto svojih prihoda ostvarila na sponzorisanim aukcijama.
Iako se online reklamiranje danas realizuje na jako puno različitih načina,
aukcije za sponzorisanu pretragu još uvijek donose milijarde dolara prihoda.
U nastavku ćemo pričati o pojednostavljenoj verziji modela aukcija za
sponzorisanu pretragu.

15
Slika 6: Google pretraga

3.2.1 Jednostavni model aukcija za sponzorisanu pretragu


Proizvodi koji se prodaju su ustvari k ”mjesta” za sponzorisane linkove
na stranici koja sadrži rezultate Web pretraživanja. Igrači na aukciji su
oglašivači koji imaju odredenu ponudu za ključnu riječ koja je unesena. Za
različite ključne riječi su zainteresovani različiti oglašivači(najčešće kompa-
nije). Ove aukcije su dosta komplikovanije nego aukcije za jedan proizvod. S
jedne strane, imamo više proizvoda koji se prodaju. S druge strane, ono što
je još važnije, proizvodi nisu identični, ”mjesta” na stranici su vrijednija ako
su bliže vrhu(budući da Web stranicu korisnici pregledavaju od vrha).
Razliku medu proizvodima(”mjestima” na stranici) predstavljamo pomoću
vrijednosti ai za svako i, vjerovatnoće da će korisnik usluge pretraživača klik-
nuti na link koji se nalazi na tom mjestu. Pretpostavimo da je a1 ≥a2 ≥...≥an (već
smo rekli da su vrijednija mjesta koja su bliže vrhu stranice). Pretpostavimo
da na vjerovatnoću klikanja korisnika ne utiče koliki rejting ima oglašivač.
Dodajmo još da je moguće i bez ove pretpostavke, ali olakšava dalji rad.
Pretpostavimo da svaki oglašivač ima privatni iznos vi kojim on vrednuje
”klik” na njegovu stranicu. Funkcija korisnosti igrača i je onda vi aj (ako je
dobio ”mjesto” sa rednim brojem j ).
Ono što nas interesuje je pitanje da li postoji aukcija dobra kao Wickrey-

16
ova aukcija u ovom slučaju. Ta aukcija bi trebala zadovoljavati osobine:

1. Prvo što treba da vrijedi je da je ponuda stvarne cijene svih oglašivača


dominantna strategija i da svi oglašivači ako ponude stvarnu cijenu u
svakom slučaju imaju nenegativne funkcije korisnosti.

2. Drugo je da podjela ”mjesta” oglašivačima mora maksimizirati Pukupni


prihod svih oglašivača. Ukupni prihod možemo prikazati kao ni=1 vi xi
pri čemu je xi jednak aj , ako je oglašivač i dobio j -to mjesto od vrha
stranice, ili jednak 0 ako oglašivač i nije dobio nijedno mjesto. Ono što
treba napomenuti je da svako mjesto dobija tačno jedan oglašivač i da
svaki oglašivač dobija najviše jedno mjesto.

3. Ono što još treba da vrijedi je da možemo rasporediti ”mjesta” u po-


linomijalnom vremenu budući da se nevjerovatan broj aukcija svake
sekunde mora izvršavati.

Teškoća dizajniranja mehanizama leži u tome što moramo da donesemo


dvije odluke, ko će šta osvojiti i ko će koliko platiti. Vidjeli smo i u aukcijama
za jedan proizvod da nije dovoljno odlučiti da će proizvod dobiti onaj koji
najviše ponudi, da bi spriječili manipulaciju aukcijom morali smo na pametan
način odrediti i koliko će pobjednik dobiti.
Srećom, u mnogim primjenama, uključujući i ovu(aukcije za sponzorisanu
pretragu) je moguće ove dvije odluke razdvojiti u dva koraka i završiti jednu
po jednu.
Korak 1: Ako pretpostavimo da su svi ponudili stvarnu cijenu, na koji
način trebamo rasporediti ”mjesta” da bi vrijedili uslovi 2 i 3.
Korak 2: Sa datim odgovorima iz koraka 1, na koji način moramo pos-
taviti prodajne cijene da bi osobina 1. vrijedila.
Primijetimo da za Korak 1 imamo prirodnu greedy ideju, rasporedimo
k -to najviše(najbolje) ”mjesto” k -tom najvećem ponudivaču(onom čija je
ponuda bila k -ta najveća). S ovim pristupom će biti ispunjeni uslovi 2 i 3,
očigledno ovaj algoritam radi u linearnom vremenu(samo k puta odaberemo
najveći element i izbacimo ga iz niza). S druge strane lagano se dokaže da
na ovaj način maksimiziramo ukupan prihod svih takmičara, ako igrači nude
stvarne cijene.
Sada prelazimo na teži korak, kako postaviti prodajne cijene da bi svim
igračima nudenje stvarne cijene bila dominantna strategija?. Pokušajmo tako
što ćemo poopštiti Wickrey-ovu aukciju za jedna proizvod.

17
Neka su ponude oglašivača bile b1 ≥b2 ≥...≥bn . Već smo rekli da ćemo
oglašivaču koji je ponudio bi davati i-to mjesto od vrha stranice. Neka on za
to mjesto plati bi+1 , ponudu koju je ponudio oglašivač koji je bio odmah iza
njega.
Budući da je ova aukcija generalizacija Wickrey-ove aukcije, za očekivati
je bilo da dobijemo osobine koje nam trebaju. Ova aukcija zaista ima neke
osobine(već smo vidjeli da zadovoljava osobine 2 i 3 Wickrey-ove aukcije), ali
u slučaju ove aukcije nudenje stvarne cijene igračima i nije uvijek dominantna
strategija. Pogledajmo to na sljedećem primjeru:
Pretpostavimo da k od n oglašivača ima otprilike istu stvarnu procjenu
”mjesta” dok ostalih n-k igrača puno manje vrednuje ”mjesta”. Sada pret-
postavimo da su svi ponudili svoju stvarnu cijenu. Tada će igrač koji osvoji
k-to mjesto platiti puno manje od ostalih igrača jer on plaća bk+1 . Sada je
jasno da će svaki od igrača prije željeti da dobije k-to ”mjesto” ako će platiti
puno manje, nego neka od prvih k-1 mjesta, pošto bi tada platio otprilike
svoju stvarnu cijenu. Konkretno možemo staviti vi = M za i≤k i vi = m za
i > k, pri čemu je M neki veliki broj, a m neki mali broj. Sada primijetimo
da je puno bolje za nekog od k igrača koji cijene ”mjesta” više da ponudi
neki broj manji od M, jer ako svi ostali ponude svoju stvarnu cijenu, on će
za k-to mjesto platiti m, što je puno bolje nego za neka od prvih k-1 mjesta
platiti M i ovo vrijedi neovisno od n,k i vrijednosti a1 , a2 , ..., an za dovoljno
veliko M(ili dovoljno malo m).
Iz ovog zaključujemo da igraču koji igra ovu aukciju nije dominantna
strategija da ponudi svoju stvarnu cijenu, jer smo naveli primjer kada je
igraču puno bolje da ponudi neku drugu cijenu. Uprkos ovome, ova aukcija
se koristi na većini pretraživača. Već smo naveli da ova aukcija ima neke fine
osobine i ne bi bilo čudno to što je pretraživači koriste da ne postoji aukcija
kod koje su zadovoljene sve tri osobine Wickrey-ove aukcije. U ovom radu
mi je nećemo navoditi, samo ćemo kazati da je jedinstvena.

18
4 Zaključak
Prvo poglavlje ovog rada upućuje čitatelja u svijet teorije igara i prikazuje
kako se situacije koje dolaze u kontekstu Interneta mogu modelirati nekim
klasičnim igrama. Cilj prvog dijela rada nije samo da predstavi osnove teorije
igara, nego i da predstavi čitatelju drugačiji pogled na neke životne situacije.
Drugo poglavlje rada bi trebalo da upozna čitatelja sa oblasti algoritam-
ske teorije igara, relativno nove oblasti. Kako je algoritamska teorija igara
značajna oblast u modernoj nauci i predmet aktivnih istraživanja, vrijedi se
upoznati sa osnovnim konceptima ove discipline.

5 Literatura
[1] Noam Nisan, Tim Roughgarden, Eva Tardos, Vijay V. Vazirani: Algorit-
hmic Game Theory, 2007
[2] Joseph Y. Halpern: Computer Science and Game Theory: A Brief
Survey, 2007
[3] Tim Roughgarden: Algorithmic Game Theory, 2009

19

You might also like