TI Seminarski 2

UVOD
U svakodnevnom ivotu, podjednako poslovnom i privatnom, okruenje esto nije amorfna masa, ve po pravilu sreemo pojedince ili ( interesne ) grupe ije su aktivnosti relevantne, a ponekad i presudne za nae odluke. Istovremeno, nae aktivnosti imaju povratni uticaj na odluke istih subjekata ili grupa, pa konani rezultati koje svako od nas postie predstavljaju proizvod brojnih individualnih odluka i njihovih interakcija. Ponekad se ovi uticaji zasnivaju na saglasnim interasima, dobroj volji i elji da pomognemo jedni drugima, dok u drugim sluajevima proistiu iz konfliktnih interesa, animoziteta, pa i neprijateljstva. Situacije deliminog ili potpunog konflikta izmedju razliitih donosilaca odluka nazivamo igrama. Teorija igara predstavlja matematiku teoriju i metodologiju koja se koristi za analizu i reavanje konfliktnih i delimino konfliktnih situacija u kojima uesnici imaju suprotstavljene interese.Razmatranje situacija u kojima dva ili vise subjekata donose odluke u uslovima sukoba interesa nazvano je teorijom igara zato to tipine primere ovakvih situacija predstavljaju razliite drutvene igre, kao to su sportske utakmice, kartake igre (poker, bridz, i sl.), ah, itd. Naravno, iako je vei deo termina koji se koriste u okviru matematike teorije igara slian terminologiji drutvenih igara, teorija igara ima mnogo iru primenu i koristi se za modeliranje konfliktnih situacija u matematici, politici, ekonomiji, vojnoj strategiji, itd. Pri tome, neophodno je istai da metodi teorije igara slue za analizu i reavanje takvih konfliktnih situacija koje karakterie viekratno ponavljanje pojedinih odluka o moguem razreenju sukoba interesa izmedju uesnika, tj. igraa. Prvi radovi iz domena teorije igara datiraju jo od prve polovine devetnaestog veka, od radova Cournot-a i Bertrand-a, koji su nagovestili mogunost korienja teorije igara za potrebe ekonomske analize, posebno u analizi proizvodnje i cena. Meutim, ideju opte teorije igara na teorijski konzistentan nain prvi su predstavili John von Neumann i Oskar Morgenstern 1944. godine u svom fundamentalnom radu Teorija igara i ekonomsko ponaanje. U tom radu pokazano je da se mnogi ekonomski problemi mogu veoma uspeno modelirati korienjem teorije igara i predstavljene su igre u ekstenzivnoj i normalnoj formi. U posleratnom periodu razvoj i usavravanje teorije igara predstavlja predmet interesovanja mnogih istaknutih matematiara i ekonomista. Moe se slobodno kazati da u posleratnom periodu skoro da nijedno podruje ekonomske analize i matematikog modeliranja ekonomskih pojava nije ostvarilo toliku ekspanziju i razvoj kao to je to sluaj sa teorijom igara.
OSNOVNE KARAKTERISTIKE I VRSTE IGARA

Izvriemo uproavanje matematikog modela tako da dobijemo intuitivni uvid u teoriju igre ukljuujui u razmatranje samo najznaajnijih faktora. Zbog toga, moe da se kae da igra predstavlja uproeni model konflikta koji obuhvata ukupnost pravila ponaanja uesnika u igri (igraa), koja opredeljuju njihove mogue poteze kao i potencijalne rezultate njihovog izbora. Igrai, tj. uesnici u igri, mogu biti pojedinci, grupe, preduzea, vojne formacije, itd. Pri tome, cilj svakog od uesnika u igri jeste da postigne u igri takvo reenje koje mu obezbeuje ostvarivanje najpovoljnijeg mogueg rezultata. Potencijalne rezultate igraa uesnika, odnosno ishod igre, obino predstavljamo tzv. korisnikom funkcijom ili funkcijom plaanja koja predstavlja numeriki izraz dobitaka odnosno gubitaka uesnika neke igre. Osnovna karakteristika teorije igara sadrana je u injenici da veliina rezultata koji e pojedini igrai ostvariti u igri ne zavisi samo od njihovog izbora mogueg pravila ponaanja u igri, ve i od izbora ostalih igraa. Svaki od igraa unapred poznaje mogue alternative koje mu stoje na raspolaganju u toku igre, koje nazivamo njegovim strategijama. Strategije predstavljaju ukupnost
pravila ponaanja igraa i potencijalne rezultate izbora pojedinih alternativa u svakoj konkretnoj situaciji. Oigledno, strategija predstavlja centralni pojam ukupne teorije igara, kojim se unapred definiu mogui izbori razliitih alternativa od strane igraa, za koje se oni mogu opredeliti u svim moguim varijantama igre. Svaka igra se realizuje preko pojedinanih poteza igraa, pri emu potez predstavlja jedan izbor mogue alternative od strane igraa. Skup veeg broja poteza obrazuje partiju. Postoje razliite vrste igara, pri emu se kao kriterijumi za klasifikaciju igara obino uzimaju sledei kriterijumi: broj igraa, broj strategija, karakter korisnike funkcije i meusobna povezanost igraa. Zavisno od broja igraa uesnika, sve igre delimo na igre sa dva igraa, igre sa tri igraa, ..., igre sa n igraa. Za realizaciju neke igre, odnosno postojanje odnosa konflikta ( ili kooperativnosti), neophodno je uee najmanje dva igraa, u suprotnom igra se svodi na prostu odluku, to spada u domen teorije odluke. Postojanje tri ili vie uesnika u igri otvara mogunost stvaranja tzv. koalicija, tj. mogunost da dva ili vie igraa usklaujui svoje interese koordinisano opredeljuju u izboru strategija. Ukoliko svakom od igraa u igri stoji na raspolaganju konaan broj strategija, tada se radi o tzv. konanoj igri. U suprotnom sluaju, kada broj strategija igraa nije ogranien, igra predstavlja beskonanu igru. Prema karakteru korisnike funkcije sve igre delimo na igre sa nultom i igre sa nenultom sumom. Igra sa nultom sumom predstavlja takvu igru u kojoj je suma ukupnog plaanja jednaka nuli, tj. ukupan dobitak jednog ili vie igraa je jednak ukupnom gubitku poraenih igraa. Tipian primer za ovakvu vrstu igre jeste igra pokera, u kojoj je ukupna suma plaanja jednaka nuli. Nasuprot ovome, u igrama sa nenultom sumom, u kojima se obino prepliu odnosi konflikta i kooperacije igraa, suma ukupnog plaanja je razliita od nule. Na primer, u igri lutrije organizator zadrava za sebe deo ukupnog dobitka. Zavisno od meusobnog odnosa igraa uesnika, sve igre delimo na kooperativne i nekooperativne. Kooperativne igre predstavljaju takvu vrstu igara u kojima igrai formiraju koalicije koje im slue za meusobno usklaivanje ponaanja i izbor pojedinanih strategija koje im obezbeuju postizanje najpovoljnijih rezultata. Ukoliko u toku igre ne postoji koordinacija u ponaanju ( izboru poteza ) od strane igraa, takva igra predstavlja nekooperativnu, tj. antagonistiku igru. Za potrebe matematikog modeliranja, analize i reavanja, igra moe biti predstavljena na razliite naine. Jedan postupak primenjuje se za igre kod kojih ne postoji potpuna informisanost igraa o potencijalnim odgovorima protivnika na njihov izbor pojedinanih strategija. Za takve igre je karakteristino da se rezultat svih poteza u toku neke igre obraunava tek na kraju igre, kada se obavi predvieni broj poteza, odnosno realizuje jedna partija. Ovakva vrsta igre, koju koju nazivamo igrom ekstenzivnog (opsenog) oblika, predstavlja se obino preko odgovarajueg stabla igre, u kome se predstavljaju odabrani potezi igraa. Tipian primer ovakve igre jeste poker. Takoe, pregovarake igre, kao specijalna vrsta igara prikazuju se grafikim putem, tzv. funkcijom koalicije, u prvom kvadrantu koordinatnog sistema. Drugi postupak predstavljanja i analiziranja igre primenjuje se u situaciji tzv. pune informisanosti o potencijalnim rezultatima odabranih strategija od strane igraa. Kod ovakve vrste igre, koju nazivamo igra u normalnoj (matrinoj) formi, za sve alternativne kombinacije odabranih strategija od strane igraa unapred su poznata plaanja, odnosno rezultat igre. Na primer, kod konane igre dva lica sa nultom sumom, ova plaanja (korisnika funkcija) predstavljena su matricom plaanja u kojoj su predstavljeni rezultati koji e biti ostvareni izborom razliitih moguih kombinacija parova strategija od strane dva igraa, uesnika u igri.
DVA MOTIVACIONA EKSPERIMENTA Primer 1 Neka svako od vas zamisli prirodan broj izmedju 0 i 100, tako da taj broj bude 2/3 proseka svih odgovora. Preciznije, svaki student koji pogodi najvei prirodan broj koji nije vei od 2/3 proseka svih odgovora, dobie 10$. Kako da odigramo ovu igru? Naivna pretpostavka bi bila da ostali uesnici biraju brojeve nasumino ( bez strategije). U tom sluaju prosek odgovora e biti oko 50 pa bi trebali da odaberemo 33. Ali jasno vam je da ako i drugi uesnici naprave istu pretpostavku ( istu raunicu), niko nee rei broj vei od 33. To nas sada dovodi do odgovora 22. Ovaj postupak se moe nastaviti na dalje. Prole godine dobitni broj je bio 15, kao i pretprole. Dakle zakljuujemo da su uesnici proseno odradili ovakvu iteraciju 3 puta. Zapravo prosta injenica je da su brojevi varirali od 0 do 40, to nas dovodi do zakljuka: razliiti studenti ( uesnici ) razliito ocenjuju procene svojih kolega. Primer 2 Napraviu aukciji novica. Svako od vas moe da pogleda moju kolekciju i da se nadmee za istu. Najvea ponuda pobeuje. Ova vrsta igre je ono to nazivamo prosta-vrednost aukcije, to je sluaj kada svaki od ucesnikaponua ima neko osnovno poznavanje vrednosti predmeta za koji se nadmee. Uobiajeno je da e veina ljudi davati ponude bliske istnskoj vrednosti novia, kada daju prvu ponudu ( kad prvi put uestvuju u igri ). Dakle, tendencija prosenih ponuda je ka pravoj vrednosi, jer neki ljdi dobro procenjuju cenu novia, neija procena je ispod a neija iznad. Meutim najbolja ponuda je ona koja dobija-pobeuje a ta ponuda je skoro sigurno vea od istinske vrednosti novia. Pravi igrai bi odigrali tako da u startu spuste svoje ponude, a u Neovom ekvilibrijumu (ravnotei) ove igre to je upravo ono to oni rade. TA JE TEORIJA IGRE? Definicija 1 Teorija igre je formalni nain analiziranja interakcije izmeu grupe racionalnih agensa-uesnika ije ponaanje obuhvata strategiju. Grupa: U bilo kojoj igri postoji vie od jednog donosioca odluka koga nazivamo IGRA. Ako postoji samo jedan igra onda igra postaje problem odluke. Interakcija: Ono to jedan individuani igra radi utie na najmanje jednog drugog igraa unutr grupe. Inae igra je jednostavna serija nezavisnih porblema odluke. Strategija: Individualni igrai su jedini koji su odgovorni za ovu unutrnju zavisnost. Racionalnost: Uzimajui u obzir ovu unutranju zavisnost svaki igra bira svoju najbolju akciju. Ovaj uslov moe biti oslabljen i moemo pretpostaviti da se uesnici ponaaju ogranieno racionalno. Evolucionarno gledano, teorija igre je teorija sa ogranienom racionalnou uesnika.. Primer 3 Pretpostavimo da 10 ljudi odlazi u restoran da zajedno ruaju. Svako od njih plaa raun za svoj obrok. Ovo je problem odluke. Pretpostavimo sada da se svi dogovore da podele raun meu sobom10 uesnika. Sada imamo igru.
TEORIJA ODLUKE SA IZVESNOU Smisleno je krenuti objanjenje diskusijom trivijalnih igara - to su one igre koje igramo sami protiv sebe, npr. problemi odluke. Participijenti su suoeni sa situacijom u kojoj moraju da donesu izbor. Akcije drugih uesnika nemaju uticaj na sopstveni izbor, dakle ne postoji strategijska interakcija ukljuena u ovaj proces. Problem odluke karakteriemo ureenim parom (A,) , gde je A={ a1, a2, ...an} konaan niz ishoda, a relacija izbora (preferenciranja). Iskaz ab kae da je b je dobar barem koliko i a. Oekivano relacija izbora ispunjava dve jednostavne aksiome: Axioma 1 Potpunosti Bilo koja dva proizvoljna ishoda su ureena tj. ab ili ba . Axioma 2 Tranzitivnosti Ukoliko vai ab i bc onda je ac. Ove aksiome nam omoguavaju da svi izbori mogu biti ureeni u jedinstveni lanac bez prekida i ciklusa. Iako je relacija odluke osnovna primitiva bilo kog problema odluke, mnogo je jednostavnije raditi sa doslednom korisnikom funkcijom (funkcija plaanja) u: A zato to radimo sa nizom od n realnih brojeva. Definicija 2 Korisnika funkcija u: A je dosledna u odnosu na relaciju izbora u problemu izbora (A,), ukoliko vai: a,bA ab u(a)u(b) Teorema 1 Neka je niz ishoda konaan. Tada postoji korisnika funkcija koja je dosledna. Dokaz: Razbijmo skup A na klase ekvivalencije, takve da svaka klasa sadri sve ekvivalentne ishode. Tih klasa ima konano mnogo jer je A konaan. Uredimo sada ovako dobijene klase ekvivalencije u strogo rastui lanac (poredak). To moemo da uradimo jer vae aksiome potpunosti i tranzitivnosti. Primetimo da korisnika funkcija nije jedinstvena. Ustvari svaka monotona transformacija dosledne korisnike funkcije daje novu korisniku funkciju koja je takoe dosledna. Definiimo sada termin donosioca racionalne odluke. Definicija 3 Donosioc racionalne odluke koji je suoen sa problemom odluke (A,) bira jedan ishod a* A koji maksimizira njegovu korisnost (ekvivalentno, za svako a A vaie aa*). Primedba Kada imamo beskonano mnogo izbora, elimo da imamo neprekidnu korisniku funkciju. Ovo zahteva jo aksioma koje osiguravaju neprekidnost izbora. U tu svrhu moramo definisati topologiju na
nizu ishoda. Definiimo sada formalno igru i jo neke koncepte reenja, kao to su Neov Ekvilibrijum. Da bi smo bili u stanju da analiziramo igru, neophodno je da znamo: Ko su IGRAI Koje akcije su im na raspolaganju Koliko svaki igra vrednuje svaki od moguih ishoda ta je to to svaki igra zna. Primetimo da nam je neophodno da znamo ne samo ta svaki igra zna o spoljnim parametrima, kao to je isplata, ve i ta je to to znaju o drugim igraima, znanje i uverenje o ovim parametrima, itd. U ovom seminarskom radu baviemo se igrama kompletnih informacija, gde je sve to je poznato igrau opte znanje1. (Kaemo da je X opte znanje, ukoliko svi znaju X, i svi znaju da svi znaju X, i svi znaju da svi znaju da svi znaju X, i tako do beskonanosti). REPREZENTACIJA IGRE Igra moe biti reprezentovana u dvema formama: 1. Normalna (strtegijska) forma 2. Opsenoj formi NORMALNA FORMA Definicija 4 Igra za n-igraa je lista G=(S1,...Sn; u1,...,un), gde je za iN={1,...n}, Si niz svih strategija koje su dostupne igrau i, i ui: S1...Sn je igaeva von Njuman-Morgetajnova korisnika funkcija2. Definicija 5 Normalna forma Normalna (strategijska) forma igre G sastoji se od Konanog niza igraa D={1,2,...,I} Niza strategija S1, S2,...,SI Funkcija isplate ui: S1...Sn (i=1,2,...,n) Pisaemo S= S1...Sn, sS emo nazivati strategijskim profilom (s=(s1,...,sI)). Sa s-i oznaavaemo izbor strategija svih igraa sem igraa i tj (s1,...,si-1,si+1,...,sI) Korisnika funkcija nekog igraa ne zavisi samo od njegove strategije ve i od strategija koju igraju ostali igrai. ta vie svaki igra i pokuava da maksimizira oekivanu vrednost korisnike funkcije(znaajno je napomenuti da je oekivana vrednost izraunata uzimjui u obzir sopstveno ubeenje igraa); drugim reima ui je von Njuman-Morgetajnova korisnika funkcija. Reiemo da je igra i racionalan ukoliko pokuava da maksimizira oekivanu vrednost funkcije ui (pod sopstvenim
1 Znanje je definisano kao operator koji zadovoljava sledee uslove: Ako I zna X, onda X mora biti istinit (true); Ako I zna X, onda I zna da I zna X; Ako I ne zna X, onda I zna da I ne zna X; Ako I zna neto, onda I zna sve logike implikacije tog neto. 2 Korisnika funkcija i funkcija isplate su korespondirajui termini
uverenjem)3. Pod pretpostavkom o optem znanju takoe spada i injenica da ima N={1,...,n} igraa, kao i niz strategija dostupnih za svakog igraa Si, kao i da svaki i pokuava da maksimizira oekivanu vrednost od ui obzirom na svoje uverenje. Kada imamo samo dva igraa, normalnu formu igre moemo predstaviti kao kvadratnu matricu
U ovom primeru igra 1 ima na raspolagaju strategije gore i dole, a igra 2 strategije levo i desno. U svakom polju prvi broj predstavlja isplatu prvog, a drugi broj isplatu drugog. Npr. u1(up,left)=0, u2(up,left)=2. RACIONALNO PONAANJE Pretpostavimo da uesnik i ima verovanje i o igri svojih protivnika. Verovanje je verovatnoa distribucije nad strategijskim nizom S-i. Definicija 6 Igra i je racionalan sa uverenjem i ukoliko
ili alternativno
Primetimo da je igra i suoen sa jednostavnim problemom odluke od trenutka kada formira verovanje i . OPSENA FORMA Opsena forma sadri sve informacije o igri, definiui ko se kada kree4, ta je to to svaki igra zna kada vri potez, koji potezi su mu dostupni, gde svaki potez vodi, itd., (u ovom smislu normalna forma je vie sumarna reprezentacija). Uvodimo neke pojmove i definicije. Definicija 7 Stablo je niz vorova i usmerenih ivica koje povezuju vorove na sledei nain: 1. Postoji inicijalni vor - koren, za koji ne postoje ulazne ivice; 2. Za svaki drugi vor, imamo jednu ulaznu ivicu5; 3. Za svaka dva vora, postoji jedinstvena putanja koja povezuje ta dva vora.
3 Ranije smo definisali znanje p.p. da ukoliko I zna neto, onda I zna sve logike konsekvence toga to spada u oblast racionalnosti 4 Ko vri koji potez 5 Broj izlaznih ivica zavisi od strategija
Primer 4 Stablo
Primer 5 Nije stablo jer postoje dva alternativna puta tj. taka A se moe dosegnuti preko taaka B i C.
Primer 6 Nije stablo jer A i B nisu povezani sa C i D
Definicija 8 Opsena forma Opsena forma igre G sastoji se od Konanog niza igraa D={1,2,...,I} Dodele lokacija svakom voru stabla (osim krajnjem odredinom voru) Podele informacija Isplate za svakog igraa u svakom krajnjem voru Niz igraa ukljuuje sve inioce koji uestvuju u igri. Meutim, u mnogim igrama postoji prostor za sluajnost, npr. Bacanje kockice, izvlaenje karata u pokeru. ire gledano, moramo da uraunamo sluajnost, kada god postoji neka nesigurnost u vezi nekih relevantnih injenica. Da bi smo reprezentovali tu mogunost uvodimo jo jednog igraa: Prirodu. Ne postoji isplata za Prirodu u krajnjem voru, i svaki put kada je vor dodeljen Prirodi, verovatnoa distribucije grana koja sledi mora biti specificirana, itd. Pismo sa verovatnoom od i Glava sa verovatnoom od . Niz informacija je kolekcija vorova {n1,...,nk}za koje vai 1. Isti igra i e napraviti potez na svakom od ovih vorova; 2. Isti potezi su dostupni na svakom od ovih vorova; Na osnovu ovoga imamo da igra i, koji pravi svoje poteze na osnovu informacionog niza, pretpostavlja se da nije u mogunosi da prepozna sve take (ivice) informacionog niza, ali je u stanju da napravi razliku izmeu taaka (ivice) izvan informacionog niza i onih taaka (ivice) unutar informacionog niza. Npr. razmotrimo igru na sl.1, vidimo da igra 2 zna da je igra 1 napravio akciju T ili B, a nije napravio akciju X; ali igra 2 ne moe zasigurno znati da li je igra 1 napravio akciju T ili B. Ista igra je opisana i na sl.2 ali sa izvesnom razlikom.
Slika 1
Slika 2 U informacionom delu se nalazi referenca svakog od vorova stabla (izuzev poetnog i zavrnog vora) na informacioni niz. Sumirajmo do sada izneene injenice. U svakom voru mi znamo sledee: koji igra je na redu da napravi potez, koji potezi su na raspolaganju tom igrau, i koji informacioni niz sadri ovaj vor, tako to sumiramo igraeve informacije u konkretnom voru. Naravno iz ovoga sledi, da ukoliko dva vora imaju isti informacioni niz, raspoloivi potezi u ovim vorovima moraju biti isti, u suprotnom igra ne moe da raspozna vor na osnovu dostupnih izbora. Napomenimo opet da za ove informacije pretpostavljamo da spadaju u opte znanje. Npr. u igri sa sl.1 igra 1 zna da ukoliko igra 1 napravi potez X, igra 2 e znati to, ali ukoliko napravi potez (na dole) T ili B, igra 2 nee znati koja od ove dve akcije je napravljena. (Znae da je napravljena jedna od njih, ali koja konkretno ne)
Definicija 9 Strategija igraa je kompletna kontigent-ravan (zavisna ravan-plan) koja determinie (odluuje) koju akciju e igra napraviti na svakom informacionom nizu, koji e potegnuti (ukljuujui informacioni niz koji nee biti dosegnut prema njegovoj strategiji). U izvesnim sluajevima, tj u izvesnim svrhama je dovoljno posmatrati redukovanu-formu strategije. Redukovana-forma strategije je definisana kao ne kompletna kontigent-ravan koja odluuje koju akciju e uesnik napraviti na svakom informacionom nizu koji e potegnuti, a koji ne moe biti iskljuen od strane ove ravni. Ali za uoptenu svrhu moramo da sagledamo sve strategije. Razmotrimo sada neke primere: IGRA 1: Bacanje novia sa Potpunim Informacijama
Stablo se sastoji od 7 vorova. Prvi vor je dodeljen igrau 1, a naredna dva igrau 2. etiri zavrna vora imaju informacije o isplati. Poto postoje 2 igraa vektor isplate ima dva elementa. Prvi element oznaava isplatu za igraa 1, a drugi za igraa 2. Isplate su ustvari von NjumanMorgentajnove korisnike funkcije, tako da moemo da uzmemo oekivanja (E matematika oekivanja) od njih i da proraunamo oekivanu korist. Informacioni deo je veoma prost; svaki vor ima sopstveni informacioni niz. Drugim reima, svi informacioni nizovi su jednostrani (imaju samo 1 element). Ovo implicira da ne postoji neizvesnost u odnosu na istoriju (prethodno odigrane poteze) igre. Podsetimo se da unutar stabla svaki vor je dosegnut putem jedinstvene putanje. Zbog toga, ukoliko su svi informacioni nizovi jednostrani, igra moe da kostruie istoriju igre savreno. Npr. u ovoj igri bacanja novia, igra 2 zna da li je igra 1 odabrao Glava ili Pismo , a igra 1 zna da kada odigra bilo Glava ili Pismo , igra 2 e znati da je to odigrao. (Igre u kojima su svi informacioni nizovi jednostrani nazivaju se igre savrenih informacija). U ovoj igri, niz strategija za igraa 1 je (Head,Tail). Strategija igraa 2 odreena je zavisno od toga ta igra 1 uini. Dakle, njegove strategije su:
HH = Glava ukoliko 1 odigra Glava, i Glava ukoliko 1 odigra Pismo; HT = Glava ukoliko 1 odigra Glava , i Pismo ukoliko 1 odigra Pismo; TH = Pismo ukoliko1 odigra Glava , i Glava ukoliko1 odigra Pismo; TT = Pismo ukoliko1 odigra Glava , i Pismo ukoliko 1 odigra Pismo. Koje su isplate generisane svakim strategijskim parom? Ukoliko igra 1 odigra Glava i igra 2 odigra HH, onda je ishod [1 bira Glava i 2 bira Glava] i tada je isplata (-1,1). Ukoliko igra 1 odigra Glava i igra 2 odigra HT, onda je ishod isti, odatle isplata je (-1,1). Ukoliko igra 1 odigra Pismo i igra 2 odigra HT, onda je ishod [1 bira Pismo a 2 bira Pismo] i tada je isplata (-1,1). I ukoliko igra 1 odigra Pismo i igra 2 odigra HH onda je ishod [1 bira Pismo a 2 bira Glava] odatle isplata je (1,-1). Ostale isplate - parove isplate raunamo slino. Normalizovana forma ove igre bi bila sledea
Informacioni nizovi su jako bitni! Da bi smo ovo uvideli, razmotrimo sledeu igru. IGRA 2: Bacanje novia sa Nepotunim Informacijama
Igre 1 i 2 izgedaju veoma slino ali sutinski korespondiraju dvema veoma razliitim situacijama. U Igri 1, kada pravimo potez, igra dva ne zna da li je igra 1 odabrao Glava ili Pismo. Ova vrsta igre se naziva igra nepotpunih podataka (Ovo znai da, jedan informacioni niz sadri vie od jednog vora). Strategija za igraa 1 je ista kao i ranije Glava i Pismo. Ali strategija igraa je drugaija nego u prvoj igri, sada se njegova strategija sastoji od Glava i Pismo (igra 2 sada nezna ta je igra 1 odigrao). Normalna forma zaovu igru e biti
IGRA 3: Igra sa Prirodom:
U ovoj igri pravino bacamo novi podrazumevajui pod time da je mogunost pojave bilo Glava bilo Pismo je . Ukoliko Glava padne prva igra jedan bira izmeu leve ili desne strane; ukoliko padne Pismo onda igra 2 bira izmeu leve i desne strane. Veba 5 Koja je normalna-forma za sledeu igru:
Da li moemo da naemo neku drugu opirniju-formu nego prethodnu reprezentaciju preko normalneforme? [Uputstvo: Za svaku opirnu-formu igre, postoji samo jedna reprezentacija normalnom-formom (sve do preimenovanja strategije), ali normalna forma igre obino ima vie nego jednu reprezentaciju opirnijim-formama.] U mnogim sluajevima igra moda nee biti u stanju da precizno uvodi koju vrstu strategije drugi
igrai igraju. Da bi smo uvrstili ovu situaciju uvodimo pojam meovite strategije. Definicija 10 Pod meovitom strategijom igraa podrazumevamo verovatnou distribucije nad nizom njegovih strategija. Ukoliko igra i ima strategije Si={si1,si2,...,sik}, onda je meovita strategija i za igraa i funkcija na Si za koju vai da je 0i(sij)1 i i(si1)+...+i(sik)=1. Ovde i predstavlja verovanja drugih igraa o izboru strategije igraa i. KAKO SE IGRATI? Sada emo opisati uobiajeni koncept reavanja za normalnu-formu igre. Prvo emo opisati pojam dominantna strategijska ravnotea6 koja je implicirana racionalnou igraa. Zatim emo diskutovati racionalnost koja korespondira optem znanju racionalnosti, i diskutovaemo Neov7 Ekvilibrijum, koje je povezano sa meusobnim znanjem igraevih pretpostavki o akcijama ostalih igraa. DOMINANTNA-STRATEGIJSKA RAVNOTEA Koristimo sledeu notaciju s-i to predstavlja listu strategija sj koju odigravaju svi igrai j i tj. S-i=(s1,...,si-1,si+1,...,sn) Definicija 11 Strategija si* je strogo dominantna nad si ako i samo ako ui(si*,s-i)>ui(si, s-i), s-iS-i. Ovo znai, nezavisno od toga ta drugi igrai igraju, odigravanje si* je strogo bolje nego odigravanje si za igraa i. U tom sluaju, ukoliko je igra i racionalan, on nikad nee odigrati strategiju si8 nad kojom je si* strogo dominantna. Stav 1 Ukoliko je igra i racionalan on nee odigrati strogo dominantnu strategiju. Dokaz: Ukoliko je strategija si strogo dominirana strategijom si* zakljuujemo da za bilo koje verovanje igraa i vaie
Meovita strategija i dominira nad strategijom si na slian nain: i strogo dominira nad si ako i samo ako
6 Ekvilibrijum-ravnotea(ove dve rei u ravnomerno koristiti) 7 John Nash, 1950. Nobelovu nagradu Ne je dobio 1994. god., za pionirsku analizu ravnotee u teoriji nekooperativnih igara. 8 Dakle, ne postoji verovanje pod kojim e on odigrati si. Da li je mogue ovo dokazati?
Racionalan igra i nikad nee odigrati strategiju si ako nad si dominira neka druga strategija (meovita ili ista). Na slian nain uvodimo definiciju slabe dominacije Definicija 12 Strategija si* slabo dominira nad si ako i samo ako ui(si*,s-i)ui(si, s-i), s-iS-i i za neko s-iS-i. ui(si*,s-i)>ui(si, s-i)
Dakle, nezavisno od toga ta drugi igrai odigraju, odigravanje si* je makar dobro kao i si, i postoje neke nepredviene situacije u kojima je odigravanje si* strogo bolje nego si. U tom sluaju, ako je igra i racionalan, odigrae strategiju si samo ukoliko veruje da te nepredviene situacije se nikad nee dogoditi. Ukoliko je oprezan u smislu da dodeljuje neku pozitivnu verovatnou za svaku nepredvienu situaciju, nee odigrati si. Definicija 13 Strategija sid je (slabo) dominantna strategija za igraa i ako i samo ako sid slabo dominira nad svim drugim strategijama igraa i. Strategija sid je strogo dominantna strategija za igraa i ako i samo ako sid strogo dominira nad svim drugim strategijama igraa i. Ukoliko je i racionalan, i ima strogo dominantnu strategiju sid, onda on nikada nee odigrati nijednu drugu strategiju. Ukoliko ima slabo dominantnu strategiju i opreznost, onda on nee odigrati nijednu drugu strategiju. Primer 7
U ovoj igri, igra 1 (firma) ima strogo dominantnu strategiju koja je zaposliti. Igra 2 ima samo slabo dominantnu strategiju. Ukoliko su igrai racionalni, i kao dopunski uslov igra 2 je oprezan, onda oekujemo od igraa 1 da zaposli, a od igraa 2 da zabuava:9
9 Postoji samo jedan ishod, predpostavljajui da je svaki igra racionalan i da igra 2 zna da je igra 1 racionalan. Kako moemo ovo da dokaemo?
Definicija 14 Strategijski profil sd=(s1d,s2d,...,sNd) je dominantna-strategijska ravnotea, ako i samo ako sid je dominantna strategija za svakog igraa i. Primer 8 Zatvorenika dilema10 Taker je poeo kratkom priom o dvojici provalnika Bobu i Alu. Oni su uhvaeni na mestu krae i svakom od njih, odvojeno data je ponuda smanjivanja kazne na tree-stepeni prekraj. Svaki od njih mora da izabere da li da prizna i prebaci krivicu na drugog ili ne. Ukoliko ni jedan od njih ne prizna obojica e odsluiti kaznu zatvora u trajanju od godinu dana, po optunici za ne dozvoljeno noenje oruja. Ukoliko bilo koji od njih prizna i svali krivicu na drugog, a ovaj drugi ne prizna, onaj koji je saraivao sa policijom e otii slobodan, dok e ovaj drugi sluiti kaznu u maksimalnom trajanju od 20 godina. Strategije u ovom sluaju su: priznati ili ne priznati. Isplata je (penalties, actually) i to su presude. Razmotrimo sada matricu isplate.
Priznati je strogo dominantna strategija za oba igraa, to znai (confess, confess) je dominantna strategijska ravnotea. Primer 9Aukcija druga-cena Imamo cilj biti prodan putem aukcije. Postoje dva kupca. Vrednost objekta za bilo kog kupca i je vi, koja je poznata kupcu i. Svaki kupac i daje ponudu bi u zatvorenoj koverti, simultano. Zatim koverte se otvaraju; uesnik i* koji da najveu ponudu bi*= max {b1,b2} dobija objekat i plaa drugu najveu ponudu (koja je bj za ji*).(Ukoliko vie kupaca ponude najviu ponudu, biramo jednog od njih pomou bacanja novia.) Formalno igra je definisana nizom igraa N={1,2}, strategijom bi, i isplatom
gde je ij. U ovoj igri, ponuivanje prave vrednosti vi je dominantna strategija za svakog igraa i. Da bi smo ovo uvideli razmotrimo strategiju nadmetanjem nekom drugom vrednou bi' vi za proizvoljno i. elimo dakle da pokaemo da je nad bi' strategija vi slabo dominanatna. Razmotrimo sluaj bi' < vi . Ukoliko drugi igra da ponudu bj < bi' , igra i e biti vi-bj ispod obe strategije bi' i vi . Ukoliko drugi igra da ponudu bjvi , igra i e biti 0 ispod obe strategije bi' i vi . Ali ukoliko bj = bi' , ponuda vi
10 Ovaj dilema je nastala unutar uionice tokom predavanja profesora Albert W. Tucker na Stanfordskom univerzitetu 1950. Pokuavajui da ilustruje teinu analiziranja izvesnih igara Taker je dao jedan od najee razmatranih primera teorije igre. Zato u taj primer navesti onako kako ga je Taket opisao.
davae dobit vi-bj>0, dok bi' daje dobit samo (vi-bj)/2. Slino, ukoliko je b '< bj < vi, ponuda vi davae dobit vi - bj > 0, dok bi' daje dobit samo 0. Zbog toga, ponuda vi dominira nad bi'. Sluaj bi' > vi je slian, izuzetak je kada je bi' > bj > vi, ponuda vi daje dobit 0, dok b'i dobit je negativna isplata vi - bj < 0. Zbog toga je , ponuda vi dominantna strategija za svakog igraa i.
i
Veba 11 Proirimo ovaj primer na n-kupaca. Kada postoji, dominantna strategijska ravnotea ima oiglednu privlanost. U tom sluaju, racionalnost igraa nalae da odigra dominantnu strategijsku ravnoteu. Meutim, takva strategija generalno ne postoji. Primer 10 Borba Polova Naredna igra, treba da predstavlja stidljivi prvi sastanak (mada postoje i druge igre iz ivotinjskog ponaanja koje vie zasluuju ovu titulu). Oboje i mukarac i ena ele da budu zajedno vie nego da budu sami. Meutim, kako su stidljivi, oni se ne dogovaraju za taan sastanak. Oboje se nadaju da e se nai bilo na baletu ili operi. ena preferira balet, a mukarac operu.
Oigledno ni jedan igra nema dominanatnu strategiju:
RACIONALIZABILNOST ILI ITERATIVNO ELIMINISANJE STROGO DOMINANTNIH STRATEGIJA Razmotrimo sledeu igru Primer 11 Proirena Zatvorenika dilema
U ovoj igri, nijedan uesnik nema dominantnu strategiju, ali postoji dominantna strategija: pobei je srogo dominirana strategijom priznati (i za 1 i za 2). Sada razmotrimo problem drugog igraa. On zna da je prvi racionalan, pa moe da predvidi da 1 nee izabrati pobei, pa moe da eliminie pobei i da posmatra manju igru
tako smo eliminisali pobei zato to je strogo dominantna; igra iz kolone rezonuje da igra iz vrste nikad nee izabrati tu strategiju. U manjoj igri, 2 ima dominantnu strategiju priznati. Dakle ukoliko je 2 racionalan i zna da je igra 1 racionalan, odigrae priznati. U prvobitnoj igri ne priznaj je bolje prolazilo od pobegni pa priznati nije bila dominantna strategija. Meutim igra 1 igrajui pobei ne izraava racionalnost jer je to dominantna strategija. Ovim dolazimo do Eliminacije Strogo Dominantnih Strategija. ta se deava ukoliko Iterativno Eliminiemo Strogo Dominantnu Strategiju? Znai elminiemo strogo dominantnu strategiju, pa zatim traimo jo neku strogo dominantnu strategiju u redukovanoj igri. Zaustavljamo se kada vie ne moemo da neemo strogo dominantnu strategiju. Jasno, ukoliko je racionalnost igraa opte znanje, igrai e igrati strategiju koja preivljava iterativnu eliminaciju strogo dominantnih strategija. Zato, ove vrste strategija nazivamo racionalizabilnim. Napomena: eliminiemo strategije nad kojima dominiraju neke meovite strategije! U prethodnom primeru niz racionalizabilnih strategija je priznati , priznati. Ono to je osnovno je da budemo sigurni da moemo generisati (pribaviti) prepostavku o racionalanosti u svakoj eliminaciji. Npr. u navedenoj igri, igra 2 zna da je igra 1 racionalan pa on nee pobei i poto je i on racionalan odigrae priznati jer priznati je jedini najbolji odgovor za bilo koje vrerovanje koje igra 2 moe da ima jer se uporeuje sa verovatnoom 0 da e igra 1 odigrati pobei. Problem koji nastaje je da moe da postji preveliki broj racionalizabilnih strategija. Razmotrimo primer bacanja novia:
Ovde je svaka strategija racionalizabilna. Npr ukoliko igra 1 veruje da e irga 2 odigrati Glavu , onda e on odigrati Pismo. Dakle strategijski par (Head, Tail) je racionalizabilan. Ali primetimo da verovanja igraa 1 i 2 nisu podudarna. Niz racionalizabilnih strategija je generalno veoma velik. Suprotno tome koncept dominantno strategijskih ravnotea je previe restriktivan: obino ne postoji.
Razlog postojanja prevelikog broja racionalizabilnih strategija se nalazi u tome da mi ne restrikujemo igraeve pretpostavke da budu dosledne stvarnim akcijama ostalih uesnika. Npr u racionalizabilnoj strategiji (Head, Tail), igra 2 odigrava Pismo zbog pretpostavke da e 1 odigrati Pismo, dok igra 1 ustvari igra Glavu. Razmatramo sada jo jedan koncept Neov Ekvilibrijum skraeno NE, koji podrazumeva meusobno poznavanje pretpostavki, davanje dobiti je sadrano u tome. NEOV EKVILIBRIJUM Razmotrimo sledeu igru borba polova.
U ovoj igri ne postoji dominanatna strategija. Ali, pretpostavimo da ena odigrava operu. U tom sluaju najbolje to mukarac moe da uradi je da i on odigra operu. Dakle, opera je najbolji protiv odgovor za mukarca protiv opere. Slino opera je najbolji protiv odgovor za enu protiv opere. Dakle, pri paru (opera, opera), nijedna strana ne eli da napravi drugaiju akciju. Ovim smo opisali Neov Ekvilibrijum. Formalnija definicija sledi
Definicija 15 Za bilo kog igraa i, strategija siBR je najbolji odgovor (protiv odgovor) na s-i ako i samo ako ui(siBR,s-i)ui(si, s-i), siSi Ova definicija je identina sa definicijom dominantne strategije, samo to ova druga ne vai za svako s-iS-i ve samo za specifinu strategiju s-i. Ako bi ona vaila za svako s-i onda bi SiBR bi takoe bila dominanatna strategija, to je jai zahtev nego zahtev da bude najbolji odgovor protiv neke strategije s-i. Definicija 16 Strategijski profil (s1NE,...,sNNE) je Neov Ekvilibrijum ako i samo ako siNE je najbolji odgovor na s-iNE=(s1NE,...,si-1NE,si+1NE,...,sNNE) za svako i. Dakle za svako i, imamo da vai ui(siNE,s-iNE)ui(si, s-iNE), siSi Drugim reima, nijedan igra nee imati podsticaj da odstupa (od svoje strategije), ukoliko zna koju strategiju e drugi igrai igrati. Ukoliko je strategijski profil dominanta-strategija ravnotea, onda je on takoe i NE, ali ne vai obrat. Npr. U borbi polova oba (O,O) i (B,B) su Neovi Ekvilibrijumi, ali nijedan od njih nije dominanatna-strategija ravnotea. ak ta vie, dominanatna-strategija ravnotee je jedinstvena, a kao to to igra borba polova pokazuje, Neov Ekvilibrijum generalno gledano nije.
Zato se Neov Ekvilibrijum podudara sa racionalizabilnim strategijama? Generalno: Da li su sve racionalizabilne strategije Neovi Ekvilibrijumi, i obratno? Gornja definicija pokriva samo iste strategije. Moemo definisati Neov Ekvilibrijum za meovitu strategiju menjajui istu strategiju meovitom. Imajui u vidu, da za meovite strategije ostalih uesnika vai da svaki uesnik maksimizuje sopstvenu oekivanu isplatu nad sopstvenom (meovitom) strategijom11. Primer 12 Razmotrimo ponovo Borbu polova u kojoj smo uoili 2 iste strategijske ravnotee. Pored istih strategijskih ravnotea, postoji i meovita stradegijska ravnotea.
Neka je q verovatnoa da e mukarac otii u operu; sledi da jeverovatnoa da ode na balet 1-q, neka je zatim p verovatnoa da ena ode u operu. Odavde moemo izraunati oekivanu korist
Primetimo da term [4q] pomnoen sa p je njena oekivana korist od odlaska u operu, a da isti tem pomnoen sa (1-p) je njena oekivana korist od odlaska na balet. U2(p;q) strogo raste u odnosu na parametar p, ukoliko je 4q>1-q( q>1/5); a strogo opada u odnosu na p ukiliko je 4q<1-q, i konstantna je 4q=1-q. U tom sluaju, enin najbolji odrovor je p=1 ako q>1/5, p=0 ako q<1/5, i p je proizvoljan broj iz intervala [0,1] ako je q=1/5. Drugim reima ena e odabrati operu ukoliko je njena oekivana korist od opere vea, boriti se ukoliko je njna oekivana korist od baleta vea, ili moe odabrati bilo koji od ova dva ukoliko je indiferentna izmeu ova dva. Slino izraunavamo da je q=1 najbolji odgovor ukoliko je p>4/5; q=0 je najbolji odgovor ako je p<4/5; i proizvoljno q je najbolji odgovor ako je p=4/5. Skiciraemo najbolji odgovor sledeim grafikom
11 U terminima verovanja, ovo odgovara sledeem uslovu, ukoliko i dodeli pozitivnu verovatnou dogaaju da j moe da odigra partikularno istu strategiju sj, onda sj mora biti najbolji odgovor uzimajui u obzir j-tova uverenja.
Neov Ekvilibrijum je mesto gde s najbolji odgovori seku. Postoji presek u (0,0), kada oboje odu na balet, zatim (1,1), kada oboje odu u operu, i postoji jo jedan presek u (4/5,1/5), kada ena ode u operu sa verovatnoom 4/5, i mukarac ode u operu sa verovatnoom 1/5.

TI Seminarski 2

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

TI Seminarski 2

Uploaded by

Copyright:

Available Formats

UVOD

OSNOVNE KARAKTERISTIKE I VRSTE IGARA

Primer 6 Nije stablo jer A i B nisu povezani sa C i D

IGRA 3: Igra sa Prirodom:

Oigledno ni jedan igra nema dominanatnu strategiju:

You might also like