1397131841-16-Teorija Igara - Vezbe 2014

МАТЕМАТИЧКИ
ФАКУЛТЕТ ТЕОРИЈА ИГАРА
ВЕЖБЕ, 2014.
Марија Ивановић | marijai@math.rs

Увод
Теорија игара представља грану математике која своју примену налази у многим областима
нашег живота. Игре попут шаха, покера, фудбала, компјутерских игара се могу представити
математичким моделом који играчима може сугерисати како да се понашају да би постигли најбољи
резултат. Наведене игре се користе као разонода али права примена теорије игара је у социологији,
економији, биологији, инжењерингу, политичким наукама, рачунским наукама, психологији и
другим областима свакодневног живота. Преговори, такмичење међу фирмама за превласт на
тржишту, пласирање новог бренда само су неке од примена ове области.
Неки проблеми из теорије игара спомињу се још у V веку ове ере. Наиме, збирка древне
традиције и закона, The Babylonian Talmud, формирана током првих пет векова нове ере, која служи
као основа јеврејске вере, кривичног и грађанског права садржи, између осталог, проблем тзв.
брачног уговора у коме се наводи следеће: Човек који је за живота склопио брачни уговор три пута,
након смрти, својим женама оставља по 100, 200 односно 300 тадашњих новчаних јединица
(скраћено н.ј). У случају да укупно наслеђе износи само 100 н.ј тада се међу женама сугерише
једнака подела тог наслеђа, док је за укупно наслеђе од 300 н.ј расподела пропорционална
првобитном правилу и износи 50, 100 и 150 н.ј. Мистерија настаје када је укупно наслеђе 200 н.ј. које
се распоређује тако да жене добијају по 50, 75 и 75 н.ј. Дуго се постављало питање, како је
дефинисна последња подела и да ли је она коректна. Проблем је демистификован тек 1985.год. када
се дошло до закључка да свака подела одговара језгру коректно дефинисане кооперативне игре.
Са друге стране, првe забележене дискусије о теорији игара су из 1713.год. када је James
Waldegrave у свом писму написао прву познату минимакс мешовиту стратегију за каратшку игру Le
Her. Следи рад Augustin Cournot-а на тему дуопола објављен 1838.год. који садржи концепт решења
једне верзије Нешове равнотежне тачке, затим рад Ernst Zermelo-а који нуди одговор на питање да
ли у шаху бели играчи могу увек да обезбеде победу односно нерешену игру, па радови Emil Borel-а
из периода 1921-1927. када је објављена прва модерна формулација мештовите стратегије односно
минимакс решење игре за два играча са две или више могућих стратегија. Borel је у почетку тврдио
да игре са више могућих стратегија немају минимакс решење да би 1927.год ово оставио као
отворено питање јер сам решење није могао да пронађе. John von Neumann 1928.год. објављује
доказ минимакс теореме где доказује да се за сваку игру са нултом сумом за два играча и коначним
бројем стратегија може наћи победник, уз то да ако су дозвољене мешовите стратегије, постоји
тачно једно решење. John Von Neumann се иначе сматра творцем теорије игара, а књига коју је
написао у сарадњи са економистом Oskar Morgenstern-oм, „Теорија игара и понашање у економији”
[25] се наводи као прва такве врсте.
Значајан допринос, поред поменутих аутора, имали су Јohn Nash који је развио Nash
equilibrium и Thomas Schelling коме је дело The Strategy of Conflict [28] донело Нобелову награду,
затим Јohn Owen, Shmuel Gal, Steve Alpern и још многи други.
2
1. ОСНОВНИ ПОЈМОВИ, ДЕФИНИЦИЈЕ И ПОДЕЛА
Под појмом игре подразумевамо модел реалне конфликтне ситуације са једним или више
учесника. Теорију игара дефинишемо као научну дисциплину за решавање проблема конфликтних
ситуација.
Игру могу чинити један или више играча, тимови, групе, предузећа. Поред њих, на исход игре могу
да утичу и други фактори који ту игру описују. Учесник игре, када на њега дође ред да игра, повлачи
потез који се састоји у избору елемента из неког скупа.
Сваки учесник располаже неком информацијом о томе шта други могу да изаберу и шта им је циљ,
односно колико ће свако добити након повучених потеза, тј. по завршетку игре.
Основно питање у теорији игара је које потезе учесници треба да повлаче да би остварили свој циљ
и шта ће бити резултат ако свако игра најбоље могуће.
Циљ игре се дефинише функцијом исплате која представља нумерички израз добитка односно
губитка учесника неке игре. Поред потеза учесника, постоје и случајни потези који такође утичу на
функцију исплате.
На почетку игре сваки играч има своју почетну позицију.

На свакој позицији играч располаже скупом различитих
алтернатива (скуп алтернатива обележавамо са a {a1, a2 ,..., am} )
које ће га довести до краја игре, односно до наредне позиције.
Избор једне од алтернатива називамо потезом.
Играч своје потезе бира од почетка до краја игре а изабрани низ
називамо пут.
При сваком понављању игре, играч може да бира друге потезе
уколико му скуп алтернатива то дозвољава и да формира
другачије путеве, нпр: (a2 , a4 , a5 , a12 ) , (a3 , a4 , a7 , a12 ) .
Пут који играч изабере од почетка до краја игре називамо стратегијом и обележавамо са
Ai  (ai , ai ,.., ai ),  a, ik  1, 2,.., n .
ai
1 2 m k
Стратегија представља централни појам теорије игара и њом се унапред дефинишу могући избори
различитих алтернатива од стране играча за које се они могу определити у сваком стадијуму игре и
за сваку могућу историју игре од њеног почетка до њеног краја. Стратегија мора да садржи
комплетан план који ће узети у обзир све случајеве који се могу десити у току игре и да предвиди
исход за сваку информацију која би се могла добити у току игре. Приликом формирања стратегије од
играча се очекује да размишљају рационално и да доносе одлуке које су најбоље за њих. У сваком
стадијуму игре играч има могућност да размисли о свом наредном потезу или да пре самог почетка
игре испланира, независно од потеза осталих учесника игре, како ће се игра одвијати до краја. Скуп
свих стратегија једног играча називамо простором стратегија.
3
Постоје различите врсте игара при чему се као критеријуми за класификацију узимају број учесника,
број потеза учесника, доступност информација, функција исплата и други. Да би се формирао модел
неке конфликтне или кооперативне ситуације неопходно је учешће најмање два учесника док
постојање три или више учесника отвара могућност стварања тзв. коалиција, односно могућности да
се играчи усклађујући своје интересе координисано опредељују у избору стратегија. Најчешће се
проучавају игре са два играча обзиром да је са већим бројем играча проблем моделирања
сложенији док игре са једним играчем спадају у екстремне случајеве.
У зависности од броја стратегија разликујемо коначне и бесконачне игре.

Игре у којима учесници имају право на само један потез називамо једнопотезним (енг. one-
shot), у супротном вишепотезним играма.
Код игара које се понављају играчи имају могућност да се предомисле и да при сваком
понављању бирају другачије потезе. Уколико се одређени потези бирају са вероватноћом p  1 такву
стратегију називамо чистом стратегијом (енг. pure strategy) док су мешовите стратегије (енг.
mixed strategy) оне стратегије у којима се чисте стратегије (ai ,.., ai ) комбинују са вероватноћом
1 m
m m
p {( p1, p2 ,.., pm )  R |  pi  1, i  1,.., m}, s  p1ai  p2 ai  ..  pmai .
i1 1 2 m
Тотално мешовитом стратегијом дефинише се стратегија у којој играч свим својим чистим
стратегијама додељује строго позитивну вероватноћу.
Стратегију која i-том играчу одређује који потез из скупа алтернатива да направи у датом
тренутку обележавамо са si . Кажемо да игра има стратегију s  (s1, s2 ,..., sn ако су са s1, s2 ,.., sn
)
обележене стратегије свих n играча. Ознаку si користимо за стратегију игре која не садржи
стратегију i-тог играча. Оптималном стратегијом сматрамо ону стратегију играча која му при
вишеструком понављању игре обезбеђује максимални могући средњи добитак. Добитак који i-ти
играч осваја играњем стратегије Ai одређен је функцијом исплате f, тј. кажемо да је i-ти играч
добио износ fi  f (Ai ) . Концепт решења игре и оптималних избора играча јасан је у само малом
броју конфликтних ситуација.
Према карактеру функције плаћања све игре делимо на игре са нултом сумом1 (енг. zero-sum) и
игре са ненултом сумом (енг. nonzero-sum). Игра са нултом сумом представља игру у којој сваки
играч гарантује одређени износ (исплату) као исход игре независно од осталих играча и њихових
стратегија тако да победник игре добија све загарантоване износе док су поражени на губитку за
износ који су гарантовали а укупна сума исплата свих учесника игре износи нула,
n
f (A1, A2 ,..., An )  f (Ai )  0 .
i1 n
i

Односно „да би неко победио у игри, неко други мора да изгуби“.

Поред овог, загарантованог износа, нема других трошкова или добитака.
Игре у којима су интереси играча сукобљени називамо антагонистичким играма. Игре са

ненултом сумом често немају оптималну стратегију и дефинишу се као игре код којих се апсолутне
вредности сума позитивних и сума негативних исплата разликују, односно сума свих исплата није
једнака нули. Игра са ненултом сумом са n играча се додавањем једног играча може превести на
игру са нултом сумом са (n 1) -им играчем.
У зависности од међусобног односа играча, све игре делимо на кооперативне и

некооперативне.
1
Наведени тип игара први је поменуо Rufus Isaacs [22] 60их година прошлог века а на њиховом развоју су радили S.
4
Alpern [1], J.G. Foreman [32] и M. Zelinkin [33]. Највећи допринос је имао S. Gal [18].
5
Кооперативне игре представљају такву врсту игара у којима играчи формирањем коалиције и
усклађивањем избора појединачних стратегија имају за циљ постизање најповољнијих резултата за
коалицију којој припадају.
Уколико је сваки играч изабрао стратегију тако да ниједан не може да профитира променом своје
стратегије под претпоставком да остали играчи не мењају своје стратегије тада кажемо да тренутни
скуп изабраних стратегија, и одговарајућих добитака представља Нешов еквилибријум (енг. Nash
equilibrium). Односно концепт решења игре у коме је сваки играч донео најбољу могућу одлуку
узевши у обзир одлуке свих осталих играча називамо равнотежном стратегијом. Код формирања
равнотежних стратегија треба узети у обзир то да оне не морају постићи највећу збирну добит за све
играче. Често играчи могу да повећају своју добит ако би некако могли да се договоре око симултане
промене своје стратегије. Пример таквих договора је код конкурентних трговаца.
Уколико у току игре не постоји координација у понашању од стране учесника, за такву игру
кажемо да је некооперативна2, тј. антагонистичка.
Једна од класификација игара зависи од доступности информација па тако разликујемо игре

код којих не постоји потпуна информисаност играча о потенцијалним одговорима противника на
њихов избор појединачних стратегија за који је карактеристично да се резултат свих потеза
обрачунава тек на крају игре, када се одигра предвиђени број потеза, односно реализује једна
партија. Наведени тип игара има екстензивну форму (енг. Extensive form) и обично се представља
преко одговарајућег стабла. Други поступак представљања и анализирања игре примењује се у
ситуацији тзв. пуне информисаности о потенцијалним резултатима одабраних стратегија од стране
играча. Код овакве врсте игре, коју називамо игром у нормалној форми за све алтернативне
комбинације одабраних стратегија од стране играча унапред су позната плаћања, односно резултат
игре. Поред екстензивне форме, игре могу имати коалициону и стратегијску форму. Код
коалиционих модела подаци о стратегијама су небитни, битне су коалиције и вредности тих
коалиција. Претпоставља се да свака коалиција може да гарантује својим члановима одређени
износ, који називамо вредност коалиције. Коалиционе игре припадају кооперативној теорији, и
једно од главних питања је како ће се коначни исход поделити у гранд коалицији коју чине сви
играчи. Минимум вредности који ће свака коалиција примити називамо jezgro (енг. core). До сада је
дефинисано више начина поделе укупне вредности међу играчима а неки од њих су Шеплијева
вредност (енг. Shapley value) и језгро (енг. nucleus). Основни елементи стратегијског модела су
стратегије и исходи тих стратегија. Стратегијски модел је формиран тако да сваки играч из скупа
алтернатива бира једну а исход игре зависи од скупа свих изабраних стратегија. Приликом избора,
сваки играч размишља о потезима других играча и њиховим могућим стратегијама како би на основу
укупног утиска себи изабрао најповољнију стратегију. Играчи бирају своје стратегије истовремено.
Након избора стратегија игра се завршава и сваки играч добија одређену добит. Коначна добит
сваког играча зависи од свих изабраних стратегија. Стратегијски модели игре се још називају и
нормалним моделима.
2
John Nash, John Hаrsanyi и Reinhard Selten су 1994. године добили Нобелову награду из економије за рад у области
некооперативне теорије игара.
6
Анализираћемо најједноставнију игру са два играча чији су интереси директно
супротстављени. Обојици играча познати су скупови могућих избора X и Y, као и функција плаћања,
f : X Y  R . Игра има прост ток:
Први играч бира елемент x из свог скупа могућих избора X.
Други играч, не знајући шта је први изабрао, бира један елемент y из свог скупа могућих
избора Y.
Затим први играч добија износ f (x, y) а други  f (x, y) .
Циљ сваког играча је да добије што више. Како је збир добитака нула, колико један од играча
добије, толико други изгуби. Стога је циљ другог играча, заправо, да први играч добије што мање.
Овакав тип игре је антагонистички, односно ово је игра са нултом сумом за два играча.
Први играч може себи да гарантује добитак u ако је за неко x  X , f (x, y)  u, y Y .
Највећи добитак који може да оствари први играч, без обзира како је други играо, је оптимална
вредност проблема
max u п.о x  X f (x, y)  u, y (1)
. и Y
Слично, други играч може да ограничи добитак првог играча на оптмалну вредност проблема
min v п.о y Y f (x, y)  v, x  (2)
. и X
Ако су (x, и (v, y) произвољне допустиве тачке проблема (1) и (2) онда је и u  f (x, y) и f (x, y)  v па
u)
је и u  v . Стога оптимална вредност проблема
(1) није већа од оптималне вредности проблема (2).
У случају да су оптималне вредности (1) и (2) једнаке, постоји реалан број w такав да први
играч може да гарантује добитак w без обзира како је други играо, док други играч може да
гарантује да први не може добити више од w ма како играо. Такав број w се назива вредност игре.
Избори xˆ и yˆ такви да су (xˆ, w) (w, оптимална решења проблема (1) и (2), називају се
и yˆ)
оптимална стратегија првог, односно оптимална стратегија другог играча.
Описан случај односи се на избор чистих стратегија играча. Сличан резултат може се постићи
формирањем мештовитих стратегија при вишеструком понављању игре а следећа теорема нам
гарантује оптималност игре.
Минимакс теорема3: За сваку коначну игру са нултом сумом са два играча
1) постоји број w који се назива вредност игре,
2) постоји мешовита стратегија првог играча тако да очекивана вредност игре буде најмање
w независно од потеза другог играча и
3) постоји мешовита стратегија другог играча тако да његов очекивани губитак буде највише
w независно од потеза првог играча.
Ако је број w jeднак нули, кажемо да је игра фер (енг. Fair). За позитивну вредност броја w кажемо да
игра фаворизује првог играча док се за негативно w фаворизује други играч. Функцију исплате за
коначне стратегијске игре са два играча најлакше је представити матрично па се често такве игре
називају матричним играма.
Дефиниција: Матрична игра је игра за два играча која на располагању имају m, односно n
стратегија ( m, n  N, m, n  1) дефинисана на следећи начин: Играчи се договарају да ли ће њихове
страгегије бити представљене колонама или врстама матрице тако да елементи матрице буду
исплате за одговарајући избор стратегија, тј. ако је играч чије су стратегије представљене врстама
изабрао стратегију x а играч чије су стратегије представљене колонама изабрао стратегију y тада
вредност f (x, y) представља одговарајућу исплату.
7
3 Доказ минимакс теореме се може наћи у [7], страна 291-293.
8
Пример 1: (Писмо - глава)
Два играча истовремено бацају новчић. Уколико код оба играча падне писмо или код оба играча
падне глава, први играч добија новчић од другог играча. Ако падну различите стране исплата је
обрнута. Решити матричну игру.
Матрица исплате представљена је табелом бр. 1.1.
Матрица исплате, Табела бр. 1.1
Други играч
Писмо Глава
Писмо 1 -1
Први играч Глава -1 1
Оптимална вредност проблема (1) је -1 док је оптимална вредност проблема (2) 1 те игра нема
вредност. Уколико се игра понавља више пута, добијени резултати се могу „поправити“ и може се
добити вредност игре.
Претпоставимо да се глава и писмо бацају са једнаким вероватноћама, p(писмо)  p(глава)  1/ 2 .
Први играч, уз претпоставку да ће други бацити писмо може постићи оптималну вредност
f (x, писмо)  1 p(писмо)  (1)  p(глава)  0 , f (x, глава)  (1)  p(писмо) 1 p(глава)  ако је други
0
односно бацио главу.
Слично, оптимална вредност игре за другог играча уз претпоставку да први баца писмо износи
f (писмо, y)  (1)  p(писмо) 1 p(глава) , f (глава, y)  1 p(писмо)  (1)  уз претпоставку да
p(глава)
односно први баца главу.
Приметимо да су оптималне вредности оба проблема једнаке, па тако игра има вредност која износи
w0.
У већини случајева игре нису са нултом сумом и исплате које играчи добијају не морају да
зависе једна од друге. Код таквих игара се за сваког играча посебно формира матрица исплате,
односно код игара са два играча уместо две матрице може да се користи једна биматрица при чему
први елемент поља матрице представља исплату за првог играча а други елемент исплату за другог
играча.
Пример 2:
Двојица лопова су након почињеног прекршаја ухваћена и доведена на саслушање. Саслушање се
изводи за сваког починиоца прекршаја посебно а како полиција нема довољно података да их
оптужи за прекршај нуди следећи договор: Онај лопов који пристане да сарађује биће ослобођен
кривице док ће његов саучесник служити казну у трајању од 12 месеци затвора. Уколико оба лопова
пристану на сарадњу и признају кривицу, осуђују се на казну у трајању од 3 месеца, односно уколико
ни један од лопова не буде сарађивао услед недостатака доказа биће осуђени на 1 месец затвора за
неке друге ситне прекршаје за које полиција има доказа. Ако се претходно нису договорили, како да
се лопови понашају након ове понуде тако да себи обезбеде минималну дужину затворске казне?
Описан проблем познат је као Дилема затвореника. Дужина трајања казне представљена је
биматрицом исплате, у табели број 1.2.
Биматрица исплате, Табела бр. 1.2
Лопов 2
Не сарађује Сарађује
Не сарађује (1,1) (12,0)
Лопов 1 Сарађује (0,12) (3,3)
Лопови не знају како ће њихов саучесник да се понаша и желе да постигну најбољи договор за себе.
Уколико сарађују лоповима се отвара могућност служења казне у трајању од 0 или 3 месеца што је
бољи резултат од оног који би постигли када не би сарађивали (дужина трајања казне била би 1 или
12 месеци). Пре него што наставимо анализу проблема уводимо појам доминантности.
9
Дефиниција: Кажемо да i-та врста матрице Amn доминира над k-том врстом ако f (i, j)  f (k, j) за
је
свако ј. Кажемо да i-та врста строго доминира над k-том врстом ако је f (i, j)  f (k, за свако ј.
j)
Слично, j-тa колона матрице Am доминира (строго доминира) над k-том колоном ако је
n
f (i, j)  f (i, k) ( f (i, j)  f (i, k) ) за свако i.
Ако i-та врста доминира над k-том врстом, k-ту врсту можемо да обришемо обзиром да она не утиче
на коначни исход игре. Аналогно, ако ј-та колона доминира над l-том колоном, l-та колона се такође
може обрисати па се тако димензија матричне игре може смањити. Мешовите стратегије такође
могу да буду доминантне.
Коришћењем особине доминантности следи да ће оба лопова сарађивати (елиминисати колону не
сарађује) што ће их довести у тзв. „lose-lose“ ситуцију и затворску казну у трајању од 3 месеца. Да су
имали могућност договора, лопови би себи могли да обезбеде казну у трајању од 1. месеца.
Стратегије (не сарађује, не сарађује) и (сарађује, сарађује) се називају равнотежним стратегијама.
Преговори су једна од примена теорије игара. Дилема затвореника је дефинисана тако да се од
лопова очекује да ће изабрати опцију сарађуј.
Пре него што наставимо са анализом и решавањем игара, задржимо се на преговорима и на
претпоставкама које се иначе односе на њихове учеснике. Најпре претпоставља се да су играчи
савршено рационални појединци који настоје да максимизују своју добит, односно да постигну што
бољи резултат који одговара њиховим властитим критеријумима. Под рационалним понашањем
подразумевамо да се одлука доноси и на основу предвиђања (антиципације) могућих потеза
противника. Играчи ће често замишљати да се налазе на месту свог конкурента како би могли да
предвиде његове потезе и у складу са тим прогнозама одреде своју стратегију. Да би то било могуће,
претпоставља се да не постоје интелектулане, искуствене и друге разлике између играча, односно у
питању су играчи који се сматрају равноправним противницима. Такође се претпоставља да играчи
располажу потпуном информацијом о могућим стратегијама и резутатима које свако од њих
остварује. Да закључимо, да су лопови рационално сагледали своју и ситуацију свог саиграча
определили би се за опцију не сарађуј и мање времена провели у затвору.
Два рационална појединца, уколико добровољно ступају у преговоре на основу ранијих искустава и
договора знају све могуће исходе тих преговора па им могу приписати одређене нумеричке
вредности као ниво корисности. Скуп свих резултата које појединци могу да остваре представњају
тзв. доступну област. На почетку се из доступног скупа одређује једно решење проблема, без
претходних договора преговарача. Такво решење називамо status quo (нпр. (x*, y*) ). Из доступног
скупа, обзиром да су савршено рационални, преговарачи неће посматрати сва решења већ само она
која су парето оптимална4. Из тако одређене недоговорене позиције позитивним линеарним
трансформацијама играчи долазе до позиција које ће им омогућити већу корисност, па ће
договорена стратегија уједно бити и парето максимална.
Слика бр. 1.1, Преговачки скуп

На слици бр.1.1 приказани су доступни скуп, недоговорена позиција N и преговарачки скуп P.
Преговарачки скуп чине они стратегијски парови који ће играчима донети већу добит од оне која им
следује у случају да нису постигли договор. Ако је исплата у договорној стратегији уређени пар (xˆ,
yˆ)
1
4
Парето оптимална су она решења у којима оба игрча постижу боље исходе у односу на не-ефикасна решења. Скуп свих
парето оптималних тачака чини тзв. преговарачки скуп P
1
следи да ће играчи постизањем договора поправити свој резултат за износ xˆ  x * , односно износ
yˆ  y * . Ако скуп P садржи само један избор стратегија, тада је проблем тривијалан и договор ће
одмах бити постигнут. Уз претпоставку да се у преговарачком скупу налазе најмање две алтернативе
које играчи различито преферирају добијамо проблем одређивања договорне стратегије.
Претпоставимо да важе следеће аксиоме:
А1: Договорна стратегија (xˆ, yˆ ) припада преговарачком скупу, (xˆ, yˆ )  P .
А2: Договорна стратегија обезбеђује играчима већу добит од status quo стратегије,
f (x*, y*)  f (xˆ, yˆ ) .
А3: Договорна стратегија је парето максимална за дефинисан скуп P.
А4: Ако је P1  P, и (xˆ, yˆ )  P тада је (xˆ, yˆ )  P1
А5: Линеарним трансформацијама стратегијског скупа P у скуп S,
x '   1 x  1
y '   2 y  2
где су 1 , 2  0, 1 , 2 произвољне константе, договорна стратегија (xˆ, yˆ) се
трансформише у стратегију (1 xˆ  1 , 2 yˆ  2 ) .
А6: Ако P има симетрију по некој координати, тада симетрични играчи добијају исте износе.
Неш је показао да важи следећа теорема:
Теорема: Ако су задовољени услови А1-А6 тада постоји тачно једна тачка договора (xˆ, yˆ ) у
преговарачком скупу P која је решење проблема
max (x *x)( y *y) п.о. x, y  P, x  x*, y  y * . (3)
Добијена стратегија се назива равнотежном стратегијом.
Претпоставимо сада да два играча, која имају на располагању две стратегије могу да понове
игру више пута. Коју стратегију при сваком понављању игре играчи треба да бирају како би у просеку
постигли најбољи резултат?
Нека је нови проблем представљен биматрицом исплата дефинисном табелом бр. 1.3 и нека играчи
бирају своје стратегије са вероватноћама p1 и p2 , односно са вероватноћама 1 p1 и 1 p2 . Играчи
повлаче потезе гарантујући да њихова исплата неће зависити од избора стратегије другог играча.
Биматрица исплате, Табела бр. 1.3
Други играч
Стратегија А Стратеија Б
Стратегија А (a11, b11 ) (a12 , b12 )
Први играч
Стратегија Б (a21, b21 (a22 , b22 )
)
Исплата првог играча при избору стратегије А у просеку износи f (A, y)  [a11]p2 [a12 ](1 p2 односно
)
f (Б, y)  [a21]p2 [a22 ](1 p2 при избору стратегије Б. Слично, исплата другог играча при избору
)
стратегије А у просеку износи f (x, A)  [b11]p1 [b21](1 док исплата за изабрану стратегију Б у
p1)
просеку износи f (x, Б)  [b12 ]p1 [b22 ](1 p1) . Изједначавањем исплата за сваког играча посебно
добијамо вероватноће избора стратегија и очекиване исплате:
p1  b22  b21 a11a22  a12 a21
b11  b12  b21  b22, a11  a12  a21  a22 ,
f (x, ) 
p2  a22  a12 b11b22  b12b21

a11  a12  a21  a22 , f (, y) b11  b12  b21  b22.

Поступак и тежина налажења најбоље стратегије најчешће зависи од димензија и врста матрица.
Коришћењем особине доминантности (дефиниција 1.2) матрице димензија m n се могу превести у
матрице димензија (m 1)  n или m(n 1) а понављањем овог поступка се у неким случајевима може
1
добити матрица димензије 11 која би представљала решење датог проблема. Проблеме чије су
матрице исплата димензије 2 n, n  2 или m 2, m  2 најчешће решавамо графичким путем.
1
Задаци за вежбу
Ним игра
Ним игра је једна од најстаријих познатих математичких игара за два играча. Настала је пре више од
100год у Немачкој. На столу се налазе две гомиле предмета. Играчи наизменично уклањају предмете
са тих гомила тако да сваки играч, када дође његов ред да игра, са било које од те две гомиле може
склонити колико год жели предмета. Побеђује онај играч који склони последњи предмет.
Решење:
Bouton-ова теорема
Позиција 2 je победничка позиција ако и само ако је ним сума једнака нули.
а) Пробати са (13,12,8), (13,17,19,23)

13 12 8 = 11012 + 11002 + 10002 = 10012 = 9
Како ним сума није једнака нули, ово није победничка позиција.
Како себи да обезбедимо победничку стратегију?
Победничку позицију остварићемо тако што ћемо одузети онолико предмета колико ће нам
омогућити паран број јединица у свакој колони. На пример, ако склонимо 9 предмета са прве гомиле
добијамо позицију
4 12 8 = 1002 + 11002 + 10002 = 00002 = 0
Други победнички потез је да се са друге гомиле покупи 7 предмета.
Наћи трећи победнички потез.
б) Наћи најбољу стратегију у игри 22 51

Преведемо их на бинарне бројеве
22 = 10110
51 = 110011
ним сум = 100101 = 3 . Да ли је ово добитна комбинација за првог играча?
Ним игра 2
Посматрамо ним игру али са три гомиле. Наћи стратегију тако да без обзира на потез противника
увек победите у игри.
a) 1,2,3
b) 13,17,19,23
c) 12,19,27
Ним игра 3
Претпоставимо сада да постоје две гомиле са по два предмета. Први играч може да узме један или
два предмета са једне гомиле. Затим игра други играч који може такође да узме један или два
предмета (уколико их има) исто само са једне гомиле. Играчи играју наизменично све док један од
играча не повуче последњи предмет чиме губи игру.
Да ли може да се направи стратегија првог играча која ће омогућити победу без обзира на игру
противника?
1
Решење:
// експлицитна норма игре или дрво игре
Le Her
Два играча „вуку“ карту из стандардног шпила од 52 карте не гледајући је. Побеђује онај играч чија
карта има већу вредност. Играчи имају могућност да затраже размену карата (осим ако неко од њих
има краља – краљ је највећа карта), могу да замене за нову произвољно изабрану карту (осим ако
нова карта није краљ). Уколико су карте исте „тежине“, побеђује онај играч кој је други повукао
карту.
Решење:
Први играч треба да затражи замену сваке карте мање од 7 и да чува сваку карту већу од 7.
Други играч треба да замени сваку карту мању од 8 и сачува сваку карту већу од 8.
Проблематични су случајеви када оба играча мењају карте.
James Waldegrave (1684 – 1741) - 1713 писмо упућено Montmort:

Стратегија која ће максимизирати вероватноћу победе без обзира на потез противника је следећа:
• Други играч треба да бира стратегију „задржати 8 и сваку већу карту са вероватноћом 5/8“
„заменити 8 и мању карту са вероватноћом 3/8“.
 Први играч треба да бира стратегију „задржати 7 и сваку већу карту са вероватноћом 3/8“,
„ заменити 7 и сваку мању карту са вероватноћом 5/8“.
Еуклидова игра
Дата су два броја, 𝑎 и 𝑏. Наизменично се узима мањи број, помножи неким бројем и одузме од
већег. Онај играч који добије 0 побеђује.
Решење:
𝑎 = 5, 𝑏 = 13 1,1 → 1 − 1 * 1 = 0
13 − 5 * 1 = 8
5,8 → 8 − 5 * 1 = 3
5,3 → 5 − 3 * 1 = 2 Ko добија? Ако је 𝑛 = Фибоначијевог
2
3,2 → 3 − 2 * 1 = 1 броја први добија, иначе губи.
2,1 → 2 − 1 * 1 = 1
1
Игра бројева
Играчи наизменично записују бројеве од 1 до 9. Побеђује онај играч чији број у збиру са свим
претходним даје 100.
Решење:
// антагонистичка игра са потпуном информацијом.
Други играч може себи да обезбеди победу тако што за сваки избор броја првог играча он бира
10 − . Дакле, посматрати као проблем од 0 до 10.
Да ли постоји оптимална стратегија уколико се играч посматра за 3 играча?
Бацање новчића
Два играча бацају новчиће. Уколико код оба играча падне глава или код оба падне писмо, први
исплаћује 1 дин другом, уколико код првог падне глава а код другог писмо и обратно, други
исплаћује 1 дин. Направити дрво исплате.
Балет & Фудбал

Двоје су се договорили да иду на фудбал и на балет и обоје купили карте. Међутим, оба дешавања
су у истом термину на разлачитим местима, наравно. Где ће обоје завршити ако је матрица
исплате следећа:
𝑎 𝖰
𝛼 (2,1) (0,0)
𝛽 (0,0) (1,2)
Оцена
Нека сваки студент напише број 𝛼 или број 𝛽 тако да нико у његовом окружењу не види шта је
написао. Произвољно ћемо упарити резултате у једну форму тако да нико не зна са ким је у пару. На
основу следећих правила студенти ће добити оцене за овај курс:
 ако је један студент написао 𝛼 а други 𝛽 тада ће први добити 100 поена а други оцену 70.
 ако су оба студента уписала 𝛼 тада ће оба студента добити 80 поена.
 ако је први уписао 𝛽 a други 𝛼 тада ће први добити 70 а други 100 поена
 ако су оба студента уписала 𝛽 тада ће оба студента добири оцену 90 поена.
Решење:
Написати стратегију за сваког посебно а затим биматричну форму.
Пребројати 𝛼 и 𝛽 и дискутовати зашто су то изабрали.
Објаснити шта је строга доминација.
Пробати поново са матрицама исплате (злоћа & добрица)

а) б)
𝑎 𝖰 𝛼 𝛽
𝛼 (0,0) (3,-3) 𝛼 (0,0) (-1,-1)
𝛽 (-1,-1) (1,1) 𝛽 (-3,-3) (1,1)
проблем координације дилема затвореника

𝑎 𝖰
𝛼 (0,0) (-1,-3)
𝛽 (-3,-1) (1,1)
НАПОМЕНА:
𝑎 𝖰
𝛼 (0,0) (3,-1)
𝛽 (-1,3) (1,1)
Ставити се на место противника и размислити о томе како ће он играти.
Добили смо дилему затвореника.
Да ли дилему затвореника примењујемо и ми?
Да! Ко има цимере? Да ли сређује стаан? Да ли очекује да ће други средити стан?
Да ли на сређивање стана утиче понављање проблема?
Како бисте играли ако знате да је ваш противник добрица а ви сте злоћа?
Да ли се користи још негде? Ја нећу да спустим цену ако и ти не спустиш?
Краљ и шах
Два играча померају краља од горњег десног угла до доњег левог угла без удаљавања. Играч који
остане без потеза губи. Наћи оптималну стратегију ако се коњ једино не сме да иде уназад.
Решење:
Игру решити уназад. Крећемо од последњег потеза и враћамо се до почетка.
Попуњавање бројева 1
Два играча попуњавају * цифрама. Први каже цифру други је упише. Циљ првог играча је што већи
број док је циљ другог играча што мањи број.
* 2
-1 *
Решење:
Направимо дрво игре.
Ако први играч бира број 9, тада ће тај број други играч уписати на позицију доле-десно, следећи
избор броја се мора уписати у поље горе лево, чиме добијамо 92-19=73.
Уколико би као први број изабрали 8 а наредни 9, у најбољем случају, добили би 92-18=74 (а како
циљ противника није да добијемо што више, већ што мање, он ће играти 82-19=63).
Вредност игре је 73!
Попуњавање бројева 2
Први играч каже цифру. Други је допуни. Разлика бројева је исплата. Доказати да је оптимална
вредност 4000.
* * * *
-* * * *
Решење:
Игра се по истом принципу као и прва игра. Ако бирамо бројеве веће од 5, други играч ће их
паковати у други ред, односно у први ред уколико бирамо бројеве мање од 5. Највећу вредност
добијамо за 9999-5999=4000.
Полиноми
Нека је дат полином 𝑎 + 2 + 𝑏 + 𝑐. Играчи наизменично бирају коефицијенте. Ако полином има
тачно једну реалну нулу побеђује први, иначе побеђује други.
Решење:
Разликујемо 3 случаја:
I: 𝑐 = 1,
II: било шта,
III: други бира исто што и први: + 2
+𝑎 +1= 𝑎 +1 2
+1
1
X-O
Циљ је направити правоугаоник масималне површине – добија први играч.
Решење:
Нпр.
8 5
O X
1 2
X O
3 7 9
X X X
4 6
O O
Највише може бити квадрат, димензије 3x3
Два топа
Два топа се померају једно или два места унапред (нема уназад) дуж неког низа поља. Губи онај топ
који нема потез. Наћи оптималну стратегију играча.
+ +
Решење:
Решавамо проблем у зависности од броја расположивих поља. Оптимални резултат добија се
индукцијом уназад. Гледамо која позиција нам је добитна.
Ако је дужина низа 3 + 2 први губи
Ако је дужина низа 3 први добија
Ако је дужина низа 3 + 1 добија
1
Игре са нултом сумом за два играча
Игра 1
Посматрамо игру за два играча која бирају један од бројева 1,2 . Уколико је сума изабраних бројева
пар, добија други играч, односно ако је непар, добија први играч. Износ који добија победник а
исплаћује побеђени је сума изабраних бројева изражена у динарима.
Решење:
Обележимо стратегије играча са = 1,2 и = 1,2 . А матрицу исплате, М са
−2 3
𝑀=[ ]
3 4
Да ли је неко од играча фаворизован?
Посматрајмо проблем из угла 1.играча:
Претпоставимо да први играч бира „1“ са вероватноћом 3/5 а „2“ са вероватноћом 2/5
Разликујемо два случаја:
1. Други бира „1“: први губи 2 динара3 у 3/5 случајева
2
док добија 3 динара у 2/5 случајева, тј.
исплата коју добија први је: −2 + 3 + 0
5 5
2. Други бира „2“: први добија 3 долара у 3/5 случајева, док губи 4 долара у 2/5 случајева,тј.
3 2
исплата коју добија први је 3 − 4 =1/5
5 5
Дакле,, ако први комбинује свој избор на описан начин, добија сваки пут када други бира „2“
односно остаје без зараде ако он бира „1“. Да ли први играч може да поправи своју ситуацију тако да
увек добије износ без обзира на потез другог?
Обележимо вероватноћу избора стратегије „Први бира 1“ са 𝑝. Хајде да одредимо ту вероватноћу

тако да први добије исти износ без обзира на потез другог:
Ако други бира „1“ први добија: −2𝑝 + 3(1 − 𝑝),
Aко други бира „2“ први добиј 3𝑝 − 4(1 − 𝑝)
Први бира 𝑝 тако да важи:
−2𝑝 + 3(1 − 𝑝) = 3𝑝 − 4(1 − 𝑝) 7 7 1
Решавањем, добијамо да је 𝑝 = 12 и на овај начин први добија −2 + 3 1 − = динара у
12 12 12
просеку.
Стратегија у којој један играч гарантује себи исту исплату без обзира на потез другог играча назива се
изравнајућом стратегијом.
Да ли први може да постигне бољи резултат од овог?

1
Ако посматрамо стратегију друг на исти начин, он ће себи обезбедити губитак у просеку .
12
Како је губитак једног играча изједначен са добитком другог, овакву стратегију назваћемо
оптималном стратегијом, односно минмакс стратегијом.
Да ли други играч може себи да обезбеди добитак у сваком случају?
Игра 2
Решавати проблем из 12 тако да исплата буде производ изабраних бројева а не збир. Направити
матрицу исплате и одредити најбољу и оптималну стратегију.
1
Игра 3
Први играч има црног кеца и црвену 8. Други играч има црвену 2 и црну 7. Играчи наизменично
бирају једну од карата за игру. Ако је изабрана карта исте боје, први добија. Други добија ако су
карте различите боје. Износ који се исплаћује победнику је једнака броју са карте победника.
Направити матрицу исплате и одредити стратегије.
Игра 4
Први играч путује возом од Београда до Ниша како би побегао од другог. Други креће експрес возом
за њим. На том путу постоји успутна станица у Крагујевцу на којој први играч може, а и не мора, да
изађе. Други играч је свестан међустанице тако да и он може да прекине потрагу у Крагујевцу. Ако је
матрица исплате другог играча дата, одредити оптималну стратегију за оба играча и одредити њену
вредност.
100 −50
0 100
Игра 5
Решити биматричну−10
игру (наћи
2 равнотежну тачку) aко су матрице исплате А и B.
5 −2
A=[ ], 𝐵 = [ ]
1 −1 −1 1
Решење:
Некај је (𝑥^, 𝑦^) равнотежна тачка, односно важи
𝑥^ 𝑇 𝐴 𝑦^ ≥ 𝑥 𝑇 𝐴 𝑦^, ✯𝑥 (1)
𝑥^ 𝑇 𝐵 𝑦^ ≥ 𝑥^ 𝑇 𝐵𝑦, ✯𝑦 (2)
𝑥 𝑦
При чему је je 𝑥^ = , 𝑦^ = 1 − 𝑦
Решавамо систем 1 − 𝑥 −10 2 −10 2
[𝑥 1 𝑦 − 𝑥] [ ][ ] ≥ [1 𝑦] [
0 ][ ],𝑥 = 1
1 −1 1 − 1 −1 1 − 𝑦
−10 2 𝑦 −10 2
[𝑥 1
𝑦 − 𝑥 ] [ ][ ] ≥ [0 𝑦] [
1 ][ ],𝑥 = 0
1 −1 1 − 𝑦 1 −1 1 − 𝑦
Аналогно за (2).
Добијамо да је
(1 − 𝑥)(14𝑦 − 3) ≥ 0
𝑥(−14𝑦 + 3) ≥ 0
(9𝑥 − 2)(𝑦 − 1) ≥ 0
𝑦(9𝑥 − 2) ≥ 0
Решавамо по x и по y:
Za 0 < 𝑥 < 1 ⇒
−14𝑦 + 3 ≥ 0 3
}⇒ 𝑦=
14𝑦 − 3 ≥ 0 14
Za 0 < 𝑦 < 1
1
9𝑥 − 2 ≤ 0 2
} ⇒ 𝑥 =
9𝑥 − 2 ≥ 0
2 3
9
Дакле, тражена равнотежна тачка је ,
9 14
1
Игра 6
Наћи равнотежне тачке за следећу биматричну игру
(2,1) (1,3)
(𝑥, 𝑦) = [(1,4) (3,1)]
Решење:
Аналогним поступком из игре 6 добијамо равнотежну тачку (3 , 2) .
5 3
Игре са информацијама
Разликујемо следеће информационе скупове

 потпуне информације  сваки информациони скуп је димензије 1.
 одређене информације  случајни потез природе пре играча
 симетричне информације  играчи имају исте информације током игре
 комплетне информације  природа нема утицаја, нема случајних потеза
Посматрамо проблем са савршеним информацијама, Како вођа каже.
Како шеф каже:

Шеф има на располагању два избора {Велико пиво, мало пиво}. Ако шеф каже „Велико пиво“ и ми
„морамо“ бирати велико пиво, уколико шеф каже „мало пиво“ и ми „морамо“ бирати мало пиво.
Наручивање пића се понавља, а са наручивањем друге туре имамо могућност новог избора. Матрица
исплате за једну туру пића:
ми
Велико Мало
пиво пиво
Велико
(2,2) (-1,-1)
вођа пиво
Мало
(-1,-1) (1,1)
пиво
Направити стратегију поручивања две туре.

Напомена: Највише што смемо попити су једно велико пиво и једно мало! Никако два велика, то је
преко дозвољене границе. Шеф може да пије колико жели, он не вози.
1
Решење:
Имамо на располагању 4 различите стратегије:
1. Ако шеф наручи велико пиво и ми ћемо наручити велико пиво, ако шеф наручи мало пиво, ми
ћемо велико
2. Ако шеф наручи велико пиво и ми ћемо велико, ако шеф наручи мало пиво и ми ћемо мало
пиво.
3. Ако шеф наручи велико пиво, ми ћемо мало, али ако после тога вођа наручи вечико пиво, ми
ћемо мало.
4. Ако шеф наручи велико пиво ми ћемо мало, али ако он после тога наручи мало и ми ћемо
мало пиво.
Стратегија исплате је следећа:

ми
стратегија 1. стратегија 2. стратегија 3. стратегија 4.
шеф Велико пиво 2,2 2,2 -1,-1 -1,-1
Мало пиво -1,-1 1,1 1,1 1,1
Одредити оптималну стратегију оба играча.
Проблем владе
Влада жели да помогне сиромашним у смислу да им понуди посао и никако другачије. Радник тражи
посао уколико му социјална помоћ није довољна. Одредити оптималну стратегију ако је дата
матрица исплате.
Радник
посао просјачење
Влада помоћ (3,2) (-1,3)
без помоћи (-1,1) (0,0)
Решење:
- Стратегија (Помоћ,Посао) није Нешова равнотежна стратегија зато што би радник на Владину
понуду за послом изабрао издржавање.
- Стратегија (Помоћ, Просјачење) такође није равнотежва тачка обзиром да би као одговор на
просјачење, Влада изабрала без помоћи.
- (без помоћи, просјачење) није Нешова тачка обзиром да би радник изабрао да ради
- (без помоћи, посао) такође није Нешова, зато што се у том случају Влади више исплати помоћ,
који нас враћа на прву стратегију.
Дакле, решење се крије у мешовитој стратегији.
Нека Влада бира стратегију са вероватноћом 𝜃𝑎, oдносно 1 − 𝜃𝑎.
Нека Радник бира стратегију са вероватноћом 𝛾w, oдносно 1 − 𝛾w
Стратегија Владе је следећа:
𝜋𝑎 = 𝜃𝑎[3𝛾w + (−1)(1 − 𝛾w)] + [1 − 𝜃𝑎][−1𝛾w + 0(1 − 𝛾w)] = ⋯ = 𝜃𝑎[5𝛾w − 1] − 𝛾w
Kод чистих стратегија 𝜃𝑎 је једнако нули или јединици, док то није случај код мешовитих.
Ако желимо да максимизујемо зараду Владе, ∂𝜋рачунаћемо извод фунцкије исплате:
𝑎
= 5𝛾 − 1
1
∂𝜃𝑎 w
даљим решавањем добијамо да је 𝛾𝑎 = = 0 2

5
Дакле, мешовита стратегија Радника којом он ради 20% свог времена доноси Влади највећу зараду.
Међутим, ово баш и није логично. Гледали смо максимум из Владиног угла. Проблем има граничну
вредност обзиром да треба да се посматра из угла радника.
1
Дакле, ако радник буде желео да ради 20% свог времена, Влада ће имати максималну добит.
Уколико раник жели да ради мање од 20% Влада бира да му помогне, односно ако Радник одлучи да
ради више од 20% свог времена, Влада бира да га не издржава.
Зарада из угла Радника је следећа:
𝜋w = 𝜃𝑎(2𝛾w + 3[1 − 𝛾w]) + (1 − 𝜃𝑎)(1𝛾w + 0[1 − 𝛾w]) = ⋯ = −𝛾w(2𝜃𝑎 − 1) + 3𝜃𝑎
Maксимизујемо зараду Радника, 𝑑𝜋w
= −(2𝜃 − 1) = 0
𝑎
Следи да је 𝜃𝑎 = 1 2 𝑑𝛾w
Дакле, ако Радник одлучи да ради са вероватноћом 0,2 Влада је неодлучна око тога да ли пружи
помоћ 100% или да не пружи помоћ. Да ли Влада има бољу стратегију?
Игра „пилића“ (chicken или hawk vs dove)
Два тинејџера возе аутомобиле један према другом у пуној брзини. Први који скрене губи. Ако један
скрене а други не, тада други добија исплату 2,000 а први који је скренуо добија (-1,000). Уколико
обојица скрену, тада је резултат 0 за обојицу. Уколико ни један не крене, то је најгоре за обојицу и
износ је (-4000,-4000).
Играч 1\ Играч 2 Скреће Не скреће

Скреће (0, 0) (-1.000, 2.000)
Не скреће (2.000, -1.000) (-4.000, -4.000)
Игра нема доминантних стратегија.

Уместо тога имамо два симетрична решења, односно две Нешове равнотежне тачке.
Тражимо решење у мешовитим стратегијама.
Нека први бира стратегију „скрени“ са вероватноћом 𝑝, односно други са вероватноћом . Имамо
следеће очекиване исплате:
Играч 1\ Играч 2 Скреће Не скреће

Скреће (0 , 0𝑝) (−1(1 − ), 2𝑝)
Не скреће (2 , −1(1 − 𝑝)) (−4(1 − ), −4(1 − 𝑝))
Следи да је
𝜋1(скре е) = 0 − (1 − ) = − 1
𝜋1(не скре е) = 2 − 4(1 − ) = − 4
Из услова индиферентности следи да је 𝜋1(скре е) = 𝜋1(не скре е)
Решење добијамо за = 3 5.
Слично, добијамо стратегију за другог тинејџера: 𝑝 = 3 5
3 2 3 2
Дакле, равнотежа у мешовитим стратегијама је , , , .
5 5 5 5
Приказати графички.
2
Доминантне стратегије
Кажемо да је стратегија к-те врсте доминантна ако је 𝑎 ≥ 𝑎 за свако .

Кажемо да је стратегија к-те колоне доминантна ако је 𝑎 ≤ 𝑎 за свако
Стратегија 1
2 0 4
𝐴 = ( 1 2 3)
4 1 2
Видимо да 2.колона доминира 3.колону. Из тог разлога, последњу колону можемо обрисати.
Посматрамо нову матрицу исплате:
2 0
𝐴’ = (1 2)
4 1
Сада, приметимо да последња врста доминира прву, дакле бришемо и прву врсту.
1 2
𝐴’’ = ( )
4 1
Последња матрица исплате је лако решива и вредност игре износи 7/4 а добија се избором
вероватноћа 𝑝 = (3 , 1) oдносно = (1 , 3) .
4 4 4 4
Дакле, оптималне стратегије играча су
I: (0, 3 , 1)
1 3 4
4
II: ( , , 0)
44
0 4 6
𝐴 = (5 7 4)
9 6 3
Приметимо да чистих доминантних стратегија нема, али зато мешовита стратегија у којој се са
вероватноћом ½ бирају I и III колона доминира II колону.
Брисањем друге колоне, решавамо нови проблем:
0 6
𝐴’ = (5 4)
9 3
Приметимо сада да средњу врсту доминирају I и III врста које се бирају са вероватноћом 1/3 и 2/3.
Нова матрица исплате је сада:
0 6
𝐴’’ = ( )
9 3
Вредност игре А’’ је 9/2.
1 3 5 3
𝐴 = ( 4 0 2 2)
3 7 3 5
Комбинација стратегија колона I, II, III доминира последњу колону и тд.
2
2 3
𝐴=( 1 5
)
4 1 6 0
Проблем стратегија димензија 2 , 2 могу се решавати графички.

Претпоставимо да се прва врста бира са вероватноћом 𝑝, односно друга врста са вероватноћом
(1 − 𝑝). Колона стратегије имају следеће вредности:
ƒ(1) = 2𝑝 + 4(1 − 𝑝)
ƒ(2) = 3𝑝 + (1 − 𝑝)
ƒ(3) = 𝑝 + 6(1 − 𝑝)
ƒ(4) = 5𝑝
Нацртамо ове 4 функције за све вредности 𝑝, 0 ≤ 𝑝 ≤ 1
Наћи стратегију системом елиминације доминантних стратегија.

Приметимо да се једна од стратегија неће користити.
1 5
𝐴 = (4 4)
6 2
Претпоставимо да се колоне бирају са вероватноћама 𝑞 и 1 − 𝑞. Игра се може приказати графички
𝑔(1) = 𝑞 + 5(1 − 𝑞)
𝑔(2) = 4𝑞 + 4(1 − 𝑞)
𝑔(3) = 6 + 2(1 − 𝑞)
2
Камен-Маказе-Папир
Одредити стратегију игре Камен-Маказе-Папир.

*Ово је игра са симетричним стратегија.
II
папир маказе камен
папир 0 -1 1
I маказе 1 0 -1
камен -1 1 0
Решење:
Обележити стратегије I играча са 𝑝1, 𝑝2 и 𝑝3 тако да важи 𝑝1 + 𝑝2 + 𝑝3 = 1 и решити игру тако да
буде индиферентна у односу на игру противника.
Игре са екстензивном формом
Посматрамо дрво игре.

Превести матричну игру на игру на дрвету ако је матрица исплате:
3 0 1
𝐴=( )
−1 2 0
Решење:
Претпоставимо да први играч има стратегије {горе, доле} док други играч бира између стратегија
{лево, средина, десно}. Дрво игре има следећи облик
Вредност игре је ½ и добија се мешовитом стратегијом (1 , 1

, 1)
4 42
Покер игра – поново

Имамо два играча која улажу по 1 динар на центар стола. Нова који се у овом тренутку налази на
столу износи 2дин и назива се „пот“. Први играч вуче карту са шпила. Карта је добитна са
вероватноћом ¼ односно није добитна са вероватноћом ¾. Први играч погледа карту и не показује је
другом играчу. Други играч не вуче карту. Први играч се или клади или проверава. Уколико
проверава, карта се отвара. Уколико је карта добитна, добија износ са стола, иначе губи првобитно
уложен динар. Уколико се први играч клади, мора да уложи 2 динара. Тада други играч, незнајући
карту првог играча или се клади или одустаје. Ако одустаје, губи онај уложен динар, а ако се клади,
додаје још 2 динара на сто. Први играч мора показати карту и ако је добитна, зарађује укупно 3
динара, односно губи 3 динара уколлико карта није добитна.
Решење:
Прво ћемо да нацртамо дрво игру.
Ово је 3 потезна игра.
Први потез има природа (избор карте првог играча)
Други потез има први играч који бира да ли ће се кладити или не.
2
Трећи потез има други играч који такође може да се клади или да одустане.
У каквој се ситуацији налази II играч?

Он не зна да ли је први играч у позицији лево или десно? Дакле, други играч нема исти
информациони скуп као и први играч.
Које су стратегије природе?

1. Добитна карта ---> A
2. Карта која није добитна ---> B
Које су стратегије I играча?

1. Клади се са добитном картом ---> A, a
2. Клади се са картом која није добитна ---> A, b
3. Чекај са добитном картом ---> B, a
4. Чекај са каром која није добитна ---> B, b
Дакле, ово су 4 чисте стратегије I играча.

Које стратегије има на располагању II играч?
1. Ако се I клади, прати ---> c
2. Ако се I клади, одустани ---> d
Формирајмо матрицу исплате овакве игре:

Ако први бира (A,a) а други бира (c), исплата за добитну карту износи 3 динара I, -3 динара II
Aко је карта недобитна, I губи 3 динара, II их добија.
Обзиром да се добитне и недобитне карте добијају са одређеном вероватноћом, очекивана
вредност овакве игре износи:
𝜋 (𝐴, 𝑎), 𝑐 = 1 3 + 3 (−3) = − 3 за I играча.
4 4 2
Слично одрадимо и за остале комбинације стратегија.
Добијамо матрицу исплате:
𝑐 𝑑
(𝐴, 𝑎) −3/2 1
(𝐴, 𝑏) 0 −1/2
(𝐵, 𝑎) ( −2 1 )
(𝐵, 𝑏) − 1/2 −1/2
Oстало је да решимо матричну игру:
Приметимо да је трећа врста доминирана од стране прве врсте, и да дрга врста доминира над
четвртом. Дакле, проблем 4 2 постаје проблем 2 2. Решење новог проблема се лако добија и
износи -1/4. Оптимална стратегија првог играча је (1 , 5) док је оптимална стратегија другог играча
6 6
(1 , 1).
2 2
2
Алцхајмер
Први играч баца новчић (на коме са једнаким вероватноћама падају писмо и глава) и не показује
резултат другом играчу а затим одлучује да ли ће да уложи 1 динар или 2 динара. Други играч не зна
шта је пало, али на основу потеза првог играча треба да погоди да ли је пала глава или писмо. Сада
први играч, који је мало забораван, на основу свог улога и предлога другог играча одлучује да ли ће
да дуплира или да одустане. Други играч побеђује уколико је његова претпоставка добра, односно
губи ако није. Износ зараде је једнак (опкладе + 1 уколико је глава) (x2 ако први дуплира). Нацртати
дрво игре.
Алцхајмер – још један
Први играч вуче карту из шпила од 52 карте потпуно произвољно. Након што је погледа, може да
уложи или 1 или 5 уз напомену да је карта коју је извукао карта слика (краљ, краљица, жандар – вуку
се са вероватноћом 3/13). Други играч или признаје или дуплира. Ако признаје да је први у праву,
плаћа му износ опкладе (без обзира на то која карта је извучена). Уколико дуплира, показује се карта
и први или исплаћује другог двоструки износ опккладе или зарађује од другог двоструки износ
опкладе.
а) Нацртати дрво игре (*размотрити да ли ће први играч увек бирати
5) б) Наћи одговарајућу нормалну форму игре
ц) Решити проблем
2
Делимични алцхајмер
Посматрамо игру за 2 играча. Први играч бира потез 𝑥, 𝑥 1,2 . Други играч зна шта је први играч
изабрао и сам бира 𝑦, 𝑦 1,2 . Први играч игра поново, али заборављајући шта је сам играо, зна
само који потез је изабрао други играч и на основу тога он такође бира 𝑧 1,2 . Игра се завршава и
други играч плаћа првом играчу износ (𝑥, 𝑦, 𝑧) aко је матрица исплате следећа:
𝑥 𝑦 𝑧 𝑀(𝑥, 𝑦, 𝑧)
1 1 1 -2
1 1 2 -1
1 2 1 3
1 2 2 -4
2 1 1 5
2 1 2 2
2 2 1 2
2 2 2 6
Одредити стратегију другог играча. Проблем свести на дрво.
Решење:
Посматрамо стратегије играча одвојено:
Стратегије првог играча су (8 стратегија):
𝑥 𝑦 𝑧
1 1 1
1 1 2
1 2 1
1 2 2
2 1 1
2 1 2
2 2 1
2 2 2
Стратегије другог играча су (4 стратегије)
𝑦 𝑧
1 1
1 2
2 1
2 2
Формирамо дрво:
Можемо направити матрицу исплате за сваку комбинацију стратегија. Видећемо да је стратегија

(2,1,2) , (1,1) седло.
2
Бомба
Два играча наизменично траже бомбу која се налази у три поља (означена словма А, B и C).
Вероватноћа да се бомба налази у неком од тих поља дата је са 𝑝(𝐴) = 1 𝑝(𝐵) = 1 ,𝑝( ) = 1. Играчи
3 2
6
поља бирају наизменично. Ко пронађе бомбу, добија 1 дин, а ко изгуби исплаћује тај 1 дин.
Нацртати дрво игре и нормални облик игре.
Решење:
Формирати дрво исплате.
Да ли играчи знају свој претходни потез?
Реклама
Три фирме производе исти производ и рекламирају се путем медија. Реклама може да се пушта
ујутру или увеле. Ако се увече рекламира само једна фирма, тада је добитак те фирме 2, уколико се
нека фирма једина рекламира ујутру, тада је њен добитак 1, међутим уколико се у истом термину
рекламирају две или све три фирме, добитак је 0. Одредити стратегију рекламирања.
Решење:
Обележимо фирме са I, II и III, а термине приказивања рекламе са 𝑅1, 𝑅2, 𝑅3
Посматрамо следећу матрицу исплате
I II III 𝑅1 𝑅2 𝑅3
1 1 1 0 0 0
1 1 2 0 0 2
1 2 1 0 2 0
1 2 2 1 0 0
2 1 1 2 0 0
2 1 2 0 1 0
2 2 1 0 0 1
2 2 2 0 0 0
𝑥 𝑦 𝑧
Oбележимо стратегију фирми са 𝑥^ = (1 − 𝑥 ) , 𝑦^1 = (1 − 𝑦 ) , 𝑧 = ( )
1−𝑧
Oчекивани добитак I играча:
𝜋1 = 0 · 𝑥𝑦𝑧 + 0 · 𝑥𝑦(1 − 𝑧) + 0 · 𝑥(1 − 𝑦)𝑧 + 1 · 𝑥(1 − 𝑦)(1 − 𝑧) + 2 · (1 − 𝑥)𝑦𝑧 + 0 · (1 − 𝑥)𝑦(1 − 𝑧)
+ 0 · (1 − 𝑥)(1 − 𝑦)𝑧 + 0 · (1 − 𝑥)(1 − 𝑦)(1 − 𝑧)
да би добитак био позитиван, мора да важи: 𝜋1 ≥ 0
Дакле, за 𝑥 = 1 имамо 1 · 𝑥(1 − 𝑦)(1 − 𝑧) + 2 · (1 − 𝑥)𝑦𝑧 ≥ (1 − 𝑦)(1 − 𝑧)
за 𝑥 = 0 имамo 1 · 𝑥(1 − 𝑦)(1 − 𝑧) + 2 · (1 − 𝑥)𝑦𝑧 ≥ 2𝑦𝑧
...
(𝑥 − 1)(1 − 𝑦 − 𝑧 − 𝑦𝑧) ≥ 0
𝑥(1 − 𝑧 − 𝑦 − 𝑦𝑧) ≥ 0
Решавањем система,
добијамо 𝑥 = 0, 1 ≤ 𝑦 + 𝑧 + 𝑦𝑧
1−
0 < 𝑥 < 1, 1 = 𝑦 + 𝑧 + 𝑦𝑧 → 𝑧 =
𝑦
1+𝑦
𝑥 = 1, 1 ≥ 𝑦 + 𝑧 + 𝑦𝑧
Нацртамо у 2D по y и z, oдносно у 3D.
Добијамо коцку, а решење је тачка унутар коцке 1 − 2, 1 − 2, 1 − 2 као и све тачке на рубу.
Таквих тачака има бесконачно много.
Дакле, ако нема договора међу фирмама из једне равнотежне тачке прелази се у другу равнотежну
тачку. Договор је пожењан.
2
Одредити стратегију следеће игре
(2,2) (2,1) (2,2) (0,0)
[(1,0) (4,1) (2,4) (1,5) ]
(0,4) (3,1) (3,0) (3,3)
Решење:
Ни једна чиста стратегија не доминира другу чисту стратегију.
Стратегија II колоне доминирана је мешовитом стратегијом (1/2) + (1/2) .
1
(2 ) + 1 (2 ) > 1
2 2
1
(0) + 1 (4) > 1 → (1 , 0, 1 , 0) II доминира над (0,1,0,0)
2 2 2 2
1
(4) + 1 (0) > 1
2 2 𝖩
Бришемо зато II стратегију.
Слично покажемо да је (0,1,0) доминирана стратегијама (𝑝, 0,1 − 𝑝) I играча.
....
Скуп свих Нешових равнотежних тачака је (1,0,0), (𝑞, 0,1 − 𝑞, 0), 1 ≤ 𝑞 ≤ 1 .
3
Проблем рибара
На пијаци, док је свежа, прода се свега 2/3 рибе док се преостала риба заледи и прода касније.
Продавац зна која риба је свежа а која није. Купац пита која риба је свежа, продавац даје одговор и
онда купац одлучује да ли жели да купи рибу или не. Продавац добија 6 поена уколико прода рибу,
односно не добија ништа (0) уколико је не прода. Искреност продавцу доноси доданих 3 поена.
Купац добија 3 поена уколико купи свежу рибу, односно ако примети да је риба стара и одлучи да је
не купи. Направити дрво игру и матрицу исплате и одредити оптималне стратегије купца и
продавца.
Решење:
Дрво игре има следећи облик:
Приметимо да постоје различити информациони скупови за

купца. Одговарајућа матрица исплате:
продавац\купац купи свежу купи стару не купи свежу не купи стару
свежа, искрен 8,2* 8,2 2,1 2,1
свежа, неискрен 9,2* 7,3* 5,0 3*,1
стара, искрен 6,2 2,0 4,3* 0,1
стара, неискрен 7,2* 1,1 7,2* 1,1
Приметимо да постоје доминантне стратегије.
Искреност је доминантна стртегија за продавца.
2
У том случају, редукована матрица је
продавац\купац купи свежу купи стару
свежа, искрен 8,2* 8,2
свежа, неискрен 9,2* 7,3*
стара, неискрен 7,2* 1,1
Код редуковане матрице доминира стратегија (стара неискрен) за продавца, у ком случају је купи
свежу доминантна стртегија за купца.
Приметимо да је доминантна стратегија заправо стратегија (свежа-искрен, купи стару) и да је за
купца све једно да ли продавац говори истину или не, он ће желети да купи свежу.
Следећу позициону игру свести на нормални облик.
Наћи равнотежну тачку следеће игре.
2
Рекурзивне, стохастичке и игре са понављањима
Матрична игра чији су делови игре
Нека су дате две матрице исплате,

0 3 0 1
𝐴=( ),𝐵 = ( )
2 −1 4 3
И нека је дата матрица исплате игре
𝐴 4
𝐼=( )
5 𝐵
Игра I се игра на следећи начин:
Први играч може да бира врсте а други играч колоне.
Ако је резултат избора оба играча број, други исплаћује првог тај износ и игра се завршава. Уколико
је резултат избора матрица, онда се игра њихова одговарајућа игра. Одредити вредност игре.
Решење:
Посматрамо прво игре A, B:
Игра А 1 1
Оптимална стратегија првог играча је ( , )
2 2
Оптимална стратегија другог играча је ( 2, 1)
33
Вредност игре је 1
Игра B
Оптимална стратегија првог играча је (0,1)
Оптимална стратегија другог играча је (0,1)
Вредност игре је 3
Сада почетна игра има следећу матрицу исплате:

1 4
𝐼=( )
5 3
Оптимална вредност коначне игре је 17/5 и добија се за следеће мешовите стратегије
2 3
први играч: 5 , 5 )
1 4
други играч: 5 , 5 )
*Други начин за решавање је да се бројевне вредности почетне матрице I претворе у одговарајуће

матрице са истим тим вредностима:
Нпр.
0 3 0 3 4 4
4
2 −1 4 4
𝐼 = (2 5−1 0 1) → 𝐼 = ( )
5 5 0 1
4 3 5 5 4 3
3
Рекурзивна игра
Решити игру
1 0
𝐺𝑛 = ( ), 𝐺(1) = 1
0 𝐺𝑛−1
Решење:
Игра се може решавати
итеративно:
𝜋(𝐺1) = 1 1
1 0
𝜋(𝐺 ) = 𝜋 (( )) =
2
0 1 2
1 0 1
𝜋(𝐺3) = (( 1)) =
0 2 3
…
1 0 1
( )
1 1
Oптимална стратегија оба играча је ( , (1 − )).
� 𝑛
Игра погађања карте
На располагању је шпил од + 𝑛 + 1 карте. Први играч добија карата, други играч добија 𝑛
карата и остаје једна лицем окренута ка столу коју треба погодити. Играчи знају своје карте али не
знају карте противника. Играчи наизменично погађају која је карта на столу. Први почиње први
играч. У сваком тренутку играчи имају на располагању једну од следећих стратегија:
А) погоде карту која је на столу
Б) питају другог играча да ли је код њега нека одређена карта. Уколико други играч поседује
именовану карту, та карта се искључује из игре.
*блефирање је дозвољено.
Направити добитну стратегију.
Рекурзија 1
Решити следећу рекурзивну игру: 1 1
1 + (0) 1 2 + (−2) 0
𝐺
𝐺1 = (2 2 2 ), 𝐺2 = (3 1
3 )
2 0 0 −1
Решење:
Јасно је да игра мора да се заврши у неком тренутку обзиром да играчи не могу играти игру у
бесконачност. Чак иако би ибрали прву колону и прву врсту, игра ће се завршити исплатом 0 или -2.
Обележимо вредност игре са 𝜋1 = 𝑣𝑎𝑙(𝐺1), 𝜋2 = 𝑣𝑎𝑙(𝐺2).
Користимо формулу:
𝑎 𝑏 𝑎𝑑 − 𝑏𝑐
𝑣𝑎𝑙 ( )=
𝑐 𝑑 𝑎+𝑑−𝑏−𝑐
1 1 1
𝜋 + (0 ) 1 𝜋 1 2
=
4
𝜋1 = 𝑣𝑎𝑙 (2 2 ) = 𝑣𝑎𝑙 (2 2 )=− 6−𝜋
2 1
3
2 0 2 𝜋2 − 3 2
0 2
3
2 1 2 2
𝜋 + (−2) 2(5 − 2𝜋1)
𝜋 = 𝑣𝑎𝑙 ( 1 )=( 𝜋 − )= 5 − 2𝜋
2 3 3 −
0
0 1
3 3
0 −1 0 −1 1
чиме добијамо да је
𝜋1 2(5 − 2𝜋1)
= 16 − 7𝜋1
решавамо квадратну једначину, добићемо
𝜋1 = (10 − √30) = 0.646

7
Заменимо у 𝜋2, добићемо
𝜋2 2√30 − 10
=− 5
Заменом у почетни проблем, можемо решити игру и наћи оптималну стратегију.
3
преузето из ОММ
Borba za prevlast na tržištu
Neka su date dve fabrike sokova koje se bore za prevlast na tržištu. Fabrike unapred određuju koliko će
litara sokova proizvesti. Cena proizvodnje jednog litra soka je ista za obe fabrike i iznosi c, c = const. Ukoliko
prva fabrika proivodi 𝑄𝐴litara soka, tada troškovi proizvodnje iznose c𝑄𝐴. Sa druge strane, ukoliko druga
fabrika proizvodi 𝑄𝐵 litara soka, cena troškova te proizvodnje je cQB . Odrediti optimalnu cenu tako da obe
firme imaju neku zaradu.
Ukupna proivodnja 𝑎 −je𝑄𝑄, 0

=≤𝑄𝐴𝑄+≤𝑄𝑎𝐵. Cena 𝑄 proivoda iznosi 𝑃(𝑄) i računa se po sledećem pravilu:
𝑃(𝑄) = { = (𝑎 − 𝑄)+ 𝑎 = 𝑐𝑜𝑛𝑠𝑡
0 𝑄>𝑎
Pretpostavimo da, ukoliko se napravi više od a litara soka da se ta razlika ne može prodati i da zarada,
samim tim iznositi 0.
Ako uzmemo da su x i y količine soka koji će svaka od fabrika proizvesti, npr. 𝑥, 𝑦 ∈ [0, ∞), odnosno, možda
je bolje ako napišemo da je 𝑥, 𝑦 ∈ [0, 𝑎], tj. ni jedna fabrika neće praviti više od a sokova obzirom da joj se
to ne isplati. Pretpostavićemo, dakle da je c<a.
Profit, koji će svaka od fabrika imati zavisi od proizvodnje te fabrike i proizvodnje konkurentne fabrike,
odnosno od ukupne količine proizvedenog soka na tržištu:
𝑢𝐴(𝑄𝐴, 𝑄𝐵 ) = 𝑄𝐴 * 𝑃(𝑄𝐴 + 𝑄𝐵) − 𝑐𝑄𝐴 = 𝑄𝐴(𝑎 − 𝑄𝐴 − 𝑄𝐵)+ − 𝑐𝑄𝐴
𝑢𝐵(𝑄𝐴, 𝑄𝐵 ) = 𝑄𝐵 * 𝑃(𝑄𝐴 + 𝑄𝐵) − 𝑐𝑄𝐵 = 𝑄𝐵(𝑎 − 𝑄𝐴 − 𝑄𝐵)+ − 𝑐𝑄𝐵
Posmatramo monopolistički slučaj, tj. situaciju kada imamo samo jednu fabriku sokova (𝑄𝐵 = 0).
Ukoliko prva fabrika proizvede 𝑄𝐴 litara, tada će ona ostvariti profit

𝑢𝐴(𝑄𝐴) = 𝑄𝐴(𝑎 − 𝑄𝐴)+ − 𝑐𝑄𝐴
Monopolista želi da maksimizuje svoju zaradu. Koliko litara soka, monopolista treba da proizvede kako bi
zarada bila maksimalna?
Prvo, znamo da je 0 < 𝑄𝐴 < 𝑎. Sledi da je 𝑢𝐴(𝑄𝐴) = 𝑄𝐴(𝑎 − 𝑐) − 𝑄𝐴2, odnosno maksimum se
dostiže za 𝑢𝐴’ = 𝑎 − 𝑐 − 2𝑄𝐴 = 0 → 𝑄𝐴 = 𝑎−𝑐. Cena monopolističke proizvodnje iznosi 𝑃 (𝑎−𝑐) = 𝑎+𝑐,
2 2 2
(𝑎−𝑐)2
odnosno profit fabrike 𝑢𝐴 ( 𝑎−𝑐) = .
2 4
Kako da se probijemo na monopolističkom tržištu?
Posmatramo strategiju svake fabrike i kako izabrana strategija utiče na konkurenta. Dakle,
6
𝑢𝐴(𝑄𝐴, 𝑄𝐵 ) = 𝑎 − 2𝑄𝐴 − 𝑄𝐵 − 𝑐 = 0
6Q𝐴
6
6Q𝐵
𝑢𝐵(𝑄𝐴, 𝑄𝐵 ) = 𝑎 − 𝑄𝐴 − 2𝑄𝐵 − 𝑐 = 0
3
Odnosno, rešenje sistema u kom obe fabrike imaju maksimalni profit sugeriše proizvodnju:
𝑎−𝑐 𝑎−𝑐
𝑄* = i 𝑄* =
𝐴 3 𝐵 3
I obezbeđuje *zaradu: 𝑎−𝑐 𝑎−𝑐 𝑎−𝑐 𝑎−𝑐 𝑎−𝑐 2
𝑢 (𝑄 , 𝑄* ) = (𝑎 − − )−𝑐 =(
𝐴 𝐴 𝐵 )
3 3 3 3 3
𝑎−𝑐 2
Čime ukupan profit za obe fabrike iznosi 2 ( ) .
3
Da li je zarada dve fabrike u zbiru veća od zarade koju bi imao monopolista?

𝑎−𝑐 2
2
(𝑎−𝑐)
Zarada monopoliste iznosi što je manje od 2 ( ) .
4 3
Zašto je ovo bitno?
Ukoliko bi fabrike međusobno sarađivale i ponašale se kao jedna, imale bi veću ukupnu
zaradu a mogle bi manje litara soka da proizvode..
Kako se menja cena soka?

𝑎+𝑐
Cena soka, kod monipoliste iznosi , dok je cena soka kod duopoliste nešto niža i iznosi:
𝑃(𝑄* + 𝑄* ) = 𝑎+2𝑐. 2
𝐴 𝐵 3
Dakle, duopol se isplati kupcima, dok je monopolistička proizvodnja povoljnija fabrikama.
*************************************************************************************
Šta ako se fabrike ne mogu dogovoriti da proizvode istu količinu sokova i svaka hoće da podvali?
Pretpostavimo da fabrike ne mogu da se dogovore oko količine sokova koju će proizvesti, i da svaka fabrika
sama određuje cenu svog proizvoda.
Sada, količina proizvoda

𝑎 − 𝑃 , 0zavisi
≤ 𝑃od≤ cene
𝑎 proivoda:
𝑄(𝑃) = { = (𝑎 − 𝑃)+ 𝑎 = 𝑐𝑜𝑛𝑠𝑡
0 𝑃> 𝑎+𝑐 𝑎−𝑐 (𝑎−𝑐)2
𝑎
Monopolista će svoj proivod naplatiti i proizvesti litara soka, čime ostvaruje ukupan profit od .
2 2 4
Neka su cene po kojima će fabrike prodavati svoje sokove određene sa 𝑃𝐴 i 𝑃𝐵. Ukoliko je 𝑃𝐴 = 𝑃𝐵 sledi da
obe fabrike dele kupce jednako. Neka je cena proivodnje soka konstantna i jednaka kod obe fabrike, i iznosi
c.
3
Profit po jednom prodatom soku iznosi sa 𝑃𝐴 − 𝑐, odnosno 𝑃𝐵 − 𝑐. Funkcije zarade za svaku fabriku iznose:
(𝑃𝐴 − 𝑐)(𝑎 − 𝑃𝐴)+ 𝑃𝐴 < 𝑃𝐵
𝑢𝐴(𝑃𝐴, 𝑃𝐵) = {(𝑃𝐴 − 𝑐)(𝑎 − 𝑃𝐴)+ 𝑃𝐴 = 𝑃𝐵
/2 𝑃𝐴 > 𝑃𝐵
0
Odnosno
(𝑃𝐵 − 𝑐)(𝑎 − 𝑃𝐵)+ 𝑃𝐵 < 𝑃𝐴
𝑢𝐵(𝑃𝐴, 𝑃𝐵) = {(𝑃𝐵 − 𝑐)(𝑎 − 𝑃𝐵)+ 𝑃𝐴 = 𝑃𝐵
/2 𝑃𝐵 > 𝑃𝐴
0
Odrediti optimalnu cenu za obe fabrike.
Pretpostavimo, sada, da fabrike ne proivode iste, već slične sokove ali da je cena proizvodnje i dalje
identična i iznosi c. Količina sokova za proizvodnju iznosiće:
𝑄𝐴(𝑃𝐴, 𝑃𝐵) = (𝑎 − 𝑃𝐴 + 𝑘𝑃𝐵)+
𝑄𝐵(𝑃𝐴, 𝑃𝐵) = (𝑎 − 𝑃𝐵 + 𝑘𝑃𝐴)+
Gde je k parametar koji označava sličnost između ta dva proivoda.
Ponovo ćemo pretpostaviti da količina sokova koju svaka od fabrika može da napravi iznosi 𝑥, 𝑦 ∈ [0, ∞),
odnosno 𝑄𝐴, 𝑄𝐵 ∈ [0, ∞). Profit fabrika određuje se po sledećim formulama:
𝑢𝐴(𝑃𝐴, 𝑃𝐵 ) = 𝑄𝐴(𝑃𝐴 , 𝑃𝐵)(𝑃𝐴 − 𝑐) = (𝑎 − 𝑃𝐴 + 𝑘𝑃𝐵)+(𝑃𝐴 − 𝑐)
𝑢𝐵(𝑃𝐴, 𝑃𝐵 ) = 𝑄𝐵(𝑃𝐴 , 𝑃𝐵)(𝑃𝐵 − 𝑐) = (𝑎 − 𝑃𝐵 + 𝑘𝑃𝐴)+(𝑃𝐵 − 𝑐)
Da bi pronašli cene koje su ujednačene, odnosno cene kojima se profit maksimizuje za obe firme, moramo
da pronađemo optimalne cene 𝑃𝐴* i 𝑃*𝐵. Rešavamo sistem diferencijalnih jednačina.
6
6𝑃
𝑢𝐴(𝑃𝐴, 𝑃𝐵 ) = 𝑎 − 2𝑃𝐴 + 𝑘𝑃𝐵 + 𝑐 = 0
𝐴
6
6𝑃𝐵
𝑢𝐵(𝑃𝐴, 𝑃𝐵 ) = 𝑎 − 2𝑃𝐵 + 𝑘𝑃𝐴 + 𝑐 = 0
Rešenje sistema daje nam optimalne
𝑎+𝑐cene:
𝑃* = 𝑃* = .
𝐴 𝐵
2−𝑘
***************************************************************************************
Pretpostavimo da se u fabrikama nalaze krtice, i da, nakon što je jedna fabrika odlučila da proizvede
određenu količinu soka, to sazna druga fabrika i reaguje u svoju korist.
Dakle, pretpostavimo da će prva fabirka napraviti 𝑄𝐴 litara soka, gde je cena proizvodnje i dalje c = const, a
druga reaguje tako što ona proizvodi količinu 𝑄𝐵 određenu na sledeći način:
𝑎−Q𝐴−𝑐
𝑄𝐵(𝑄𝐴) = 2
Profit koji ostvaruje prva fabrika iznosi
𝑢𝐴(𝑄𝐴, 𝑄𝐵(𝑄𝐴) ) = 𝑄𝐴 (𝑎 − 𝑄𝐴 − 𝑎−Q𝐴−𝑐) − 𝑐𝑄𝐴 = − 1 𝑄2 + 𝑎−𝑐 𝑄𝐴
2 2 𝐴 2
Koja dostiže maksimum za
𝑎−𝑐
𝑄* =
𝐴 2
Druga fabrika će najbolje rezultate
𝑎−𝑐 postići za
𝑄𝐵(𝑄* ) =
3
𝐴 4
3
Kako izgleda profit:
𝑢 (𝑄* , (𝑎−𝑐)2
𝑄 *
𝐴 𝐴 𝐵 (𝑄𝐴) ) = 8
𝑢 (𝑄* , (𝑎−𝑐)2
𝑄 (𝑄𝐴* ))=
𝐵 𝐴 𝐵 16
Dakle, prva fabrika imaće veći profit ako se odluči za proizvodnju 𝑄𝐴 litara soka. Tom prilikom, ukupna
𝑎−𝑐 𝑎−𝑐
proizvodnja soka biće 3
što je više od količine kada se fabrike dogovaraju oko proizvodnje 2 ) a
4
( 2 3
ukupna zarada manja 3 (𝑎−𝑐)
.
16
Задатак:
Нека је укупна цена производа 17 (𝑎 = 17). Израчунати оптималну количину за производњу ако су
трошкови производње Q литара сока 𝑄 + 9. Одредити цену монопола и цену дуопола.
Рекламирање
Две компаније се боре за одређени производ чија је вредност 𝑉 тако што ће инвестирати у
маркетинг (+ остали трошкови кампање). Свака компанија планира да одвоји одређени износ пара у
ову кампању. Уколико 1. фирма одлучи да одвоји 𝑥 > 0 динара, а 2. фирма 𝑦 > 0 динара, тада ће
прва фирма пропорционално зарадити 𝑥/(𝑥 + 𝑦). Фирме имају различит присуп промовисања
производа, па имају 𝑐 трошкова по уложеној јединици. На овај начин, профит компанија се може
израчунати по формули
𝑥
𝜋1 (𝑥, 𝑦) = 𝑉 ·
𝑥 + 𝑦 − 𝑐1𝑥
𝜋2 (𝑥, 𝑦) = 𝑉 · 𝑦
− 𝑐2𝑦
𝑥+𝑦
Aко обе фирме уложе 0 динара, зарадиће 0 динара.
а) Наћи равнотежну стратегију и равнотежну зараду у функцији од 𝑉, 𝑐1, 𝑐2
б) Решити проблем за конкретне вредности 𝑉 = 1, 𝑐1 = 1, 𝑐2 = 2.

1397131841-16-Teorija Igara - Vezbe 2014

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

1397131841-16-Teorija Igara - Vezbe 2014

Uploaded by

Copyright:

Available Formats

МАТЕМАТИЧКИ

ФАКУЛТЕТ ТЕОРИЈА ИГАРА

Марија Ивановић | marijai@math.rs

На почетку игре сваки играч има своју почетну позицију.

У зависности од броја стратегија разликујемо коначне и бесконачне игре.

Односно „да би неко победио у игри, неко други мора да изгуби“.

Игре у којима су интереси играча сукобљени називамо антагонистичким играма. Игре са

У зависности од међусобног односа играча, све игре делимо на кооперативне и

Једна од класификација игара зависи од доступности информација па тако разликујемо игре

Слика бр. 1.1, Преговачки скуп

p2  a22  a12 b11b22  b12b21

а) Пробати са (13,12,8), (13,17,19,23)

б) Наћи најбољу стратегију у игри 22 51

James Waldegrave (1684 – 1741) - 1713 писмо упућено Montmort:

Да ли постоји оптимална стратегија уколико се играч посматра за 3 играча?

Балет & Фудбал

Пробати поново са матрицама исплате (злоћа & добрица)

проблем координације дилема затвореника

Највише може бити квадрат, димензије 3x3

Обележимо вероватноћу избора стратегије „Први бира 1“ са 𝑝. Хајде да одредимо ту вероватноћу

Да ли први може да постигне бољи резултат од овог?

Да ли други играч може себи да обезбеди добитак у сваком случају?

Разликујемо следеће информационе скупове

Посматрамо проблем са савршеним информацијама, Како вођа каже.

Како шеф каже:

Направити стратегију поручивања две туре.

Стратегија исплате је следећа:

Одредити оптималну стратегију оба играча.

даљим решавањем добијамо да је 𝛾𝑎 = = 0 2

Игра „пилића“ (chicken или hawk vs dove)

Играч 1\ Играч 2 Скреће Не скреће

Игра нема доминантних стратегија.

Играч 1\ Играч 2 Скреће Не скреће

Кажемо да је стратегија к-те врсте доминантна ако је 𝑎 ≥ 𝑎 за свако .

Комбинација стратегија колона I, II, III доминира последњу колону и тд.

Проблем стратегија димензија 2 , 2 могу се решавати графички.

Наћи стратегију системом елиминације доминантних стратегија.

Одредити стратегију игре Камен-Маказе-Папир.

Игре са екстензивном формом

Посматрамо дрво игре.

Вредност игре је ½ и добија се мешовитом стратегијом (1 , 1

Покер игра – поново

У каквој се ситуацији налази II играч?

Које су стратегије природе?

Које су стратегије I играча?

Дакле, ово су 4 чисте стратегије I играча.

Формирајмо матрицу исплате овакве игре:

Алцхајмер – још један

Можемо направити матрицу исплате за сваку комбинацију стратегија. Видећемо да је стратегија

Приметимо да постоје различити информациони скупови за

Искреност је доминантна стртегија за продавца.

Матрична игра чији су делови игре

Нека су дате две матрице исплате,

Сада почетна игра има следећу матрицу исплате:

*Други начин за решавање је да се бројевне вредности почетне матрице I претворе у одговарајуће

Игра погађања карте

𝜋1 = (10 − √30) = 0.646

Ukupna proivodnja 𝑎 −je𝑄𝑄, 0

Ukoliko prva fabrika proizvede 𝑄𝐴 litara, tada će ona ostvariti profit

Kako da se probijemo na monopolističkom tržištu?

Da li je zarada dve fabrike u zbiru veća od zarade koju bi imao monopolista?

Kako se menja cena soka?

Sada, količina proizvoda