Professional Documents
Culture Documents
ВЕЖБЕ, 2014.
Теорија игара представља грану математике која своју примену налази у многим областима
нашег живота. Игре попут шаха, покера, фудбала, компјутерских игара се могу представити
математичким моделом који играчима може сугерисати како да се понашају да би постигли најбољи
резултат. Наведене игре се користе као разонода али права примена теорије игара је у социологији,
економији, биологији, инжењерингу, политичким наукама, рачунским наукама, психологији и
другим областима свакодневног живота. Преговори, такмичење међу фирмама за превласт на
тржишту, пласирање новог бренда само су неке од примена ове области.
Неки проблеми из теорије игара спомињу се још у V веку ове ере. Наиме, збирка древне
традиције и закона, The Babylonian Talmud, формирана током првих пет векова нове ере, која служи
као основа јеврејске вере, кривичног и грађанског права садржи, између осталог, проблем тзв.
брачног уговора у коме се наводи следеће: Човек који је за живота склопио брачни уговор три пута,
након смрти, својим женама оставља по 100, 200 односно 300 тадашњих новчаних јединица
(скраћено н.ј). У случају да укупно наслеђе износи само 100 н.ј тада се међу женама сугерише
једнака подела тог наслеђа, док је за укупно наслеђе од 300 н.ј расподела пропорционална
првобитном правилу и износи 50, 100 и 150 н.ј. Мистерија настаје када је укупно наслеђе 200 н.ј. које
се распоређује тако да жене добијају по 50, 75 и 75 н.ј. Дуго се постављало питање, како је
дефинисна последња подела и да ли је она коректна. Проблем је демистификован тек 1985.год. када
се дошло до закључка да свака подела одговара језгру коректно дефинисане кооперативне игре.
Са друге стране, првe забележене дискусије о теорији игара су из 1713.год. када је James
Waldegrave у свом писму написао прву познату минимакс мешовиту стратегију за каратшку игру Le
Her. Следи рад Augustin Cournot-а на тему дуопола објављен 1838.год. који садржи концепт решења
једне верзије Нешове равнотежне тачке, затим рад Ernst Zermelo-а који нуди одговор на питање да
ли у шаху бели играчи могу увек да обезбеде победу односно нерешену игру, па радови Emil Borel-а
из периода 1921-1927. када је објављена прва модерна формулација мештовите стратегије односно
минимакс решење игре за два играча са две или више могућих стратегија. Borel је у почетку тврдио
да игре са више могућих стратегија немају минимакс решење да би 1927.год ово оставио као
отворено питање јер сам решење није могао да пронађе. John von Neumann 1928.год. објављује
доказ минимакс теореме где доказује да се за сваку игру са нултом сумом за два играча и коначним
бројем стратегија може наћи победник, уз то да ако су дозвољене мешовите стратегије, постоји
тачно једно решење. John Von Neumann се иначе сматра творцем теорије игара, а књига коју је
написао у сарадњи са економистом Oskar Morgenstern-oм, „Теорија игара и понашање у економији”
[25] се наводи као прва такве врсте.
Значајан допринос, поред поменутих аутора, имали су Јohn Nash који је развио Nash
equilibrium и Thomas Schelling коме је дело The Strategy of Conflict [28] донело Нобелову награду,
затим Јohn Owen, Shmuel Gal, Steve Alpern и још многи други.
2
1. ОСНОВНИ ПОЈМОВИ, ДЕФИНИЦИЈЕ И ПОДЕЛА
Под појмом игре подразумевамо модел реалне конфликтне ситуације са једним или више
учесника. Теорију игара дефинишемо као научну дисциплину за решавање проблема конфликтних
ситуација.
Игру могу чинити један или више играча, тимови, групе, предузећа. Поред њих, на исход игре могу
да утичу и други фактори који ту игру описују. Учесник игре, када на њега дође ред да игра, повлачи
потез који се састоји у избору елемента из неког скупа.
Сваки учесник располаже неком информацијом о томе шта други могу да изаберу и шта им је циљ,
односно колико ће свако добити након повучених потеза, тј. по завршетку игре.
Основно питање у теорији игара је које потезе учесници треба да повлаче да би остварили свој циљ
и шта ће бити резултат ако свако игра најбоље могуће.
Циљ игре се дефинише функцијом исплате која представља нумерички израз добитка односно
губитка учесника неке игре. Поред потеза учесника, постоје и случајни потези који такође утичу на
функцију исплате.
Пут који играч изабере од почетка до краја игре називамо стратегијом и обележавамо са
Ai (ai , ai ,.., ai ), a, ik 1, 2,.., n .
ai
1 2 m k
Стратегија представља централни појам теорије игара и њом се унапред дефинишу могући избори
различитих алтернатива од стране играча за које се они могу определити у сваком стадијуму игре и
за сваку могућу историју игре од њеног почетка до њеног краја. Стратегија мора да садржи
комплетан план који ће узети у обзир све случајеве који се могу десити у току игре и да предвиди
исход за сваку информацију која би се могла добити у току игре. Приликом формирања стратегије од
играча се очекује да размишљају рационално и да доносе одлуке које су најбоље за њих. У сваком
стадијуму игре играч има могућност да размисли о свом наредном потезу или да пре самог почетка
игре испланира, независно од потеза осталих учесника игре, како ће се игра одвијати до краја. Скуп
свих стратегија једног играча називамо простором стратегија.
3
Постоје различите врсте игара при чему се као критеријуми за класификацију узимају број учесника,
број потеза учесника, доступност информација, функција исплата и други. Да би се формирао модел
неке конфликтне или кооперативне ситуације неопходно је учешће најмање два учесника док
постојање три или више учесника отвара могућност стварања тзв. коалиција, односно могућности да
се играчи усклађујући своје интересе координисано опредељују у избору стратегија. Најчешће се
проучавају игре са два играча обзиром да је са већим бројем играча проблем моделирања
сложенији док игре са једним играчем спадају у екстремне случајеве.
Тотално мешовитом стратегијом дефинише се стратегија у којој играч свим својим чистим
стратегијама додељује строго позитивну вероватноћу.
Стратегију која i-том играчу одређује који потез из скупа алтернатива да направи у датом
тренутку обележавамо са si . Кажемо да игра има стратегију s (s1, s2 ,..., sn ако су са s1, s2 ,.., sn
)
обележене стратегије свих n играча. Ознаку si користимо за стратегију игре која не садржи
стратегију i-тог играча. Оптималном стратегијом сматрамо ону стратегију играча која му при
вишеструком понављању игре обезбеђује максимални могући средњи добитак. Добитак који i-ти
играч осваја играњем стратегије Ai одређен је функцијом исплате f, тј. кажемо да је i-ти играч
добио износ fi f (Ai ) . Концепт решења игре и оптималних избора играча јасан је у само малом
броју конфликтних ситуација.
Према карактеру функције плаћања све игре делимо на игре са нултом сумом1 (енг. zero-sum) и
игре са ненултом сумом (енг. nonzero-sum). Игра са нултом сумом представља игру у којој сваки
играч гарантује одређени износ (исплату) као исход игре независно од осталих играча и њихових
стратегија тако да победник игре добија све загарантоване износе док су поражени на губитку за
износ који су гарантовали а укупна сума исплата свих учесника игре износи нула,
n
f (A1, A2 ,..., An ) f (Ai ) 0 .
i1 n
i
4
Alpern [1], J.G. Foreman [32] и M. Zelinkin [33]. Највећи допринос је имао S. Gal [18].
5
Кооперативне игре представљају такву врсту игара у којима играчи формирањем коалиције и
усклађивањем избора појединачних стратегија имају за циљ постизање најповољнијих резултата за
коалицију којој припадају.
Уколико је сваки играч изабрао стратегију тако да ниједан не може да профитира променом своје
стратегије под претпоставком да остали играчи не мењају своје стратегије тада кажемо да тренутни
скуп изабраних стратегија, и одговарајућих добитака представља Нешов еквилибријум (енг. Nash
equilibrium). Односно концепт решења игре у коме је сваки играч донео најбољу могућу одлуку
узевши у обзир одлуке свих осталих играча називамо равнотежном стратегијом. Код формирања
равнотежних стратегија треба узети у обзир то да оне не морају постићи највећу збирну добит за све
играче. Често играчи могу да повећају своју добит ако би некако могли да се договоре око симултане
промене своје стратегије. Пример таквих договора је код конкурентних трговаца.
Уколико у току игре не постоји координација у понашању од стране учесника, за такву игру
кажемо да је некооперативна2, тј. антагонистичка.
2
John Nash, John Hаrsanyi и Reinhard Selten су 1994. године добили Нобелову награду из економије за рад у области
некооперативне теорије игара.
6
Анализираћемо најједноставнију игру са два играча чији су интереси директно
супротстављени. Обојици играча познати су скупови могућих избора X и Y, као и функција плаћања,
f : X Y R . Игра има прост ток:
Први играч бира елемент x из свог скупа могућих избора X.
Други играч, не знајући шта је први изабрао, бира један елемент y из свог скупа могућих
избора Y.
Затим први играч добија износ f (x, y) а други f (x, y) .
Циљ сваког играча је да добије што више. Како је збир добитака нула, колико један од играча
добије, толико други изгуби. Стога је циљ другог играча, заправо, да први играч добије што мање.
Овакав тип игре је антагонистички, односно ово је игра са нултом сумом за два играча.
Први играч може себи да гарантује добитак u ако је за неко x X , f (x, y) u, y Y .
Највећи добитак који може да оствари први играч, без обзира како је други играо, је оптимална
вредност проблема
max u п.о x X f (x, y) u, y (1)
. и Y
Слично, други играч може да ограничи добитак првог играча на оптмалну вредност проблема
min v п.о y Y f (x, y) v, x (2)
. и X
Ако су (x, и (v, y) произвољне допустиве тачке проблема (1) и (2) онда је и u f (x, y) и f (x, y) v па
u)
је и u v . Стога оптимална вредност проблема
(1) није већа од оптималне вредности проблема (2).
У случају да су оптималне вредности (1) и (2) једнаке, постоји реалан број w такав да први
играч може да гарантује добитак w без обзира како је други играо, док други играч може да
гарантује да први не може добити више од w ма како играо. Такав број w се назива вредност игре.
Избори xˆ и yˆ такви да су (xˆ, w) (w, оптимална решења проблема (1) и (2), називају се
и yˆ)
оптимална стратегија првог, односно оптимална стратегија другог играча.
Описан случај односи се на избор чистих стратегија играча. Сличан резултат може се постићи
формирањем мештовитих стратегија при вишеструком понављању игре а следећа теорема нам
гарантује оптималност игре.
Минимакс теорема3: За сваку коначну игру са нултом сумом са два играча
1) постоји број w који се назива вредност игре,
2) постоји мешовита стратегија првог играча тако да очекивана вредност игре буде најмање
w независно од потеза другог играча и
3) постоји мешовита стратегија другог играча тако да његов очекивани губитак буде највише
w независно од потеза првог играча.
Ако је број w jeднак нули, кажемо да је игра фер (енг. Fair). За позитивну вредност броја w кажемо да
игра фаворизује првог играча док се за негативно w фаворизује други играч. Функцију исплате за
коначне стратегијске игре са два играча најлакше је представити матрично па се често такве игре
називају матричним играма.
Дефиниција: Матрична игра је игра за два играча која на располагању имају m, односно n
стратегија ( m, n N, m, n 1) дефинисана на следећи начин: Играчи се договарају да ли ће њихове
страгегије бити представљене колонама или врстама матрице тако да елементи матрице буду
исплате за одговарајући избор стратегија, тј. ако је играч чије су стратегије представљене врстама
изабрао стратегију x а играч чије су стратегије представљене колонама изабрао стратегију y тада
вредност f (x, y) представља одговарајућу исплату.
7
3 Доказ минимакс теореме се може наћи у [7], страна 291-293.
8
Пример 1: (Писмо - глава)
Два играча истовремено бацају новчић. Уколико код оба играча падне писмо или код оба играча
падне глава, први играч добија новчић од другог играча. Ако падну различите стране исплата је
обрнута. Решити матричну игру.
Матрица исплате представљена је табелом бр. 1.1.
Матрица исплате, Табела бр. 1.1
Други играч
Писмо Глава
Писмо 1 -1
Први играч Глава -1 1
Оптимална вредност проблема (1) је -1 док је оптимална вредност проблема (2) 1 те игра нема
вредност. Уколико се игра понавља више пута, добијени резултати се могу „поправити“ и може се
добити вредност игре.
Претпоставимо да се глава и писмо бацају са једнаким вероватноћама, p(писмо) p(глава) 1/ 2 .
Први играч, уз претпоставку да ће други бацити писмо може постићи оптималну вредност
f (x, писмо) 1 p(писмо) (1) p(глава) 0 , f (x, глава) (1) p(писмо) 1 p(глава) ако је други
0
односно бацио главу.
Слично, оптимална вредност игре за другог играча уз претпоставку да први баца писмо износи
f (писмо, y) (1) p(писмо) 1 p(глава) , f (глава, y) 1 p(писмо) (1) уз претпоставку да
p(глава)
односно први баца главу.
Приметимо да су оптималне вредности оба проблема једнаке, па тако игра има вредност која износи
w0.
У већини случајева игре нису са нултом сумом и исплате које играчи добијају не морају да
зависе једна од друге. Код таквих игара се за сваког играча посебно формира матрица исплате,
односно код игара са два играча уместо две матрице може да се користи једна биматрица при чему
први елемент поља матрице представља исплату за првог играча а други елемент исплату за другог
играча.
Пример 2:
Двојица лопова су након почињеног прекршаја ухваћена и доведена на саслушање. Саслушање се
изводи за сваког починиоца прекршаја посебно а како полиција нема довољно података да их
оптужи за прекршај нуди следећи договор: Онај лопов који пристане да сарађује биће ослобођен
кривице док ће његов саучесник служити казну у трајању од 12 месеци затвора. Уколико оба лопова
пристану на сарадњу и признају кривицу, осуђују се на казну у трајању од 3 месеца, односно уколико
ни један од лопова не буде сарађивао услед недостатака доказа биће осуђени на 1 месец затвора за
неке друге ситне прекршаје за које полиција има доказа. Ако се претходно нису договорили, како да
се лопови понашају након ове понуде тако да себи обезбеде минималну дужину затворске казне?
Описан проблем познат је као Дилема затвореника. Дужина трајања казне представљена је
биматрицом исплате, у табели број 1.2.
Биматрица исплате, Табела бр. 1.2
Лопов 2
Не сарађује Сарађује
Не сарађује (1,1) (12,0)
Лопов 1 Сарађује (0,12) (3,3)
Лопови не знају како ће њихов саучесник да се понаша и желе да постигну најбољи договор за себе.
Уколико сарађују лоповима се отвара могућност служења казне у трајању од 0 или 3 месеца што је
бољи резултат од оног који би постигли када не би сарађивали (дужина трајања казне била би 1 или
12 месеци). Пре него што наставимо анализу проблема уводимо појам доминантности.
9
Дефиниција: Кажемо да i-та врста матрице Amn доминира над k-том врстом ако f (i, j) f (k, j) за
је
свако ј. Кажемо да i-та врста строго доминира над k-том врстом ако је f (i, j) f (k, за свако ј.
j)
Слично, j-тa колона матрице Am доминира (строго доминира) над k-том колоном ако је
n
f (i, j) f (i, k) ( f (i, j) f (i, k) ) за свако i.
Ако i-та врста доминира над k-том врстом, k-ту врсту можемо да обришемо обзиром да она не утиче
на коначни исход игре. Аналогно, ако ј-та колона доминира над l-том колоном, l-та колона се такође
може обрисати па се тако димензија матричне игре може смањити. Мешовите стратегије такође
могу да буду доминантне.
Коришћењем особине доминантности следи да ће оба лопова сарађивати (елиминисати колону не
сарађује) што ће их довести у тзв. „lose-lose“ ситуцију и затворску казну у трајању од 3 месеца. Да су
имали могућност договора, лопови би себи могли да обезбеде казну у трајању од 1. месеца.
Стратегије (не сарађује, не сарађује) и (сарађује, сарађује) се називају равнотежним стратегијама.
Преговори су једна од примена теорије игара. Дилема затвореника је дефинисана тако да се од
лопова очекује да ће изабрати опцију сарађуј.
Пре него што наставимо са анализом и решавањем игара, задржимо се на преговорима и на
претпоставкама које се иначе односе на њихове учеснике. Најпре претпоставља се да су играчи
савршено рационални појединци који настоје да максимизују своју добит, односно да постигну што
бољи резултат који одговара њиховим властитим критеријумима. Под рационалним понашањем
подразумевамо да се одлука доноси и на основу предвиђања (антиципације) могућих потеза
противника. Играчи ће често замишљати да се налазе на месту свог конкурента како би могли да
предвиде његове потезе и у складу са тим прогнозама одреде своју стратегију. Да би то било могуће,
претпоставља се да не постоје интелектулане, искуствене и друге разлике између играча, односно у
питању су играчи који се сматрају равноправним противницима. Такође се претпоставља да играчи
располажу потпуном информацијом о могућим стратегијама и резутатима које свако од њих
остварује. Да закључимо, да су лопови рационално сагледали своју и ситуацију свог саиграча
определили би се за опцију не сарађуј и мање времена провели у затвору.
Два рационална појединца, уколико добровољно ступају у преговоре на основу ранијих искустава и
договора знају све могуће исходе тих преговора па им могу приписати одређене нумеричке
вредности као ниво корисности. Скуп свих резултата које појединци могу да остваре представњају
тзв. доступну област. На почетку се из доступног скупа одређује једно решење проблема, без
претходних договора преговарача. Такво решење називамо status quo (нпр. (x*, y*) ). Из доступног
скупа, обзиром да су савршено рационални, преговарачи неће посматрати сва решења већ само она
која су парето оптимална4. Из тако одређене недоговорене позиције позитивним линеарним
трансформацијама играчи долазе до позиција које ће им омогућити већу корисност, па ће
договорена стратегија уједно бити и парето максимална.
1
4
Парето оптимална су она решења у којима оба игрча постижу боље исходе у односу на не-ефикасна решења. Скуп свих
парето оптималних тачака чини тзв. преговарачки скуп P
1
следи да ће играчи постизањем договора поправити свој резултат за износ xˆ x * , односно износ
yˆ y * . Ако скуп P садржи само један избор стратегија, тада је проблем тривијалан и договор ће
одмах бити постигнут. Уз претпоставку да се у преговарачком скупу налазе најмање две алтернативе
које играчи различито преферирају добијамо проблем одређивања договорне стратегије.
Претпоставимо да важе следеће аксиоме:
А1: Договорна стратегија (xˆ, yˆ ) припада преговарачком скупу, (xˆ, yˆ ) P .
А2: Договорна стратегија обезбеђује играчима већу добит од status quo стратегије,
f (x*, y*) f (xˆ, yˆ ) .
А3: Договорна стратегија је парето максимална за дефинисан скуп P.
А4: Ако је P1 P, и (xˆ, yˆ ) P тада је (xˆ, yˆ ) P1
А5: Линеарним трансформацијама стратегијског скупа P у скуп S,
x ' 1 x 1
y ' 2 y 2
где су 1 , 2 0, 1 , 2 произвољне константе, договорна стратегија (xˆ, yˆ) се
трансформише у стратегију (1 xˆ 1 , 2 yˆ 2 ) .
А6: Ако P има симетрију по некој координати, тада симетрични играчи добијају исте износе.
Неш је показао да важи следећа теорема:
Теорема: Ако су задовољени услови А1-А6 тада постоји тачно једна тачка договора (xˆ, yˆ ) у
преговарачком скупу P која је решење проблема
max (x *x)( y *y) п.о. x, y P, x x*, y y * . (3)
Добијена стратегија се назива равнотежном стратегијом.
Претпоставимо сада да два играча, која имају на располагању две стратегије могу да понове
игру више пута. Коју стратегију при сваком понављању игре играчи треба да бирају како би у просеку
постигли најбољи резултат?
Нека је нови проблем представљен биматрицом исплата дефинисном табелом бр. 1.3 и нека играчи
бирају своје стратегије са вероватноћама p1 и p2 , односно са вероватноћама 1 p1 и 1 p2 . Играчи
повлаче потезе гарантујући да њихова исплата неће зависити од избора стратегије другог играча.
Биматрица исплате, Табела бр. 1.3
Други играч
Стратегија А Стратеија Б
Стратегија А (a11, b11 ) (a12 , b12 )
Први играч
Стратегија Б (a21, b21 (a22 , b22 )
)
Исплата првог играча при избору стратегије А у просеку износи f (A, y) [a11]p2 [a12 ](1 p2 односно
)
f (Б, y) [a21]p2 [a22 ](1 p2 при избору стратегије Б. Слично, исплата другог играча при избору
)
стратегије А у просеку износи f (x, A) [b11]p1 [b21](1 док исплата за изабрану стратегију Б у
p1)
просеку износи f (x, Б) [b12 ]p1 [b22 ](1 p1) . Изједначавањем исплата за сваког играча посебно
добијамо вероватноће избора стратегија и очекиване исплате:
p1 b22 b21 a11a22 a12 a21
b11 b12 b21 b22, a11 a12 a21 a22 ,
f (x, )
Поступак и тежина налажења најбоље стратегије најчешће зависи од димензија и врста матрица.
Коришћењем особине доминантности (дефиниција 1.2) матрице димензија m n се могу превести у
матрице димензија (m 1) n или m(n 1) а понављањем овог поступка се у неким случајевима може
1
добити матрица димензије 11 која би представљала решење датог проблема. Проблеме чије су
матрице исплата димензије 2 n, n 2 или m 2, m 2 најчешће решавамо графичким путем.
1
Задаци за вежбу
Ним игра
Ним игра је једна од најстаријих познатих математичких игара за два играча. Настала је пре више од
100год у Немачкој. На столу се налазе две гомиле предмета. Играчи наизменично уклањају предмете
са тих гомила тако да сваки играч, када дође његов ред да игра, са било које од те две гомиле може
склонити колико год жели предмета. Побеђује онај играч који склони последњи предмет.
Решење:
Bouton-ова теорема
Позиција 2 je победничка позиција ако и само ако је ним сума једнака нули.
Ним игра 2
Посматрамо ним игру али са три гомиле. Наћи стратегију тако да без обзира на потез противника
увек победите у игри.
a) 1,2,3
b) 13,17,19,23
c) 12,19,27
Ним игра 3
Претпоставимо сада да постоје две гомиле са по два предмета. Први играч може да узме један или
два предмета са једне гомиле. Затим игра други играч који може такође да узме један или два
предмета (уколико их има) исто само са једне гомиле. Играчи играју наизменично све док један од
играча не повуче последњи предмет чиме губи игру.
Да ли може да се направи стратегија првог играча која ће омогућити победу без обзира на игру
противника?
1
Решење:
// експлицитна норма игре или дрво игре
Le Her
Два играча „вуку“ карту из стандардног шпила од 52 карте не гледајући је. Побеђује онај играч чија
карта има већу вредност. Играчи имају могућност да затраже размену карата (осим ако неко од њих
има краља – краљ је највећа карта), могу да замене за нову произвољно изабрану карту (осим ако
нова карта није краљ). Уколико су карте исте „тежине“, побеђује онај играч кој је други повукао
карту.
Решење:
Први играч треба да затражи замену сваке карте мање од 7 и да чува сваку карту већу од 7.
Други играч треба да замени сваку карту мању од 8 и сачува сваку карту већу од 8.
Проблематични су случајеви када оба играча мењају карте.
Еуклидова игра
Дата су два броја, 𝑎 и 𝑏. Наизменично се узима мањи број, помножи неким бројем и одузме од
већег. Онај играч који добије 0 побеђује.
Решење:
𝑎 = 5, 𝑏 = 13 1,1 → 1 − 1 * 1 = 0
13 − 5 * 1 = 8
5,8 → 8 − 5 * 1 = 3
5,3 → 5 − 3 * 1 = 2 Ko добија? Ако је 𝑛 = Фибоначијевог
2
3,2 → 3 − 2 * 1 = 1 броја први добија, иначе губи.
2,1 → 2 − 1 * 1 = 1
1
Игра бројева
Играчи наизменично записују бројеве од 1 до 9. Побеђује онај играч чији број у збиру са свим
претходним даје 100.
Решење:
// антагонистичка игра са потпуном информацијом.
Други играч може себи да обезбеди победу тако што за сваки избор броја првог играча он бира
10 − . Дакле, посматрати као проблем од 0 до 10.
Бацање новчића
Два играча бацају новчиће. Уколико код оба играча падне глава или код оба падне писмо, први
исплаћује 1 дин другом, уколико код првог падне глава а код другог писмо и обратно, други
исплаћује 1 дин. Направити дрво исплате.
Оцена
Нека сваки студент напише број 𝛼 или број 𝛽 тако да нико у његовом окружењу не види шта је
написао. Произвољно ћемо упарити резултате у једну форму тако да нико не зна са ким је у пару. На
основу следећих правила студенти ће добити оцене за овај курс:
ако је један студент написао 𝛼 а други 𝛽 тада ће први добити 100 поена а други оцену 70.
ако су оба студента уписала 𝛼 тада ће оба студента добити 80 поена.
ако је први уписао 𝛽 a други 𝛼 тада ће први добити 70 а други 100 поена
ако су оба студента уписала 𝛽 тада ће оба студента добири оцену 90 поена.
Решење:
Написати стратегију за сваког посебно а затим биматричну форму.
Пребројати 𝛼 и 𝛽 и дискутовати зашто су то изабрали.
Објаснити шта је строга доминација.
НАПОМЕНА:
𝑎 𝖰
𝛼 (0,0) (3,-1)
𝛽 (-1,3) (1,1)
Ставити се на место противника и размислити о томе како ће он играти.
Добили смо дилему затвореника.
Да ли дилему затвореника примењујемо и ми?
Да! Ко има цимере? Да ли сређује стаан? Да ли очекује да ће други средити стан?
Да ли на сређивање стана утиче понављање проблема?
Како бисте играли ако знате да је ваш противник добрица а ви сте злоћа?
Да ли се користи још негде? Ја нећу да спустим цену ако и ти не спустиш?
Краљ и шах
Два играча померају краља од горњег десног угла до доњег левог угла без удаљавања. Играч који
остане без потеза губи. Наћи оптималну стратегију ако се коњ једино не сме да иде уназад.
Решење:
Игру решити уназад. Крећемо од последњег потеза и враћамо се до почетка.
Попуњавање бројева 1
Два играча попуњавају * цифрама. Први каже цифру други је упише. Циљ првог играча је што већи
број док је циљ другог играча што мањи број.
* 2
-1 *
Решење:
Направимо дрво игре.
Ако први играч бира број 9, тада ће тај број други играч уписати на позицију доле-десно, следећи
избор броја се мора уписати у поље горе лево, чиме добијамо 92-19=73.
Уколико би као први број изабрали 8 а наредни 9, у најбољем случају, добили би 92-18=74 (а како
циљ противника није да добијемо што више, већ што мање, он ће играти 82-19=63).
Вредност игре је 73!
Попуњавање бројева 2
Први играч каже цифру. Други је допуни. Разлика бројева је исплата. Доказати да је оптимална
вредност 4000.
* * * *
-* * * *
Решење:
Игра се по истом принципу као и прва игра. Ако бирамо бројеве веће од 5, други играч ће их
паковати у други ред, односно у први ред уколико бирамо бројеве мање од 5. Највећу вредност
добијамо за 9999-5999=4000.
Полиноми
Нека је дат полином 𝑎 + 2 + 𝑏 + 𝑐. Играчи наизменично бирају коефицијенте. Ако полином има
тачно једну реалну нулу побеђује први, иначе побеђује други.
Решење:
Разликујемо 3 случаја:
I: 𝑐 = 1,
II: било шта,
III: други бира исто што и први: + 2
+𝑎 +1= 𝑎 +1 2
+1
1
X-O
Циљ је направити правоугаоник масималне површине – добија први играч.
Решење:
Нпр.
8 5
O X
1 2
X O
3 7 9
X X X
4 6
O O
Два топа
Два топа се померају једно или два места унапред (нема уназад) дуж неког низа поља. Губи онај топ
који нема потез. Наћи оптималну стратегију играча.
+ +
Решење:
Решавамо проблем у зависности од броја расположивих поља. Оптимални резултат добија се
индукцијом уназад. Гледамо која позиција нам је добитна.
Ако је дужина низа 3 + 2 први губи
Ако је дужина низа 3 први добија
Ако је дужина низа 3 + 1 добија
1
Игре са нултом сумом за два играча
Игра 1
Посматрамо игру за два играча која бирају један од бројева 1,2 . Уколико је сума изабраних бројева
пар, добија други играч, односно ако је непар, добија први играч. Износ који добија победник а
исплаћује побеђени је сума изабраних бројева изражена у динарима.
Решење:
Обележимо стратегије играча са = 1,2 и = 1,2 . А матрицу исплате, М са
−2 3
𝑀=[ ]
3 4
Да ли је неко од играча фаворизован?
Посматрајмо проблем из угла 1.играча:
Претпоставимо да први играч бира „1“ са вероватноћом 3/5 а „2“ са вероватноћом 2/5
Разликујемо два случаја:
1. Други бира „1“: први губи 2 динара3 у 3/5 случајева
2
док добија 3 динара у 2/5 случајева, тј.
исплата коју добија први је: −2 + 3 + 0
5 5
2. Други бира „2“: први добија 3 долара у 3/5 случајева, док губи 4 долара у 2/5 случајева,тј.
3 2
исплата коју добија први је 3 − 4 =1/5
5 5
Дакле,, ако први комбинује свој избор на описан начин, добија сваки пут када други бира „2“
односно остаје без зараде ако он бира „1“. Да ли први играч може да поправи своју ситуацију тако да
увек добије износ без обзира на потез другог?
Стратегија у којој један играч гарантује себи исту исплату без обзира на потез другог играча назива се
изравнајућом стратегијом.
Игра 2
Решавати проблем из 12 тако да исплата буде производ изабраних бројева а не збир. Направити
матрицу исплате и одредити најбољу и оптималну стратегију.
1
Игра 3
Први играч има црног кеца и црвену 8. Други играч има црвену 2 и црну 7. Играчи наизменично
бирају једну од карата за игру. Ако је изабрана карта исте боје, први добија. Други добија ако су
карте различите боје. Износ који се исплаћује победнику је једнака броју са карте победника.
Направити матрицу исплате и одредити стратегије.
Игра 4
Први играч путује возом од Београда до Ниша како би побегао од другог. Други креће експрес возом
за њим. На том путу постоји успутна станица у Крагујевцу на којој први играч може, а и не мора, да
изађе. Други играч је свестан међустанице тако да и он може да прекине потрагу у Крагујевцу. Ако је
матрица исплате другог играча дата, одредити оптималну стратегију за оба играча и одредити њену
вредност.
100 −50
0 100
Игра 5
Решити биматричну−10
игру (наћи
2 равнотежну тачку) aко су матрице исплате А и B.
5 −2
A=[ ], 𝐵 = [ ]
1 −1 −1 1
Решење:
Некај је (𝑥^, 𝑦^) равнотежна тачка, односно важи
𝑥^ 𝑇 𝐴 𝑦^ ≥ 𝑥 𝑇 𝐴 𝑦^, ✯𝑥 (1)
𝑥^ 𝑇 𝐵 𝑦^ ≥ 𝑥^ 𝑇 𝐵𝑦, ✯𝑦 (2)
𝑥 𝑦
При чему је je 𝑥^ = , 𝑦^ = 1 − 𝑦
Решавамо систем 1 − 𝑥 −10 2 −10 2
[𝑥 1 𝑦 − 𝑥] [ ][ ] ≥ [1 𝑦] [
0 ][ ],𝑥 = 1
1 −1 1 − 1 −1 1 − 𝑦
−10 2 𝑦 −10 2
[𝑥 1
𝑦 − 𝑥 ] [ ][ ] ≥ [0 𝑦] [
1 ][ ],𝑥 = 0
1 −1 1 − 𝑦 1 −1 1 − 𝑦
Аналогно за (2).
Добијамо да је
(1 − 𝑥)(14𝑦 − 3) ≥ 0
𝑥(−14𝑦 + 3) ≥ 0
(9𝑥 − 2)(𝑦 − 1) ≥ 0
𝑦(9𝑥 − 2) ≥ 0
Решавамо по x и по y:
Za 0 < 𝑥 < 1 ⇒
−14𝑦 + 3 ≥ 0 3
}⇒ 𝑦=
14𝑦 − 3 ≥ 0 14
Za 0 < 𝑦 < 1
1
9𝑥 − 2 ≤ 0 2
} ⇒ 𝑥 =
9𝑥 − 2 ≥ 0
2 3
9
Дакле, тражена равнотежна тачка је ,
9 14
1
Игра 6
Наћи равнотежне тачке за следећу биматричну игру
(2,1) (1,3)
(𝑥, 𝑦) = [(1,4) (3,1)]
Решење:
Аналогним поступком из игре 6 добијамо равнотежну тачку (3 , 2) .
5 3
Игре са информацијама
1
Решење:
Имамо на располагању 4 различите стратегије:
1. Ако шеф наручи велико пиво и ми ћемо наручити велико пиво, ако шеф наручи мало пиво, ми
ћемо велико
2. Ако шеф наручи велико пиво и ми ћемо велико, ако шеф наручи мало пиво и ми ћемо мало
пиво.
3. Ако шеф наручи велико пиво, ми ћемо мало, али ако после тога вођа наручи вечико пиво, ми
ћемо мало.
4. Ако шеф наручи велико пиво ми ћемо мало, али ако он после тога наручи мало и ми ћемо
мало пиво.
Проблем владе
Влада жели да помогне сиромашним у смислу да им понуди посао и никако другачије. Радник тражи
посао уколико му социјална помоћ није довољна. Одредити оптималну стратегију ако је дата
матрица исплате.
Радник
посао просјачење
Влада помоћ (3,2) (-1,3)
без помоћи (-1,1) (0,0)
Решење:
- Стратегија (Помоћ,Посао) није Нешова равнотежна стратегија зато што би радник на Владину
понуду за послом изабрао издржавање.
- Стратегија (Помоћ, Просјачење) такође није равнотежва тачка обзиром да би као одговор на
просјачење, Влада изабрала без помоћи.
- (без помоћи, просјачење) није Нешова тачка обзиром да би радник изабрао да ради
- (без помоћи, посао) такође није Нешова, зато што се у том случају Влади више исплати помоћ,
који нас враћа на прву стратегију.
Дакле, решење се крије у мешовитој стратегији.
Нека Влада бира стратегију са вероватноћом 𝜃𝑎, oдносно 1 − 𝜃𝑎.
Нека Радник бира стратегију са вероватноћом 𝛾w, oдносно 1 − 𝛾w
Стратегија Владе је следећа:
𝜋𝑎 = 𝜃𝑎[3𝛾w + (−1)(1 − 𝛾w)] + [1 − 𝜃𝑎][−1𝛾w + 0(1 − 𝛾w)] = ⋯ = 𝜃𝑎[5𝛾w − 1] − 𝛾w
Kод чистих стратегија 𝜃𝑎 је једнако нули или јединици, док то није случај код мешовитих.
Ако желимо да максимизујемо зараду Владе, ∂𝜋рачунаћемо извод фунцкије исплате:
𝑎
= 5𝛾 − 1
1
∂𝜃𝑎 w
1
Дакле, ако радник буде желео да ради 20% свог времена, Влада ће имати максималну добит.
Уколико раник жели да ради мање од 20% Влада бира да му помогне, односно ако Радник одлучи да
ради више од 20% свог времена, Влада бира да га не издржава.
Зарада из угла Радника је следећа:
𝜋w = 𝜃𝑎(2𝛾w + 3[1 − 𝛾w]) + (1 − 𝜃𝑎)(1𝛾w + 0[1 − 𝛾w]) = ⋯ = −𝛾w(2𝜃𝑎 − 1) + 3𝜃𝑎
Maксимизујемо зараду Радника, 𝑑𝜋w
= −(2𝜃 − 1) = 0
𝑎
Следи да је 𝜃𝑎 = 1 2 𝑑𝛾w
Дакле, ако Радник одлучи да ради са вероватноћом 0,2 Влада је неодлучна око тога да ли пружи
помоћ 100% или да не пружи помоћ. Да ли Влада има бољу стратегију?
Два тинејџера возе аутомобиле један према другом у пуној брзини. Први који скрене губи. Ако један
скрене а други не, тада други добија исплату 2,000 а први који је скренуо добија (-1,000). Уколико
обојица скрену, тада је резултат 0 за обојицу. Уколико ни један не крене, то је најгоре за обојицу и
износ је (-4000,-4000).
Приказати графички.
2
Доминантне стратегије
Стратегија 1
2 0 4
𝐴 = ( 1 2 3)
4 1 2
Видимо да 2.колона доминира 3.колону. Из тог разлога, последњу колону можемо обрисати.
Посматрамо нову матрицу исплате:
2 0
𝐴’ = (1 2)
4 1
Сада, приметимо да последња врста доминира прву, дакле бришемо и прву врсту.
1 2
𝐴’’ = ( )
4 1
Последња матрица исплате је лако решива и вредност игре износи 7/4 а добија се избором
вероватноћа 𝑝 = (3 , 1) oдносно = (1 , 3) .
4 4 4 4
Дакле, оптималне стратегије играча су
I: (0, 3 , 1)
1 3 4
4
II: ( , , 0)
44
Стратегија 2
0 4 6
𝐴 = (5 7 4)
9 6 3
Приметимо да чистих доминантних стратегија нема, али зато мешовита стратегија у којој се са
вероватноћом ½ бирају I и III колона доминира II колону.
Брисањем друге колоне, решавамо нови проблем:
0 6
𝐴’ = (5 4)
9 3
Приметимо сада да средњу врсту доминирају I и III врста које се бирају са вероватноћом 1/3 и 2/3.
Нова матрица исплате је сада:
0 6
𝐴’’ = ( )
9 3
Вредност игре А’’ је 9/2.
Стратегија 3
1 3 5 3
𝐴 = ( 4 0 2 2)
3 7 3 5
2
Стратегија 4
2 3
𝐴=( 1 5
)
4 1 6 0
Стратегија 5
1 5
𝐴 = (4 4)
6 2
Претпоставимо да се колоне бирају са вероватноћама 𝑞 и 1 − 𝑞. Игра се може приказати графички
𝑔(1) = 𝑞 + 5(1 − 𝑞)
𝑔(2) = 4𝑞 + 4(1 − 𝑞)
𝑔(3) = 6 + 2(1 − 𝑞)
2
Камен-Маказе-Папир
Решење:
Прво ћемо да нацртамо дрво игру.
Ово је 3 потезна игра.
Први потез има природа (избор карте првог играча)
Други потез има први играч који бира да ли ће се кладити или не.
2
Трећи потез има други играч који такође може да се клади или да одустане.
2
Алцхајмер
Први играч баца новчић (на коме са једнаким вероватноћама падају писмо и глава) и не показује
резултат другом играчу а затим одлучује да ли ће да уложи 1 динар или 2 динара. Други играч не зна
шта је пало, али на основу потеза првог играча треба да погоди да ли је пала глава или писмо. Сада
први играч, који је мало забораван, на основу свог улога и предлога другог играча одлучује да ли ће
да дуплира или да одустане. Други играч побеђује уколико је његова претпоставка добра, односно
губи ако није. Износ зараде је једнак (опкладе + 1 уколико је глава) (x2 ако први дуплира). Нацртати
дрво игре.
Први играч вуче карту из шпила од 52 карте потпуно произвољно. Након што је погледа, може да
уложи или 1 или 5 уз напомену да је карта коју је извукао карта слика (краљ, краљица, жандар – вуку
се са вероватноћом 3/13). Други играч или признаје или дуплира. Ако признаје да је први у праву,
плаћа му износ опкладе (без обзира на то која карта је извучена). Уколико дуплира, показује се карта
и први или исплаћује другог двоструки износ опккладе или зарађује од другог двоструки износ
опкладе.
а) Нацртати дрво игре (*размотрити да ли ће први играч увек бирати
5) б) Наћи одговарајућу нормалну форму игре
ц) Решити проблем
2
Делимични алцхајмер
Посматрамо игру за 2 играча. Први играч бира потез 𝑥, 𝑥 1,2 . Други играч зна шта је први играч
изабрао и сам бира 𝑦, 𝑦 1,2 . Први играч игра поново, али заборављајући шта је сам играо, зна
само који потез је изабрао други играч и на основу тога он такође бира 𝑧 1,2 . Игра се завршава и
други играч плаћа првом играчу износ (𝑥, 𝑦, 𝑧) aко је матрица исплате следећа:
𝑥 𝑦 𝑧 𝑀(𝑥, 𝑦, 𝑧)
1 1 1 -2
1 1 2 -1
1 2 1 3
1 2 2 -4
2 1 1 5
2 1 2 2
2 2 1 2
2 2 2 6
Одредити стратегију другог играча. Проблем свести на дрво.
Решење:
Посматрамо стратегије играча одвојено:
Стратегије првог играча су (8 стратегија):
𝑥 𝑦 𝑧
1 1 1
1 1 2
1 2 1
1 2 2
2 1 1
2 1 2
2 2 1
2 2 2
Стратегије другог играча су (4 стратегије)
𝑦 𝑧
1 1
1 2
2 1
2 2
Формирамо дрво:
2
Бомба
Два играча наизменично траже бомбу која се налази у три поља (означена словма А, B и C).
Вероватноћа да се бомба налази у неком од тих поља дата је са 𝑝(𝐴) = 1 𝑝(𝐵) = 1 ,𝑝( ) = 1. Играчи
3 2
6
поља бирају наизменично. Ко пронађе бомбу, добија 1 дин, а ко изгуби исплаћује тај 1 дин.
Нацртати дрво игре и нормални облик игре.
Решење:
Формирати дрво исплате.
Да ли играчи знају свој претходни потез?
Реклама
Три фирме производе исти производ и рекламирају се путем медија. Реклама може да се пушта
ујутру или увеле. Ако се увече рекламира само једна фирма, тада је добитак те фирме 2, уколико се
нека фирма једина рекламира ујутру, тада је њен добитак 1, међутим уколико се у истом термину
рекламирају две или све три фирме, добитак је 0. Одредити стратегију рекламирања.
Решење:
Обележимо фирме са I, II и III, а термине приказивања рекламе са 𝑅1, 𝑅2, 𝑅3
Посматрамо следећу матрицу исплате
I II III 𝑅1 𝑅2 𝑅3
1 1 1 0 0 0
1 1 2 0 0 2
1 2 1 0 2 0
1 2 2 1 0 0
2 1 1 2 0 0
2 1 2 0 1 0
2 2 1 0 0 1
2 2 2 0 0 0
𝑥 𝑦 𝑧
Oбележимо стратегију фирми са 𝑥^ = (1 − 𝑥 ) , 𝑦^1 = (1 − 𝑦 ) , 𝑧 = ( )
1−𝑧
Oчекивани добитак I играча:
𝜋1 = 0 · 𝑥𝑦𝑧 + 0 · 𝑥𝑦(1 − 𝑧) + 0 · 𝑥(1 − 𝑦)𝑧 + 1 · 𝑥(1 − 𝑦)(1 − 𝑧) + 2 · (1 − 𝑥)𝑦𝑧 + 0 · (1 − 𝑥)𝑦(1 − 𝑧)
+ 0 · (1 − 𝑥)(1 − 𝑦)𝑧 + 0 · (1 − 𝑥)(1 − 𝑦)(1 − 𝑧)
да би добитак био позитиван, мора да важи: 𝜋1 ≥ 0
Дакле, за 𝑥 = 1 имамо 1 · 𝑥(1 − 𝑦)(1 − 𝑧) + 2 · (1 − 𝑥)𝑦𝑧 ≥ (1 − 𝑦)(1 − 𝑧)
за 𝑥 = 0 имамo 1 · 𝑥(1 − 𝑦)(1 − 𝑧) + 2 · (1 − 𝑥)𝑦𝑧 ≥ 2𝑦𝑧
...
(𝑥 − 1)(1 − 𝑦 − 𝑧 − 𝑦𝑧) ≥ 0
𝑥(1 − 𝑧 − 𝑦 − 𝑦𝑧) ≥ 0
Решавањем система,
добијамо 𝑥 = 0, 1 ≤ 𝑦 + 𝑧 + 𝑦𝑧
1−
0 < 𝑥 < 1, 1 = 𝑦 + 𝑧 + 𝑦𝑧 → 𝑧 =
𝑦
1+𝑦
𝑥 = 1, 1 ≥ 𝑦 + 𝑧 + 𝑦𝑧
Нацртамо у 2D по y и z, oдносно у 3D.
Добијамо коцку, а решење је тачка унутар коцке 1 − 2, 1 − 2, 1 − 2 као и све тачке на рубу.
Таквих тачака има бесконачно много.
Дакле, ако нема договора међу фирмама из једне равнотежне тачке прелази се у другу равнотежну
тачку. Договор је пожењан.
2
Стратегија 6
Одредити стратегију следеће игре
(2,2) (2,1) (2,2) (0,0)
[(1,0) (4,1) (2,4) (1,5) ]
(0,4) (3,1) (3,0) (3,3)
Решење:
Ни једна чиста стратегија не доминира другу чисту стратегију.
Стратегија II колоне доминирана је мешовитом стратегијом (1/2) + (1/2) .
1
(2 ) + 1 (2 ) > 1
2 2
1
(0) + 1 (4) > 1 → (1 , 0, 1 , 0) II доминира над (0,1,0,0)
2 2 2 2
1
(4) + 1 (0) > 1
2 2 𝖩
Бришемо зато II стратегију.
Слично покажемо да је (0,1,0) доминирана стратегијама (𝑝, 0,1 − 𝑝) I играча.
....
Скуп свих Нешових равнотежних тачака је (1,0,0), (𝑞, 0,1 − 𝑞, 0), 1 ≤ 𝑞 ≤ 1 .
3
Проблем рибара
На пијаци, док је свежа, прода се свега 2/3 рибе док се преостала риба заледи и прода касније.
Продавац зна која риба је свежа а која није. Купац пита која риба је свежа, продавац даје одговор и
онда купац одлучује да ли жели да купи рибу или не. Продавац добија 6 поена уколико прода рибу,
односно не добија ништа (0) уколико је не прода. Искреност продавцу доноси доданих 3 поена.
Купац добија 3 поена уколико купи свежу рибу, односно ако примети да је риба стара и одлучи да је
не купи. Направити дрво игру и матрицу исплате и одредити оптималне стратегије купца и
продавца.
Решење:
Дрво игре има следећи облик:
2
У том случају, редукована матрица је
продавац\купац купи свежу купи стару
свежа, искрен 8,2* 8,2
свежа, неискрен 9,2* 7,3*
стара, неискрен 7,2* 1,1
Код редуковане матрице доминира стратегија (стара неискрен) за продавца, у ком случају је купи
свежу доминантна стртегија за купца.
Приметимо да је доминантна стратегија заправо стратегија (свежа-искрен, купи стару) и да је за
купца све једно да ли продавац говори истину или не, он ће желети да купи свежу.
Стратегија 7
Следећу позициону игру свести на нормални облик.
Стратегија 8
Наћи равнотежну тачку следеће игре.
2
Рекурзивне, стохастичке и игре са понављањима
Решење:
Посматрамо прво игре A, B:
Игра А 1 1
Оптимална стратегија првог играча је ( , )
2 2
Оптимална стратегија другог играча је ( 2, 1)
33
Вредност игре је 1
Игра B
Оптимална стратегија првог играча је (0,1)
Оптимална стратегија другог играча је (0,1)
Вредност игре је 3
3
Рекурзивна игра
Решити игру
1 0
𝐺𝑛 = ( ), 𝐺(1) = 1
0 𝐺𝑛−1
Решење:
Игра се може решавати
итеративно:
𝜋(𝐺1) = 1 1
1 0
𝜋(𝐺 ) = 𝜋 (( )) =
2
0 1 2
1 0 1
𝜋(𝐺3) = (( 1)) =
0 2 3
…
1 0 1
( )
1 1
Oптимална стратегија оба играча је ( , (1 − )).
� 𝑛
На располагању је шпил од + 𝑛 + 1 карте. Први играч добија карата, други играч добија 𝑛
карата и остаје једна лицем окренута ка столу коју треба погодити. Играчи знају своје карте али не
знају карте противника. Играчи наизменично погађају која је карта на столу. Први почиње први
играч. У сваком тренутку играчи имају на располагању једну од следећих стратегија:
А) погоде карту која је на столу
Б) питају другог играча да ли је код њега нека одређена карта. Уколико други играч поседује
именовану карту, та карта се искључује из игре.
*блефирање је дозвољено.
Направити добитну стратегију.
Рекурзија 1
Решити следећу рекурзивну игру: 1 1
1 + (0) 1 2 + (−2) 0
𝐺
𝐺1 = (2 2 2 ), 𝐺2 = (3 1
3 )
2 0 0 −1
Решење:
Јасно је да игра мора да се заврши у неком тренутку обзиром да играчи не могу играти игру у
бесконачност. Чак иако би ибрали прву колону и прву врсту, игра ће се завршити исплатом 0 или -2.
Обележимо вредност игре са 𝜋1 = 𝑣𝑎𝑙(𝐺1), 𝜋2 = 𝑣𝑎𝑙(𝐺2).
Користимо формулу:
𝑎 𝑏 𝑎𝑑 − 𝑏𝑐
𝑣𝑎𝑙 ( )=
𝑐 𝑑 𝑎+𝑑−𝑏−𝑐
1 1 1
𝜋 + (0 ) 1 𝜋 1 2
=
4
𝜋1 = 𝑣𝑎𝑙 (2 2 ) = 𝑣𝑎𝑙 (2 2 )=− 6−𝜋
2 1
3
2 0 2 𝜋2 − 3 2
0 2
3
2 1 2 2
𝜋 + (−2) 2(5 − 2𝜋1)
𝜋 = 𝑣𝑎𝑙 ( 1 )=( 𝜋 − )= 5 − 2𝜋
2 3 3 −
0
0 1
3 3
0 −1 0 −1 1
чиме добијамо да је
𝜋1 2(5 − 2𝜋1)
= 16 − 7𝜋1
решавамо квадратну једначину, добићемо
𝜋2 2√30 − 10
=− 5
Заменом у почетни проблем, можемо решити игру и наћи оптималну стратегију.
3
преузето из ОММ
Borba za prevlast na tržištu
Neka su date dve fabrike sokova koje se bore za prevlast na tržištu. Fabrike unapred određuju koliko će
litara sokova proizvesti. Cena proizvodnje jednog litra soka je ista za obe fabrike i iznosi c, c = const. Ukoliko
prva fabrika proivodi 𝑄𝐴litara soka, tada troškovi proizvodnje iznose c𝑄𝐴. Sa druge strane, ukoliko druga
fabrika proizvodi 𝑄𝐵 litara soka, cena troškova te proizvodnje je cQB . Odrediti optimalnu cenu tako da obe
firme imaju neku zaradu.
Posmatramo monopolistički slučaj, tj. situaciju kada imamo samo jednu fabriku sokova (𝑄𝐵 = 0).
Monopolista želi da maksimizuje svoju zaradu. Koliko litara soka, monopolista treba da proizvede kako bi
zarada bila maksimalna?
Prvo, znamo da je 0 < 𝑄𝐴 < 𝑎. Sledi da je 𝑢𝐴(𝑄𝐴) = 𝑄𝐴(𝑎 − 𝑐) − 𝑄𝐴2, odnosno maksimum se
dostiže za 𝑢𝐴’ = 𝑎 − 𝑐 − 2𝑄𝐴 = 0 → 𝑄𝐴 = 𝑎−𝑐. Cena monopolističke proizvodnje iznosi 𝑃 (𝑎−𝑐) = 𝑎+𝑐,
2 2 2
(𝑎−𝑐)2
odnosno profit fabrike 𝑢𝐴 ( 𝑎−𝑐) = .
2 4
Posmatramo strategiju svake fabrike i kako izabrana strategija utiče na konkurenta. Dakle,
6
𝑢𝐴(𝑄𝐴, 𝑄𝐵 ) = 𝑎 − 2𝑄𝐴 − 𝑄𝐵 − 𝑐 = 0
6Q𝐴
6
6Q𝐵
𝑢𝐵(𝑄𝐴, 𝑄𝐵 ) = 𝑎 − 𝑄𝐴 − 2𝑄𝐵 − 𝑐 = 0
3
Odnosno, rešenje sistema u kom obe fabrike imaju maksimalni profit sugeriše proizvodnju:
𝑎−𝑐 𝑎−𝑐
𝑄* = i 𝑄* =
𝐴 3 𝐵 3
I obezbeđuje *zaradu: 𝑎−𝑐 𝑎−𝑐 𝑎−𝑐 𝑎−𝑐 𝑎−𝑐 2
𝑢 (𝑄 , 𝑄* ) = (𝑎 − − )−𝑐 =(
𝐴 𝐴 𝐵 )
3 3 3 3 3
𝑎−𝑐 2
Čime ukupan profit za obe fabrike iznosi 2 ( ) .
3
*************************************************************************************
Šta ako se fabrike ne mogu dogovoriti da proizvode istu količinu sokova i svaka hoće da podvali?
Pretpostavimo da fabrike ne mogu da se dogovore oko količine sokova koju će proizvesti, i da svaka fabrika
sama određuje cenu svog proizvoda.
Pretpostavimo, sada, da fabrike ne proivode iste, već slične sokove ali da je cena proizvodnje i dalje
identična i iznosi c. Količina sokova za proizvodnju iznosiće:
𝑄𝐴(𝑃𝐴, 𝑃𝐵) = (𝑎 − 𝑃𝐴 + 𝑘𝑃𝐵)+
𝑄𝐵(𝑃𝐴, 𝑃𝐵) = (𝑎 − 𝑃𝐵 + 𝑘𝑃𝐴)+
Gde je k parametar koji označava sličnost između ta dva proivoda.
Ponovo ćemo pretpostaviti da količina sokova koju svaka od fabrika može da napravi iznosi 𝑥, 𝑦 ∈ [0, ∞),
odnosno 𝑄𝐴, 𝑄𝐵 ∈ [0, ∞). Profit fabrika određuje se po sledećim formulama:
𝑢𝐴(𝑃𝐴, 𝑃𝐵 ) = 𝑄𝐴(𝑃𝐴 , 𝑃𝐵)(𝑃𝐴 − 𝑐) = (𝑎 − 𝑃𝐴 + 𝑘𝑃𝐵)+(𝑃𝐴 − 𝑐)
𝑢𝐵(𝑃𝐴, 𝑃𝐵 ) = 𝑄𝐵(𝑃𝐴 , 𝑃𝐵)(𝑃𝐵 − 𝑐) = (𝑎 − 𝑃𝐵 + 𝑘𝑃𝐴)+(𝑃𝐵 − 𝑐)
Da bi pronašli cene koje su ujednačene, odnosno cene kojima se profit maksimizuje za obe firme, moramo
da pronađemo optimalne cene 𝑃𝐴* i 𝑃*𝐵. Rešavamo sistem diferencijalnih jednačina.
6
6𝑃
𝑢𝐴(𝑃𝐴, 𝑃𝐵 ) = 𝑎 − 2𝑃𝐴 + 𝑘𝑃𝐵 + 𝑐 = 0
𝐴
6
6𝑃𝐵
𝑢𝐵(𝑃𝐴, 𝑃𝐵 ) = 𝑎 − 2𝑃𝐵 + 𝑘𝑃𝐴 + 𝑐 = 0
Rešenje sistema daje nam optimalne
𝑎+𝑐cene:
𝑃* = 𝑃* = .
𝐴 𝐵
2−𝑘
***************************************************************************************
Pretpostavimo da se u fabrikama nalaze krtice, i da, nakon što je jedna fabrika odlučila da proizvede
određenu količinu soka, to sazna druga fabrika i reaguje u svoju korist.
Dakle, pretpostavimo da će prva fabirka napraviti 𝑄𝐴 litara soka, gde je cena proizvodnje i dalje c = const, a
druga reaguje tako što ona proizvodi količinu 𝑄𝐵 određenu na sledeći način:
𝑎−Q𝐴−𝑐
𝑄𝐵(𝑄𝐴) = 2
Profit koji ostvaruje prva fabrika iznosi
𝑢𝐴(𝑄𝐴, 𝑄𝐵(𝑄𝐴) ) = 𝑄𝐴 (𝑎 − 𝑄𝐴 − 𝑎−Q𝐴−𝑐) − 𝑐𝑄𝐴 = − 1 𝑄2 + 𝑎−𝑐 𝑄𝐴
2 2 𝐴 2
Koja dostiže maksimum za
𝑎−𝑐
𝑄* =
𝐴 2
Druga fabrika će najbolje rezultate
𝑎−𝑐 postići za
𝑄𝐵(𝑄* ) =
3
𝐴 4
3
Kako izgleda profit:
𝑢 (𝑄* , (𝑎−𝑐)2
𝑄 *
𝐴 𝐴 𝐵 (𝑄𝐴) ) = 8
𝑢 (𝑄* , (𝑎−𝑐)2
𝑄 (𝑄𝐴* ))=
𝐵 𝐴 𝐵 16
Dakle, prva fabrika imaće veći profit ako se odluči za proizvodnju 𝑄𝐴 litara soka. Tom prilikom, ukupna
𝑎−𝑐 𝑎−𝑐
proizvodnja soka biće 3
što je više od količine kada se fabrike dogovaraju oko proizvodnje 2 ) a
4
( 2 3
ukupna zarada manja 3 (𝑎−𝑐)
.
16
Задатак:
Нека је укупна цена производа 17 (𝑎 = 17). Израчунати оптималну количину за производњу ако су
трошкови производње Q литара сока 𝑄 + 9. Одредити цену монопола и цену дуопола.
Рекламирање
Две компаније се боре за одређени производ чија је вредност 𝑉 тако што ће инвестирати у
маркетинг (+ остали трошкови кампање). Свака компанија планира да одвоји одређени износ пара у
ову кампању. Уколико 1. фирма одлучи да одвоји 𝑥 > 0 динара, а 2. фирма 𝑦 > 0 динара, тада ће
прва фирма пропорционално зарадити 𝑥/(𝑥 + 𝑦). Фирме имају различит присуп промовисања
производа, па имају 𝑐 трошкова по уложеној јединици. На овај начин, профит компанија се може
израчунати по формули
𝑥
𝜋1 (𝑥, 𝑦) = 𝑉 ·
𝑥 + 𝑦 − 𝑐1𝑥
𝜋2 (𝑥, 𝑦) = 𝑉 · 𝑦
− 𝑐2𝑦
𝑥+𝑦
Aко обе фирме уложе 0 динара, зарадиће 0 динара.
а) Наћи равнотежну стратегију и равнотежну зараду у функцији од 𝑉, 𝑐1, 𝑐2
б) Решити проблем за конкретне вредности 𝑉 = 1, 𝑐1 = 1, 𝑐2 = 2.