You are on page 1of 9

Лекція № 13.

ДІЛОВІ ІГРИ ЯК МЕТОД ОБҐРУНТУВАННЯ РІШЕНЬ

Теорія ігор - це розділ математичної економіки, який вивчає вирішення


конфліктів між гравцями і оптимальність їх стратегій. Конфлікт може стосуватися різних
сфер людських інтересів: найчастіше це економіка, соціологія, політологія, рідше біологія,
кібернетика і навіть військова справа. Конфлікт – це будь-яка ситуація, в якій зачіпаються
інтереси двох або більше учасників, традиційно званих гравцями. Для кожного гравця
існує певний набір стратегій, які він може застосовувати. Перетинаючись, стратегії
кількох гравців створюють певну ситуацію, в якій кожен гравець отримує певну
Результат, званий виграшем, буває позитивним або негативним. При виборі стратегії
важливо враховувати не тільки отримання максимального прибутку для себе, але і
можливі кроки опонента, і їх вплив на ситуацію в цілому.
Основи теорії ігор зародилися в 18 столітті, з початком епохи Просвітництва і
розвитком економічної теорії. Математичні аспекти та застосування теорії були вперше
викладені в класичній книзі 1944 року «Теорія ігор та економічна поведінка» Джона фон
Неймана та Оскара Моргенштерна. Перші концепції теорії ігор аналізували антагоністичні
ігри, де за їх рахунок є переможені і переможці.
Хоча теорія ігор була пов'язана з економічними моделями, до 1950-х років вона
була лише математичною теорією. Потім, в результаті різкого стрибка в економіці США
після Другої світової війни, і, як наслідок, збільшення фінансування науки, стали робити
спроби застосувати теорію ігор в економіці, біології, кібернетиці, техніці та антропології.
Під час і відразу після Другої світової війни військові серйозно зацікавилися теорією ігор,
розглядаючи її як потужний інструмент для вивчення стратегічних рішень.
На початку 1950-х років Джон Неш розробив методи аналізу, при яких всі
учасники або виграють, або програють. Ці ситуації називаються «рівновагою
Неша».Згідно з його теорією, сторони повинні використовувати оптимальну стратегію,
що призводить до створення стійкої рівноваги. Гравцям вигідно підтримувати цю
рівновагу, оскільки будь-яка зміна погіршить їхнє становище. Ці роботи Неша внесли
серйозний внесок у розвиток теорії ігор, були переглянуті математичні інструменти
економічного моделювання. Джон Неш показує, що класичний підхід Адама Сміта до
конкуренції, коли кожен сам за себе, неоптимальний. Стратегії є більш оптимальними,
коли кожен намагається зробити краще для себе, роблячи краще для інших. За останні 20-
30 років значення теорії ігор та інтерес до неї значно зросли, і деякі галузі сучасної
економічної теорії неможливо пояснити без застосування теорії ігор.Великим внеском у
застосування теорії ігор стала робота Томаса Шеллінга, лауреата Нобелівської премії з
економіки 2005 року, «Стратегія конфлікту»
Як це працює
З точки зорутеорії ігор, найпростіше пояснити це в «Дилемі в'язня», класичне
формулювання якої звучить наступним чином:
Двоє злочинців, А і Б, були спіймані приблизно в один і той же час за аналогічні
злочини. Є підстави вважати, що вони діяли у змові, і поліція, ізолювавши їх один від
одного, пропонує їм одну й ту саму угоду: якщо один свідчитиме проти іншого, а той
мовчить, першого звільняють за сприяння слідству, а другий отримує максимальний
термін ув'язнення (10 років). Якщо обидва мовчать, їхній вчинок підпадає під легшу
статтю, і їх засуджують до 6 місяців. Якщо обидва свідчать один проти одного, вони
отримують мінімальне покарання (по 2 роки кожен). Кожен ув'язнений вибирає,
мовчати йому чи свідчити проти іншого. Однак жоден з них не знає точно, що робитиме
інший. Що станеться?

Представивши гру у вигляді матриці, отримаємо:

Злочинець Б Злочинець Б
Стратегія «мовчати» Стратегія « зрадити »

Злочинець А Півроку на кожного 10 років злочинцю А


Стратегія «мовчати» Відпустити злочинця Б

Злочинець А 10 років злочинцю Б 2 роки кажному


Стратегія «зрадити» Відпустити злочинця
А

А тепер уявімо розвиток ситуації, поставивши себе на місце ув'язненого А. Якщо мій
спільник мовчить, краще здати його і вийти на волю. Якщо він говорить, то теж краще все
розповісти, і отримати всього два роки, а не десять. Таким чином, якщо кожен гравець
вибере те, що краще для нього, обидва здадуть один одного і отримають два роки, що не є
ідеальною ситуацією для обох. Якби всі думали про спільне благо, то отримали б лише
півроку.
Види ігор
Кооперативна/некооперативна гра
Кооператив - це конфліктна гра, в якій гравці можуть спілкуватися один з одним і
об'єднуватися в групи для досягнення найкращого результату. Прикладом кооперативної
гри є карткова гра «Бридж», де очки кожного гравця підраховуються індивідуально, але
виграє пара з найбільшою сумою. З двох типів ігор некооперативні дуже докладно
описують ситуації і дають більш точні результати. Кооператив дивиться на геймплей в
цілому. Незважаючи на те, що ці два типи є протилежними, можна поєднувати стратегії,
які можуть бути більш вигідними, ніж слідування одній чи іншій.

Нульова і ненульова сума


Гра з нульовою сумою - це гра, в якій виграш одного гравця дорівнює програшу іншого.
Наприклад, тривіальний аргумент: якщо ви виграєте суму N, то хтось програє таку ж суму
N. У грі з ненульовою сумою загальна вартість гри може змінюватися, таким чином
приносячи користь одному гравцеві, не забираючи його ціну в іншого. Шахи є чудовим
прикладом цього: перетворюючи пішака на ферзя, гравець А збільшує загальну суму своїх
фігур, нічого не забираючи у гравця Б. У іграх з ненульовою сумою програш одного з
гравців не є обов'язковою умовою, хоча такий результат не виключається.
Паралельний і послідовний
Паралельна гра - це гра, в якій гравці роблять ходи одночасно, або хід одного гравця
невідомий іншому, поки не завершиться загальний цикл. У послідовній грі кожен гравець
має інформацію про попередній хід суперника, перш ніж зробити свій вибір. І зовсім не
обов'язково володіти повною інформацією, що призводить до розумного типу.

З повною або неповною інформацією


Эти типы являются подвидом последовательных игр, и названия их говорят сами за себя.

Метаігри
Ці ігри є «лемами» теорії ігор. Вони корисні не самі по собі, а в контексті конфлікту,
розширюючи його набір правил.

У будь-якому конфлікті типи об'єднуються, щоб визначити правила гри, будь то


кооперативна послідовна гра з нульовою сумою або незавершена метагра.

Проблеми практичного застосування


Звичайно, слід зазначити, що існують певні межі застосування аналітичного
інструментарію теорії ігор. По-перше, це той випадок, коли гравці мають різні уявлення
про гру, в якій вони беруть участь, або коли вони недостатньо поінформовані про
можливості один одного. Наприклад, може бути незрозуміла інформація про платежі
конкурента (структура витрат). Якщо неповнота характеризується не дуже складною
інформацією, то досвід таких випадків може бути застосований з певними
відмінностями.По-друге, теорію ігор складно застосувати до різноманітних рівноважних
ситуацій. Ця проблема може виникнути навіть в ході простих ігор з одночасним
стратегічним вибором.

По-третє, якщо ситуація прийняття стратегічних рішень дуже складна, то гравці часто не
можуть вибрати для себе оптимальні варіанти. Наприклад, кілька компаній можуть
виходити на ринок в різний час, або реакція існуючих компаній може бути більш
складною, ніж агресивною або дружньою.
Експериментально доведено, що при розширенні гри до десяти і більше етапів гравці вже
не в змозі використовувати відповідні алгоритми і продовжувати гру зі збалансованими
стратегіями.
На жаль, реальні ситуації часто дуже складні і змінюються настільки швидко, що
неможливо точно передбачити, як відреагують конкуренти на зміну тактики. Однак теорія
ігор корисна, коли справа доходить до визначення найважливіших факторів, які необхідно
враховувати в ситуації прийняття конкурентних рішень. Ця інформація важлива, оскільки
дозволяє врахувати додаткові змінні або фактори, які потенційно можуть вплинути на
ситуацію, і тим самим підвищити ефективність прийнятого рішення.
На закінчення слід підкреслити, що теорія ігор є дуже складною галуззю знань. При його
використанні необхідно дотримуватися певної обережності і чітко знати межі
використання. Занадто прості тлумачення таять в собі приховані небезпеки. Аналіз і
поради, засновані на теорії ігор, в силу їх складності рекомендуються тільки для особливо
важливих проблемних областей. Досвід показує, що використання відповідних
інструментів є кращим при прийнятті разових, принципово важливих стратегічних рішень
при плануванні, в тому числі при підготовці великих угод про співпрацю.

Теорія ігор: гра з природою


https://habr.com/ru/articles/179811/

Ближче до практики
Вище в теорії ігор ми розглянули ситуації, в яких передбачалися логічні дії двох
гравців, кожен з яких бажає отримати максимальну вигоду для себе. Наступний етап - так
звані ігри з природою. Формально вивчення ігор з природою, як і стратегічних, має
починатися з побудови платіжної матриці, яка, по суті, є найбільш трудомістким етапом
підготовки рішення. Помилки в платіжній матриці не можуть бути компенсовані жодним
обчислювальних методів і призведе до невірного кінцевого результату.
Відмінною рисою гри з природою є те, що тільки один з учасників, в більшості випадків
званий гравцеві, діє усвідомлено. Гравцеві другому (натурі) начхати на результат, або він
не здатний приймати осмислені рішення. А можливо, умови не залежать від дій гравця, а
визначаються зовнішніми факторами: реакцією ринку, яка не зашкодить одному
конкретному гравцеві, державною політикою, реальним характером.
Типи завдань та критерії відбору
В іграх на природі є два типи завдань:
1. Проблема прийняття рішень в умовах ризику, коли відомі ймовірності, з якими
природа приймає кожен з можливих станів;
2. Проблеми прийняття рішень в умовах невизначеності, коли неможливо
отримати інформацію про ймовірності настання природних станів;

Щоб наблизитися до реальних ситуацій, візьмемо для прикладу відносно реальну


ситуацію. Першим гравцем (А), за якого ми будемо приймати рішення, буде Samsung зі
своїм Galaxy S5. Другим гравцем (В), який грає в «природу», буде компанія Apple, а її
iPhone 6.
Настає час випуску нового смартфона, відбулася презентація, експерти висловили
свою думку, і гравцеві одному, перш за все, належить прийняти важливе рішення, коли
випускати продукт? Щоб спростити ситуацію, нам залишається три варіанти: перед
конкурентом (А 1), разом з ним (А 2) або після (А 3). Звичайно, поки не вийде новий
iPhone, ми не дізнаємося, чи буде він набагато краще нашого (B 1), такий же (B 2) або
сильно поступається за якістю (B 3). Розрахувавши ймовірний прибуток у відносному
вираженні у всіх випадках ми отримуємо матрицю:

Тепер, щоб прийняти рішення, у нас є кілька критеріїв.


1. Критерій Вальда (максимін). Гравець розраховує, що природа піде для нього
найгіршим шляхом, і він повинен вибрати варіант з максимальним прибутком в
найгіршому результаті, тому цей критерій вважається песимістичним. Його можна
представити як max (min i)
За цим критерієм:
для А1 мінімальний прибуток (5) складуть дії природи В 1 і В2
для А2 мінімальний прибуток дорівнює 3 після дії В1
для А3 мінімальний прибуток дорівнює 2 після дії В1
Критерій Вальда. Таким чином, з 5, 3 і 2 максимальний прибуток (5) нам дасть опціон А1

2. Крітерий максимума (максимаксний) є оптимістичним, тобто ми сподіваємося на


найбільш сприятливий для нас результат.
для А1 максимальний прибуток 7
для А2 максимальний прибуток 6
для А3 максимальний прибуток 8
З 7, 6 і 8 максимальний прибуток принесе варіант А3

3. Критерій Гурвіца рекомендує стратегію, що визначається формулою max (A*max i +


(1-A)*min i), де A - ступінь оптимізму (імовірнісний) і змінюється від 0 до 1. При А = 1
цей критерій може бути замінений критерієм максимуму, а при А = 0 - критерієм Вальда.
Значення А залежить від ступеня відповідальності гравця: чим вона вища, тим ближче А
до одиниці. Для цього прикладу візьмемо А = 0,4.
для А1 прибуток дорівнює 0,4*7 + 0,6*5 = 5,8
для А2 прибуток дорівнює 0,4*6 + 0,6*3 = 4,2
для А3 прибуток дорівнює 0,4*8 + 0,6*2 = 4,4

З отриманих відповідей максимальну користь приносить дія А 1

4. Крітерий Сэвиджа (мінимаксний). Його суть полягає у виборі стратегії, яка не


допускає занадто великих втрат. Для цього використовується матриця ризиків, в якій
розраховується максимальний прибуток за кожним варіантом дії гравця, а серед
результатів вибирається найменший. Його формула виглядає як min (max i)
За цим критерієм:

для А1 максимальний прибуток (7) приведе до дії природи В3


для А2 максимальний прибуток 6 після дії В3
для А3 максимальний прибуток 8 після дії В3

Таким чином, з 7, 6 і 8 мінімальний прибуток (6) дасть нам варіант А2

5. Відповідно до критерію Байєса пропонується дати рівні ймовірності всім розглянутим


стратегіям, а потім прийняти ту, при якій очікуваний виграш буде найбільшим. Критерій
має один недолік: не завжди можна точно визначити ймовірність тієї чи іншої події з боку
природи. Формула для нього - max (Σ q *i).Спочатку поставимо ймовірність настання
кожного з умов природи рівною 0, 33. І вони отримали

для А1 5*0,33 + 5*0,33 + 7*0,33 = 5,61


для А2 3*0,33 + 4*0,33 + 6*0,33 = 4,29
для А3 2*0,33 + 4*0,33 + 8*0,33 = 7,63

Очевидно, що максимальний прибуток ми отримаємо від варіанту А3. Однак, коли ми


звернулися до експертів, то отримали ймовірність розвитку подій для природи 0,5; 0,4;
0,1; відповідно. Таким чином,

для А1 5*0,5 + 5*0,4 + 7*0,1 = 5,2


для А2 3*0,5 + 4*0,4 + 6*0,1 = 3,7
для А3 2*0,5 + 4*0,4 + 8*0,1 = 3,4

У цьому випадку максимальний прибуток від варіанту А1

Основне завдання полягає в тому, щоб знайти оптимальні (або, принаймні, раціональні)
стратегії, які найкращим чином приведуть систему до мети в даних зовнішніх умовах. Для
вибору стратегій в умовах невизначеності можуть бути використані будь-які критерії, в
той час як критерій Байєса більш ефективний в умовах ризику. Однак вибір між самими
критеріями, як правило, ґрунтується на інтуїції і залежить від характеру особи, яка
приймає рішення (зокрема, його схильності до ризику).

Якщо рішення приймається в умовах невизначеності, краще використовувати кілька


критеріїв. У тому випадку, якщо рекомендації збігаються, можна впевнено вибирати
оптимальне рішення. Якщо рекомендації суперечливі, рішення слід приймати більш
ретельно, враховуючи сильні і слабкі сторони.
Більше прикладів
Наведемо кілька загальних критеріїв раціонального вибору рішеньз безлічі можливих.
Критерії ґрунтуються на аналізі матриці можливих екологічних станів та
альтернативних рішень. Матриця, наведена в таблиці 1, підходить для наступних
ситуацій:
1. існує обмежена кількість альтернатив, дій і умов навколишнього середовища,
які слід розглянути;
2. Існує функція результатів, яка приписує кожній альтернативі однозначний ефект
у вигляді, наприклад, капітальних витрат, доходів і т.д .;
3. Вартість капіталу буде єдиною найважливішою метою.

Таблиця 1 – Матриця рішень

Альтернатива S (Стан навколишнього середовища)


А S1 S2 ... Si ... Sm
А1 a11 a12 ... a1i ... a1m
... ... ... ... ... ... ...
Aj aj1 aj2 ... aji ... ajm
An an1 an2 ... ani ... anm

Матриця містить: А1 — альтернативи, тобто варіанти дій, один з яких необхідно


вибрати; Si — можливі варіанти умов навколишнього середовища; AJI - це елемент
матриці, що позначає величину вартості капіталу, прийняту альтернативою j в умовах
середовища i. Альтернативи в описаних умовах можуть бути обрані за одним із критеріїв,
запропонованих у статті, за правилами прийняття рішень.
Нехай кожна альтернатива має однозначний ефект у вигляді вартості капіталу.
Правління Гурвіца. Згідно з правилами, максимакс і максимін об'єднуються
шляхом зв'язування максимуму мінімальних значень альтернатив. Це правило ще називають
правилом оптимізму і песимізму. Оптимальна альтернатива може бути обчислена за
допомогою

де a – коефіцієнт оптимізму, a = 1 ...0 (при a = 1 ви вибираєте альтернативу за


правилом maximax, при a = 0 – за правилом максиміна)
Наведемо приклад матриці значень вартості капіталу (KPji) чотирьох альтернатив
aj (j = 1, ..., 5). Вибір здійснюється за допомогою таблиці 1. 2. Максимум з мінімальних
значень - вартість капіталу другої альтернативи при найменш сприятливомудля цієї
альтернативи стані зовнішнього середовища (СР24 = 125). Тому, керуючись правилом
Ваальда, слід вибирати другу альтернативу.

Таблиця 2 – Матриця вартості витрат

a S1 S2 S3 S4 S5 mini
a1 190 130 120 140 135 120
a2 170 145 130 125 155 125*
a3 120 100 80 110 120 80
a4 90 10 70 60 80 10
Примітка. Далі зірочка відповідає мінімальним (максимальним) значенням альтернативи.

При застосуванні правила Гурвіца враховується більш релевантна інформація, ніж


при використанні правил максиміна і максимакса.
Таблиц 4 – Матрица відхилення

(1—0,3)mini 0,3maxi (1—0,3)mini


a S1 S2 S3 S4 S5 КПji+
КПji КПji
+0,3maxi КПji
a1 190 130 120 140 135 84 57 141
a2 170 145 130 125 155 91 51 142*
a3 120 100 80 110 120 56 36 92
a4 90 10 70 60 80 7 27 34

Правило ґрунтується на використанні критерію Гурвіца. Розглянемо приклад застосування


правила Гурвіца в контексті зміни економічної ситуації. При прийнятті рішення про
терміни виробництва постало питання про вплив ринкової кон'юнктури. Наслідки
переходу до масового виробництва нової продукції при різній реакції ринку на них
наведені в табл.5.
Таблица 5 – Вхідні дані
Варіант переходу на Виплати на можливих умовах
серійне виробництво встановлення масового попиту, млн дол.
відразу через 0,5 через 1 через 1,5
року рік року
a1 — перейти відразу 12 6 4 1
a2 — перейти через 0,5 року 6 8 3 2
a3 — перейти через 1 рік 1 2 5 7
a4 — перейти через 1,5 року 1 2 4 6

Критерій Гурвіца розраховується за формулою

K = maxi ëémax j Xija +min j Xij (1 -a )ùû .


Візьмемо a = 0,3 і обчислимо коефіцієнти:
K1 = 12 · 0,3 + 1 · 0,7 = 4,3;
К2 = 8 · 0,3 + 2 · 0,7 = 3,8;
К3 = 7 · 0,3 + 1 · 0,7 = 2,8;
К4 = 6 · 0,3 + 1 · 0,7 = 2,5.
Згідно з максимальним значенням критерію Гурвіца, слід відразу прийняти
рішення про перехід на масове виробництво нової продукції. Оскільки параметр а
береться довільно, вибір суб'єктивний.
Умови ризику. Для вибору оптимального рішення в ситуації ризику
використовують правило Байєса (критерій математичного очікування), критерій
середнього значення і стандартного відхилення, критерії Бернуллі, Лапласа, Гурвіца.
Правило Баєса (тест очікуваного значення). Якщо відомі ймовірності настання
Pi можливих станів зовнішнього середовища S, то можна скористатися правилом Баєса. У
цьому випадку критерієм вибору є значення очікуваного значення (ML) альтернативи j.
Критерій розраховується за формулою

К = max MO (Xj),

де МО (Хj) — МО-альтернативи.

Математичне очикування є середнім значенням випадкової величини і


визначається за формулою

MO(X j )= å Xji Pi ,
де Хji — альтернатива, відповідає i-му стану навколишнього середовища; Pi -
ймовірність i-го стану навколишнього середовища.
Величина МО розраховується шляхом множення вартості капіталу альтернативи j при
стані середовища Si на відповідне значення ймовірності настання цього стану і
подальшогозведення отриманих похідних до загальної суми по кожній альтернативі.
Оптимальну альтернативу знаходять за формулою
Зі значеннями навколишньої ймовірності Р1 = 0,2, Р2 = 0,3, Р3 = 0,4, Р4 = 0,3, Р5 = 0,3,
використовуючи значення, наведені в таблиці 3.2, отримаємо значення МО,
представлені в таблиці 3.2 табл. 6.
Таблица 6 – Вхідні дані

a S1 S2 S3 S4 S5 КПj
a1 190 130 120 140 135 140,5
a2 170 145 130 125 155 141*
a3 120 100 80 110 120 102
a4 90 10 70 60 80 67

Згідно з правилом Баєса, альтернатива а2 вважається оптимальною через більш


високе значення МО, ніж інші альтернативи. Також передбачається, що елементи матриці
KPji виражають корисність ефектів (інвестування для інвестиційних рішень). Отже, зміна
корисності приймається пропорційно зміні вартості капіталу, а ставлення до ризику
приймається нейтральним.
Критерій Лапласа. У разі рівної ймовірності умов навколишнього середовища
рішення приймається за допомогою тесту Лапласа.
Оптимальним рішенням вважається те, яке відповідає найбільшій сумі:

K = max å X ij .
Наприклад, використовуючи дані, наведені в таблиці. 5, отримуємо такісуми
альтернативних виплат:

å X1 j = 23; å X2 j =19; å X3 j =15; å X4 j =13.


Як бачите, найбільша сума виплат міститься в першомурядку. Тому оптимальним
рішенням має бути перехід до негайного масового виробництва. Він збігається з
рішенням, визнаним оптимальним за критерієм Гурвіца і критерієм МО. Якщо три
критерії вказують на необхідністьприйняття одного і того ж рішення, то це
підтверджує його оптимальність.

You might also like