You are on page 1of 10

Теорія ігор (Дж.

Неш)
План
1. Теорія ігор
2. Поняття теорії ігор
3. Класифікація ігор
4. Рівновага Неша
5. Застосування6. Умови повної інформованості гравців
7. Визначення
8. Прикоади
9. Поширеність
10. Зв’язок з обережними недомінованими стратегіями
11. Зв’зок з оптимальними Парето ситуаціями
12. Використані джерела
Слайд №3.
Тео́рія і́гор — теорія математичних моделей прийняття оптимальних рішень
в умовах конфлікту. Оскільки сторони, що беруть участь в більшості
конфліктів, зацікавлені в тому, щоб приховати від супротивника власні
наміри, прийняття рішень в умовах конфлікту, зазвичай, відбувається в
умовах невизначеності. Навпаки, фактор невизначеності можна
інтерпретувати як противника суб'єкта, який приймає рішення (тим самим
прийняття рішень в умовах невизначеності можна розуміти як прийняття
рішень в умовах конфлікту). Зокрема, багато тверджень математичної
статистики природним чином формулюються як теоретико-ігрові.
Теорія ігор — розділ прикладної математики, точніше — дослідження
операцій, який використовується в соціальних науках (найбільше
в економіці), біології, політичних науках, комп'ютерних науках (головним
чином для штучного інтелекту) і філософії. Теорія ігор намагається
математично зафіксувати поведінку в стратегічних ситуаціях, в яких успіх
суб'єкта, що робить вибір, залежить від вибору інших учасників. Якщо
спочатку розвивався аналіз ігор, в яких один із супротивників виграє за
рахунок інших (ігри з нульовою сумою), то згодом почали розглядати
широкий клас взаємодій, які були класифіковані за певними критеріями.
Сьогодні «теорія ігор щось на кшталт парасольки чи універсальної теорії для
раціональної сторони соціальних наук, де соціальні можемо розуміти
широко, включаючи як людських, так нелюдських гравців (комп'ютери,
тварини, рослини)»

Слайд №4.
Логічною основою теорії ігор є формалізація трьох понять, які входять в її
визначення і є фундаментальними для всієї теорії:

 Конфлікт;
 Прийняття рішення в конфлікті;
 Оптимальність прийнятого рішення.
Ці поняття розглядаються в теорії ігор у найширшому сенсі. Їхні
формалізації відповідають змістовним уявленням про відповідні об'єкти.
Змістовно, конфліктом можна вважати будь-яке явище, відносно якого можна
казати про його учасників, про їхні дії, про результати явищ, до яких
призводять ці дії, про сторони, які так чи інакше зацікавлені в таких
наслідках, і про сутність цієї зацікавленості.
Якщо назвати учасників конфлікту коаліціями дії , можливі дії кожної із
коаліцій дії — її стратегіями,  результати
конфлікту — ситуаціями, зацікавлені сторони — коаліціями інтересів і,
нарешті, говорити про можливі переваги для кожної коаліції інтересів  однієї
ситуації  перед іншою  то конфлікт в цілому може бути описаний як система,
яка являє собою конфлікт, і називається грою. Конкретизації складових, які
задають гру, призводять до різноманітних класів ігор.

Слайд №5.
Класифікація ігор
Кооперативні або некооперативні
Гра називається кооперативною, якщо гравці можуть об'єднуватися в групи,
взявши на себе деякі зобов'язання перед іншими гравцями і координуючи
свої дії. Цим вона відрізняється від некооперативних ігор, в яких кожен
зобов'язаний грати за себе. Некооперативні ігри описують ситуації в
найменших подробицях і видають точніші результати. Кооперативні
розглядають процес гри в цілому. Гібридні ігри включають елементи
кооперативних та некооперативних ігор. Наприклад, гравці можуть
створювати групи, але гра буде проводитись в некооперативному стилі. Це
означає, що кожен гравець буде переслідувати інтереси своєї групи, разом з
тим досягти особистої вигоди.
Симетрична та антисиметрична гра
Гра буде симетричною тоді, коли відповідні стратегії у гравців будуть
рівними, тобто вони матимуть однакові платежі. Інакше кажучи, якщо гравці
поміняються місцями і при цьому їх виграші за ті ж самі ходи не зміняться.
З нульовою і ненульовою сумою
Ігри з нульовою сумою — це особливий різновид ігор з постійною сумою,
тобто таких, де гравці не можуть збільшити або зменшити ресурси або фонд
гри, що в них є. Прикладом є гра покер, де один виграє всі ставки інших. В
іграх з ненульовою сумою виграш якогось гравця не обов'язково означає
програш іншого, і навпаки. Результат такої гри може бути як менше, так і
більше нуля.
Паралельні та послідовні
В паралельних іграх гравці ходять одночасно, або вони не знають про ходи
інших гравців, поки всі не зроблять свій хід. В послідовних іграх гравці
можуть робити ходи в напередодні визначеному порядку, але при цьому вони
отримують деяку інформацію про ходи інших. Ця інформація може бути
неповною, наприклад, гравець може дізнатися, що його опонент із десяти
стратегій точно не вибрав п'яту, нічого не знаючи про інших.
З повною або неповною інформацією
У грі з повною інформацією (шахи, «хрестики-нулики») гравці знають всі
ходи, зроблені до поточного моменту, а також можливі стратегії противників,
що дозволяє їм деякою мірою передбачити подальший плин гри. Більшість
ігор, які вивчає математика, є іграми з неповною інформацією.
Ігри з нескінченним числом ходів
Ігри в реальному світі або ті, що вивчаються економікою, як правило,
тривають в скінченну кількість ходів. Математика не так обмежена, зокрема,
в теорії множин розглядаються ігри, які можуть продовжуватись нескінченно
довго. При чому переможець та його виграш не визначені до завершення всіх
ходів. Задача, яка зазвичай ставиться в цьому випадку, полягає не в пошуці
оптимального рішення, а в пошуці хоча б виграшної стратегії.
Використовуючи аксіому вибору, можна довести, що інколи навіть для ігор з
повною інформацією і двома результатами — виграв або не виграв — жоден
з гравців не має такої стратегії. Існування виграшних стратегій для деяких
особливо сконструйованих ігор має важливу роль в дескриптивній теорії
множин.
Дискретні і неперервні ігри
Більшість ігор — дискретні: в них скінчена кількість гравців, ходів, подій,
результатів і т. д. Проте ці компоненти можуть бути розширеними на
множину дійсних чисел. Такі ігри часто називаються диференціальними.
Вони пов'язані з прямою дійсних чисел, хоча події, що відбуваються, можуть
бути дискретними по своїй природі.

Слайд №6.
Рівновага Неша
У теорії ігор рівновагою Неша (англ. Nash Equilibrium) називається
сукупність стратегій або дій у грі з двома чи більше гравцями, згідно з якими
кожен учасник реалізує оптимальну стратегію, передбачаючи дії суперників.
Це така сукупність стратегій та виграшів, при якій жоден із учасників не
може збільшити виграш, змінивши вибір стратегії в односторонньому
порядку, коли інші учасники не змінюють свого вибору.
Слайд №7.
Застосування
Фахівці з теорії ігор використовують умову рівноваги Неша для аналізу
стратегічної взаємодії кількох гравців. Це надає шлях для передбачення того,
що відбудеться у випадку, коли кілька людей, або кілька установ приймають
рішення одночасно, а результат залежить не тільки від власного рішення, але
і від рішень інших. Ідея Джона Неша полягає у тому, що не можна
передбачити результати вибору декількох учасників гри, аналізуючи ці
рішення ізольовано одне від іншого. Натомість потрібно запитувати, що
робитиме кожен гравець, і враховувати імовірні рішення інших учасників.
Рівновага Неша була використана для аналізу ворожих ситуацій, таких як
війна або перегони озброєнь, а також дослідження того, як зменшити
конфлікт через повторні взаємодії. Це також було використано для вивчення
граничної міри співпраці людей з різними вподобаннями, і чи будуть вони
ризикувати для отримання спільного результату; використовувалось для
вивчення адаптації технічних стандартів, а також явища банкової паніки та
валютної кризи. Інші застосування включають транспортні потоки,
організацію аукціонів, результат наданих зусиль кількома групами в
навчальному процесі, регулятивне законодавство таке, як регулювання
навколишнього середовища, і навіть удари пенальті у футболі.
Слайд №8.
Умови повної інформативності гравців
В грі з повною інформацією гравці знають всі ходи, зроблені до поточного
моменту, а також можливі стратегії противників, що дозволяє їм деякою
мірою передбачити подальший плин гри. Більшість ігор, які вивчає
математика, з неповною інформацією.
Слайд №9.
Визначення
Слайд №10.
Приклади. Координаційна гра
Координаційна гра — це класична (симетрична) гра двох гравців, з двома
стратегіями (матриця виграшів на таблиці). Гравці повинні координувати
свої дії, обидва адаптуючи стратегію А, для отримання найбільшого виграшу;
тобто 4. Навіть якщо обидва гравці вибирають стратегію В, рівновага Неша
буде збережена. Хоча кожен гравець отримав менший за оптимальний
виграш, жоден гравець не мав стимулу змінювати стратегію через зменшення
миттєвого виграшу (з 2 до 1).
Слайд №11.
Дилема в’язня
Двоє підозрюваних, А і Б, арештовані. У поліції немає достатніх доказів для
звинувачення, і ізолювавши їх один від одного, вони пропонують їм одну і ту
ж операцію: якщо один свідчить проти іншого, а той зберігає мовчання, то
перший звільняється, а другий одержує 10 років в'язниці. Якщо обидва
мовчать, у поліції мало доказів, і вони засуджуються до 6 місяців. Якщо
обидва свідчать проти один одного, вони одержують по 2 роки. Кожен
ув'язнений вибирає, мовчати або свідчити проти іншого. Проте жоден з них
не знає точно, що зробить інший. Що відбудеться?
Дилема з'являється, якщо припустити, що обидва піклуються тільки про
мінімізацію власного терміну ув'язнення.
Представимо міркування одного з ув'язнених. Якщо партнер мовчить, то
найкраще його зрадити і вийти на свободу (інакше — півроку в'язниці). Якщо
партнер свідчить, то найкраще теж свідчити проти нього, щоб одержати 2
роки (інакше — 10 років). Стратегія «свідчити» строго домінує над
стратегією «мовчати». Аналогічно інший ув'язнений приходить до того ж
висновку.
З погляду групи (цих двох в'язнів) найкраще співпрацювати один з одним,
зберігати мовчання і одержати по півроку, оскільки це зменшить сумарний
термін ув'язнення. Будь-яке інше рішення буде менш вигідним. Це дуже
наочно демонструє, що в грі з ненульовою сумою Парето-оптимум може
бути протилежним рівновазі Неша.
Слайд №12.
Потік в мережі
Рівноваги Неша застосовують для визначення потоку в мережі. Нехай маємо
граф справа. Якщо ми припустимо що є x «автомобілів» які подорожують від
А до D, тоді яким буде розподіл трафіку в мережі?
Ситуація може бути змодельована як «гра», де кожен подорожуючий має
вибір з 3 стратегій, де кожна стратегія це маршрут від A до D(ABD, ABCD,
ACD). Виграшем кожної стратегії є час руху по маршруту. В графі справа,
автомобіль рухається по ABD з часом подорожі (1+x/100)+2, де x це число
автомобілів, що рухаються по AB. Тому, виграші для будь-якої заданої
стратегії залежать від вибору інших гравців, як завжди. Однак, метою в
цьому випадку є мінімізація часу подорожі, а не максимізація. Рівновага буде
присутня, коли час на всіх шляхах однаковий. Коли це відбудеться, жоден
водій не матиме стимулу міняти шлях, так як це лише збільшить його час
руху. Для графу справа, якщо, наприклад, 100 автомобілів подорожують від
A до D, тоді рівновага буде, коли 25 водіїв оберуть маршрут ABD, 50 —
ABCD, 25 — ACD. Кожен водій має загальний час руху 3.75.
Зауважимо, що цей розподіл не є соціально оптимальним. Якщо 100
автомобілів погодяться, що 50 рухаються по ABD, а інші 50 по ACD, тоді час
руху для кожного автомобіля буде 3.5 що менше ніж 3.75. Це також є
рівновагою Неша, якщо шлях між B і C буде усунутий, що означає, що
додавання можливого маршруту може зменшити ефективність системи,
феномен відомий як парадокс Бреса.
Слайд №13.
Поширеність.
Якщо гра має єдину рівновагу Неша і розігрується між гравцями за певних
умов, тоді набір стратегій рівноваги Неша буде прийнятий. Достатні умови
для гарантування що рівновага Неша була розіграна:

1. Всі гравці будуть робити все можливе для максимізації їхніх


очікуваних виграшів згідно правил гри.
2. Гравці бездоганні у виконанні стратегій.
3. Гравці достатньо розумні для знаходження рішення.
4. Гравці знають сплановану стратегію рівноваги всіх інших
гравців.
5. Гравці вірять, що відхилення в їхніх власних стратегіях не
призведе до відхилення в стратегіях інших гравців.
6. Існує загальне знання[en], що всі гравці дотримуються цих умов.
Слайд №14.
Коли умови не дотримуються
Приклади проблем теорії ігор де ці умови не дотримуються:

1. Перша умова не дотримується, якщо гра не коректно описує


кількість гравців, які бажають максимізувати виграш. В цьому
випадку не має сенсу приймати стратегію рівноваги. Наприклад,
дилема в'язня не буде дилемою, якщо один з гравців хоче
опинитися у в'язниці.
2. Навмисна або випадкова недосконалість у виконанні. Наприклад,
комп'ютер здатний до бездоганної логічної грі проти другого
бездоганного комп'ютера призведе до рівноваги. Введення
недосконалості призведе до руйнування рівноваги або через
втрати гравця, який робить помилку, або через відкидання
критерію загальновідомого знання[en], що може призвести до
перемоги гравця.
3. В багатьох випадках третя умова не дотримується тому, що
навіть хоча рівновага повинна існувати, вона є невідомою через
складність гри. Наприклад, в грі «Сянці»[2]. Або, як буває, вона
не може бути відомою для всіх гравців, наприклад, при грі в
хрестики-нулики з маленькою дитиною, яка відчайдушно хоче
виграти (задоволення інших критеріїв).
4. Критерій загального знання може бути не дотриманий, якщо всі
гравці, фактично, дотримуються всіх інших умов. Гравці, які
неправильно розглядають раціональність поведінки інших,
можуть приймати контр-стратегії, очікуючи нераціональної
поведінки їхніх опонентів. Це суттєво в перегонах озброєнь та в
грі «Яструби і голуби».
Коли умови дотримуються
Через обмеженість умов в яких можна спостерігати рівновагу Неша, вони
рідко використовуються як орієнтир для щоденної поведінки, або
спостерігаються в практиці людських суперечок. Однак, як теоретичний
концепт в економіці і еволюційній біології, рівновага Неша має велику
пояснювальну силу. Виграш в економіці — корисність (інколи гроші), а в
біології — передача генів, обидва є фундаментальними для виживання.
Дослідники, які застосовують теорію ігор в цих сферах вимагають, щоб
стратегії зазнавали невдач максимізації. Цей висновок випливає з теорії
«стабільності». В цих ситуаціях припущення, що спостережувана стратегія є
насправді рівновагою Неша часто породжена дослідженнями
Слайд №15.
Зв’язок з обережними недомінованими стратегіями
На відміну від складної або обережної поведінки концепція рівноваги Неша
не дає конкретних рекомендацій із вибору стратегії. Для ігор двох осіб із
нульовою сумою NE–ситуації є, очевидно, просто сідловими точками, тому
нешівські стратегії збігаються з оптимальними стратегіями.
Слайд №16.
Зв’язок з оптимальними за Парето ситуаціями
В теорії ігор існують 2 головні моделі: безкоаліційні та коаліційні ігри.
Радикальний підхід Джона Неша в порівнянні з викладенням Джона фон
Ноймана доводить приблизний розподіл сил в цих 2 моделях. Вирішення
даної проблеми дозволяє нам стверджувати про існуючу рівновагу, згідно з
теорією Неша.
Проте це не означає, ані що такий розв'язок ситуації є єдиним, ані що не
існує іншої ймовірності перерозподілу гравців. Іншими словами, щоб
розрахувати утворення коаліції ми повинні дослідити найгірший варіант
розвитку ситуації в обидвох моделях для прийняття єдиного оптимального
рішення. Ймовірність розв'язків гри змушує Неша знаходитися в визначних
рамках MinMax теорії фон Ноймана — Морґенштерна.
Проте якщо існують угоди, які дозволяють і навіть зобов'язують до
співробітництва, тоді краще брати до уваги не тільки теорію рівноваг Неша,
але і принцип ефективних наслідків Парето. В цьому випадку принцип
ефективності має велике значення. Так як надає нам вибір, встановлюючи
рамки для порівняння.
Ефективність розв'язку тоді є наслідком однієї ефективної стратегії, яка
робить максимальними виграші обидвох гравців, що на даний момент
співпрацюють між собою. Відповідно, цей підхід є кращим коли існує
можливість проведення переговорів щодо утворення коаліції. Проте, навіть в
цьому випадку точка рівноваги, яка базується на встановлених
домовленостях є знову ж таки не єдино можливою.
Звичайно, в межах підходу Оуена, теорія Неша може бути розширеною, що
надає нам можливість розрахувати найкращий результат Парето. Більше
того, за умов постійного проходження подій, можна зробити аналітичний
розрахунок розподілу рівноваги Парето.
Слайд №17.
Використані джерела.
• А. Субботін. Ігор теорія // Політична енциклопедія. Редкол.: Ю.
Левенець (голова), Ю. Шаповал (заст. голови) та ін. — К.:
Парламентське видавництво, 2011. — с.273 
• Дослідження операцій. Ч. 3. Ухвалення рішень і теорія ігор /
М. Я. Бартіш, І. М. Дудзяний. — Львів: Видавничий центр
Львівського національного університету ім. І.Франка, 2009 . — 277
с. : іл. — Бібліогр.: с.271-272
• Мак-Кинси Дж. Введение в теорию игр. — М.: ГИФМЛ, 1960. —
420 с.
• Мулен Э. Теория игр с примерами из математической
экономики. — М.: Мир, 1985. — 200 с.
• Теорія ігор / Бартіш М. Я., Роман Л. Л. — Львів: Видавничий
центр ЛНУ, 2005. — 120 с.
• фон Нейман Дж., Моргенштерн Э. Теория игр и экономическое
поведение. — М.: Наука, 1970. — 708 с.

You might also like