You are on page 1of 126

Олексій Ігнатенко: Теорія ігор: дилема

ув’язненого, стратегія мстивого зяблика та


реформи
Теорія ігор: дилема ув’язненого, стратегія
мстивого зяблика та реформи
рік тому
Наука
14 100
670
6
19

Теорія ігор
Теорія ігор досліджує процеси ухвалення рішень у складних ситуаціях. Для визначення гри
потрібно задати гравців (хто власне буде ухвалювати рішення), описати їх можливі дії,
визначити всі можливі наслідки дій гравців та задати на них функцію виграшу. Власне гра
виникає коли виграші одного гравця залежать від дій інших. Важливою, також, є наявна у
гравців інформація, оскільки вона впливає на стратегії гравців. Стратегією гравця називається
правило, яке дозволяє вибрати для кожної позиції гри і наявної в цей момент інформації - дію.

Наприклад, відома всім гра у камінь-ножиці-бумагу є предметом дослідження теорії ігор,


оскільки в ній є гравці, відомі їх дії (вибір одного з трьох варіантів) та виграші (які залежать від
дій інших). При цьому стратегія може бути фіксована - завжди грати камінь (багато ви нею не
виграєте), або ймовірністна - вибирати з рівною ймовірністю з усіх варіантів (ця стратегія є
рівновагою Неша для даної гри).

Про теорію ігор можна розказувати дуже довго, але ідея цієї статті - розказати про одну гру, яка
є найбільш цікавою, складною та контрінтуітивною з базових ігор. І ще її особливість в тому, що
вона часто зустрічається у реальному житті. В цій статті я спробую описати ділему ув’язненого
у науковій галузі.

Дилема ув’язненого
Класичне формулювання дилеми ув’язненого таке: двох злочинців, яких підозрюють у скоєнні
злочину піймали за дрібне правопорушення. Їх садять у різні камери без змоги спілкування і
пропонують кожному угоду зі слідством, якщо той зізнається у злочині. Якщо обоє мовчать -
вони отримують невеликий термін за правопорушення, якщо обоє зізнаються - отримують
помірний термін (пом’якшений за зізнання), якщо один зізнається, то він отримує умовне
покарання, а інший - максимальне. Відповідно стратегія кожного або кооперація зі своїм
напарником (тобто мовчати), або зрадити (тобто зізнатись). Виграші визначимо у формі балів
за той чи інший результат - кожен гравець хоче максимізувати свої бали. Наступна матриці
(перша цифра виграш гравця який вибирає рядки, друга - стовпці) описує гру - у клітинках
результат для відповідної комбінації стратегій у формі (виграш першого гравця - виграш другого
гравця) :
другий гравець

кооперація (другий гравець зрада (другий гравець


мовчить) зізнається)

кооперація (перший гравець


33 05
мовчить)

перший
гравець зрада (перший гравець
50 11
зізнається)

Тут числа описують бажаність результату для гравця. Легко бачити, що кожен з гравців має
домінуючу стратегію - зраджувати завжди вигідніше, незалежно від дій суперника. Ситуація
зрада-зрада є рівновагою Неша, жодному гравців не вигідно відхилятися - він погіршує свій
виграш. Покращити виграш можна лише домовившись - але в рамках некооперативної гри у
гравців немає ніяких стимулів дотримуватись угоди.

Виникає дивна ситуація: найкращий результат - кооперація, але він недосяжний! Існує велика
кількість обговорень чому і як виникає така ситуація, але давайте просто розглянемо наступний
приклад.

Приклад 1. Припустимо Ви прийшли в казино з метою взяти участь у покерному турнірі.


Вхідний внесок дорівнює 65$ (ці гроші ідуть у призовий фонд ) і Ви отримуєте 2500 фішок для
гри. В цей момент казино пропонує Вам додаткову можливість - докупити ще 500 фішок за 5$.

Як би Ви вчинили? 500 фішок можуть бути критичним на початку і сума досить смішна.
Маленька додаткова деталь - ці гроші не потрапляють у призовий фонд - казино бере їх собі.

Виявляється, що стратегія брати додаткові фішки є домінуючою. Якщо інші гравці не взяли
фішки - я покращую свої шанси на виграш, якщо інші гравці взяли фішки - я також покращую
свої шанси (вирівнюючи їх). Це ї є дилема ув’язненого.

Результат - всі гравці докупили фішки, їх шанси на виграш практично не змінилися, казино
отримало N*5$ просто так.

Приклад 2. В 70хх роках на американському телебаченні відбувалась війна брендів цигарок.


Реклама досягла візуальної досконалості, були продумані цілі всесвіти, такі як країна
Мальборо. Великі компанії витрачали суттєві кошти. Виявилось. що ситуація повторює дилему
ув’язненого - великі компанії, які поділили ринок хотіли б припинити агресивну коштовну
рекламу - але тільки в тому разі якщо всі це зроблять. Якщо одна компанія рекламується, а інші
- ні, то перша кампанія отримує бонуси і переманює покупців. Тому не дивно, що заборону
реклами цигарок (1971), можливо (прямих доказів немає), лобіювали великі тютюнові компанії,
такі як Філіп Моріс. Заборона їх цілком влаштовувала, оскільки зафіксувала долі ринку.

Нарешті останній приклад був запропонований Р. Докінзом у книжці Егоїстичний ген. Уявимо
собі популяцію пташок (нехай це будуть зяблики), яких мучають паразити. Кожна пташка може
почистити собі всі частини крім маківки, тому вона звертається по допомогу до інших. Ресурси
обмежені, тому кожна пташка зацікавлена у виживанні (навіть за рахунок інших), таким чином
вибираючи “не допомагати” я покращую свої шанси на виживання незалежно від дій іншого.

Звичайно, така ситуація сформована декількома елементами моделі, які жорстко задані:
раціональність гравців (тобто вважається, що кожен учасник намагається максимізувати
виграш), відсутність можливості спілкування, один раунд гри.
Але головна проблема з дилемою ув’язненого така: вона суперечить досвіду - принаймі в
деяких іграх, які проводились автором під час популярних лекцій і курсів в КПІ стабільно 30-
40% учасників обирали кооперацію. Це підтверджено і іншими соціальними експериментами -
люди прагнуть співпрацювати (іноді це бажання залежить від культури, досвіду, освіти).

Також існують приклади поведінки тварин, які в результаті еволюції виробили подібні
механізми. Ті ж самі зграйні пташки співпрацюють у природі.

Результат теорії ігор (хоча частково і суперечить досвіду) цілком узгоджений, наприклад,
ситуації з голосуванням. Так, голосування “за гречку” також є дилемою ув’язненого. Наприклад,
є опції отримати щось корисне зараз, або проголосувати за достойного кандидата. У будь-
якому разі - якщо інші проголосують за достойного кандидата, або візьмуть гречку - вигідно
брати гречку.

Цікавим наслідком цього є, наприклад, беззмістовність закликів до “всіх” змінити свою


поведінку на виборах - ходити, обирати достойних і т.д., оскільки це не працює для дилеми
ув’язненого. В рівноважному стані усі гравці задоволені і ніхто не хоче змінювати свою
стратегію. Для розв’язання цієї соціальної дилеми потрібно вийти за рамки гри. Які є варіанти
змінити поведінку раціональних гравців у цій ситуації? Ось деякі з них:

1. перетворити їх на нераціональних (ситуації екзистенціального вибору - війна, існування


держави і т.д.)
2. Змінити платежі так, щоб виграш від короткотермінових бонусів був менше за
довготривалі виграші від голосування за хорошого кандидата (ну можливо колись це
станеться)
3. Додати зовнішню структуру, яка б заохочувала до кооперації. Наприклад невідворотність
покарання за підкуп виборців.

Тож невже все так сумно? Насправді не все.

Багатокрокова дилема ув’язненого


Причина, чому зяблики співпрацюють може полягати у багатокроковості гри. Адже життя не
закінчується одним епізодом взаємодії, а продовжується на наступний день. Якщо сьогодні я
відмовлюсь рятувати тебе, то завтра не буде кому врятувати мене. Ідея, звичайно, у вірному
напрямку, але багатокроковість не працює, якщо кількість раундів фіксована. У цьому випадку
на останньому раунді всім знову вигідно зраджувати, а отже і на передостанньому також і т.д.

Ситуацію рятує або нескінченна кількість раундів, або додавання ймовірності (і це красивий
несподіваний результат). Якщо на кожному раунді гра закінчується з фіксованою ймовірністю,
то (за деяких умов) співпрацювати стає вигідно.

Не зовсім зрозуміло, правда, як використати цей результат на практиці, тому ми розглянемо


інший підхід.

Турнір Аксельрода
В 1980 році Роберт Аксельрод запропонував різним вченим взяти участь у особливому турнірі з
дилеми ув’язненого. Кожен з них надіслав стратегію гри у вигляді програми. Після цього для
кожної пари стратегій була запущена 150 раундова гра. Практична ідея яка за цим стоїть
наступна: гравці використовують стратегії і порівнюють виграші свої і інших. Після певного часу
раціональні гравці вибирають стратегії, що дають найбільший виграш.

Неймовірно, але переможцем виявилась одна з найпростіших стратегій “зуб-за-зуб”. Ця


стратегія починала з співпраці а потім копіювала поведінку суперника на попередньому кроці.
Тобто мстила за зраду, але враховувала повернення до співпраці.
Ця ж стратегія перемогла і на другому турнірі. Виявилось, що “зуб-за-зуб” дає пристойний
виграш проти “паскудних” стратегій і добре кооперується з наївними. Таким чином, в
середньому це найкраща стратегія.

На турнірі було багато стратегій, але ми обмежимось розглядом двох з них.

Наївні, паскудні і мстиві зяблики


Розглянемо популяцію наївних зябликів (НЗ), кожен з яких співпрацює з іншими. Додамо новий
тип поведінки - паскудні зяблики (ПЗ). Паскудні зяблики просять про допомогу, але ніколи не
допомагають у відповідь.

Для ілюстрації використаємо Модель 1 (можна гратись он-лайн), яка є частиною бібліотеки
моделей системи NetLogo (можна скачати і погратись тут).

В цій моделі кількість учасників наперед фіксована і не змінюється. Вони зустрічаються під час
віпадкових блукань і при зустрічі грають гру (див Таблицю 1).

Результати моделювання протягом часу показує, що виграш паскудних зябликів (синя лінія)
завжди більша за виграш наївних (червона лінія).

Однак, якщо ми подивимось на взаємодію мстивих (зелена лінія) і паскудних зябликів, то ми


побачимо цікаву динаміку - спочатку останні виграють, до того моменту, як більшість мстивих
зябликів (МЗ) зіткнеться з обманом і запам’ятає своїх “партнерів”. Це займає багато часу.

Ще більш цікаво, що наявність наївних зябликів не дає можливість перемагати стратегії МЗ.
Наївні зяблики є тою харчовою базою, яку використовують паскудні зяблики для отримання
виграшів.
Більш ефективним є стратегія мстивих зябликів які галасують (МЗяГ - фіолетова лінія). В цій
моделі мстивий зяблик, який зустрічається з обманом починає інформувати всіх інших про того,
хто його обманув. В результаті виграш стратегії МЗяГ набагато швидше перебиває стратегію
паскудних зябликів.

Схожі шаблони кожен може пошукати навколо нас. Розглянемо такий: науковий плагіат і
імітація наукових досліджень. Хронологічно ситуацію можна представити так:

1. Початкова система. Загалом система захисту дисертацій з природничих наук до розвалу


союзу виконувала свою функцію. Відповідно наївні зяблики просто робили науку і
намагались чесно публікуватись, захищатись і т.д.
2. Зникнення обмежуючих фільтрів. Після 90хх радикальне розрідження наукової спільноти,
фактично необхідність виживання призвели до розвалу експертизи у журналах, наукових
радах. Виникає можливість “комерційного” захисту.
3. Після зменшення конкуренції починається деградація. Будь-який інститут - це ставки
співробітників, крім того певні посади вимагають наявності наукового ступеня. Аспіранти і
захисти умова отримання грошей, таким чином виграші паскудних зябликів зростають.
Числимось на ставці - пишем статті для звітності - виконуємо формальні вимоги -
автозахист - ставка більша.
4. Загроза іншим. В певний момент кількість паскудних зябликів зростає і вони зустрічаються
з наївними. Наївні вчені розуміють, що вони програють - витрачені зусилля важать стільки
ж скільки імітована наука. Зрозуміло, що справжній вчений запам’ятовує роботу з
плагіатом яку він рецензував або захищену порожню дисертацію і робить висновки.
5. В якийсь момент спільнота розуміє, що раз нічого не можна зробити, то потрібно принаймі
говорити про це. Інформувати, створювати базу паскудних зябликів. Так виникає стратегія
МЗяГ.
6. Тенденції. Поки що виграші паскудних зябликів переважають.

Деякі цікаві моменти


1. Кількість наївних зябликів не має значення - вони не можуть виграти в цій грі просто в
силу її структури. Усереднені виграші паскудних зябликів (що цікаво) більші, якщо їх
менше. Тобто, якщо зовнішня сила зменшує поточну кількість ПЗ і не змінює правил гри -
вони радіють, адже частка кожного зростає.
2. Стратегія мстивих зябликів дозволяє (дуже повільно) вигравати у ПЗ і змінювати ситуацію
на краще. Стратегія МЗяГ пришвидшує процес. Позбавлення гравців, що використовують
стратегію ПЗ виграшів дає можливість зупинити їх експансію і поступово локалізувати.
Але для успішності необхідна включеність у процес максимальної кількості наївних
зябликів.
3. Кількість скандалів та їх поширеність є, таким чином, індикатором успішності
реформування, а розголос і зберігання інформації про всіх ПЗ є ключовими.
4. Цікаво, що мстивість є якістю, яка сприяє співпраці у середовищі - досить парадоксальний
висновок.
5. Статегії “зуб-за-зуб” та мстивий зяблик еквівалентні для паскудних зябликів, але перша
пробачає після покарання. Чи є сенс її застосовувати - відкрите питання.
Олексій Ігнатенко: Математика і політика:
Індекси влади або навіщо політикам
комбінаторика?
Математика і політика: Індекси влади або
навіщо політикам комбінаторика?
6 місяців тому
Наука
2 820
156
1
10

Ключовим питанням політичного процесу є влада. Щоб отримати владу люди брешуть,
маніпулюють, витрачають час і гроші, йдуть на злочини. І іноді можна сказати, що влада
абсолютна, але все таки в житті влада є обмеженою різними інституціями і структурою
держави. В цій публікації ми розглянемо індекси влади - формально-структурний показник
“сили” тої чи іншої посади (різні неформальні впливи або махінації розглядатись не будуть, але
навіть такий інструмент досить корисний для розуміння).

Інтуїтивно ясно, що влада одного депутата менша за владу фракції 20 депутатів (якщо вони
домовляться голосувати спільно, як один). А влада 226 депутатів має бути більшою за владу
225, оскільки рішення ухвалюються більшістью. З іншого боку ще є президент (який за рахунок
права вето також є стороною законотворчого процесу) і в нього також є влада, правда неясно
скільки. А от конституційна більшість повинна мати максимальну владу, тобто влада коаліції з
310 депутатів має бути така ж як і 315. В даному випадку під владою розуміється ухвалення
законів.

Індекс Шеплі-Шубіка
В 1954 році у статті двох визначних вчених Ллойда Шеплі і Мартіна Шубіка було запропоновано
метод виміру, який отримав назву індекс влади Шеплі-Шубіка. Його ідея, як це часто буває з
математичними результатами, дуже проста, але її реалізація вимагає знання комбінаторики і
конкретних обчислень. Оскільки за емпіричним правилом одна формула в тексті зменшує
кількість читачів удвічі я спробую обійтись словами і табличками.

Приклад 1.

Отже, уявимо собі, що є комітет з чотирьох осіб А, Б, С, Д. Для успішного голосування потрібна
проста більшість. У А - голови комітета два голоси у голосуваннях. Таке часто
використовується для парної кількості, щоб рішення завжди ухвалювалось. Як обчислити
індекси влади?

Потрібно утворити упорядковані комбінації з учасників НЕНАЧЕ вони голосують послідовно і


відмітити чий голос був вирішальним - тобто таким, після додавання якого рішення стало
ухваленим. Потім для кожного учасника поділити кількість комбінацій, де його голос був
вирішальним на кількість всіх комбінацій, це і буде індекс його влади.

Як відомо існує N! (N факторіал) способів упорядкувати N елементів. Також, використовуючи


теореми про множення та додавання комбінацій можна отримати результат відразу, але
давайте напишем всі 24 комбінації, виділяючи жирним вирішальних учасників:

АБСД БАСД САБД ДАБС

АБДС БАДС САДБ ДАСБ

АСБД БСАД СБАД ДБАС

АСДБ БСДА СБДА ДБСА

АДБС БДАС СДАБ ДСАБ

АДСБ БДСА СДБА ДСБА

Отже А має 12 комбінацій, Б, С, Д по 4 кожен. Усього комбінацій 4! = 24. Їх індекси влади:

А=½

Б, С, Д = ⅙

Приклад 2.

Припустимо у нас в парламенті (Верховній Раді) є дві партії А та Б, кожна з яких має по 200
голосів (і решта партій не може утворювати з ними коаліцій).

Утворимо всі можливі комбінації А та Б та обчислимо комбінації (їх усього чотири).

АБ БА

індекси влади однакові А = ½ Б = ½

Звичайно, це тривіальний приклад. Його мета продемонструвати, що індекс влади узгоджений з


здоровим глуздом.

Приклад 3. Розглянемо ситуацію з нашого життя. Згідно сайту Верховної Ради на сьогодні
фракції налічують таку кількість депутатів : БПП 136, НФ 81, ОБ 43, Самопоміч 25, Радикальна
партія 21 та менші.

Уявимо собі коаліцію з перших чотирьох фракцій та обчислимо їх владу відповідно до індексу
Шеплі-Шубіка (комбінації виписувати не будем, просто результат. Вирішальним будемо вважати
досягнення 226 голосів - простої більшості).

Виходить: БПП ½ НФ ⅓ ОБ 1/12 Самопоміч 1/12.

Европейский союз
Перший Європейський Союз був утворений Германією, Францією, Італією, Бельгією,
Нідерландами і Люксембургом в 1958р. При цьому Германія, Франція, Італія отримували по 4
голоси, Бельгія і Нідерланди по 2 голоси а Люксембург 1 голос. Для ухвалення рішення
потрібно було 12 з 17 голосів.

Питання: яку владу отримали країни за цією угодою?

Для обчислення індексів влади Шеплі-Шубіка уже не вийде просто виписати всі 6! = 720
комбінацій (можливо але дуже довго). Тому застосуємо комбінаторний інструмент розбиття на
частини і обчислимо індекс влади Франції. Коли голос Франції буде вирішальним? Якщо країни
перед нею у комбінації налічують 8, 9, 10 або 11 голосів.

Ситуація: рівно 8 перед Францією.


Це можливо у таких випадках:

1. Германія і Італія перед нею (2! = 2 способи), Бельгія, Нідерланди і Люксембург позаду (3!
= 6 способів), за теоремою множення 2*6 = 12 способів.
2. Германія, Бельгія, Нідерланди попереду (3! = 6 способів), Італія і Люксембург позаду (2! =
2 способи). Разом теж 12 способів.
3. Італія, Бельгія, Нідерланди попереду (3! = 6 способів), Германія і Люксембург позаду (2! =
2 способи). Разом теж 12 способів.

Отже в цьому випадку 36 випадків, коли Франція вирішальна. Для решти ситуацій рахувати тут
не будемо і випишемо відразу загальний результат:

Країна Голоси відсоток голосів індекс влади

Франція 4 23.5 0.23

Германія 4 23.5 0.23

Італія 4 23.5 0.23

Бельгія 2 11.8 0.15

Нідерланди 2 11.8 0.15

Люксембург 1 5.9 0

Цілком природним є рівність індексів для країн з однаковою кількістю голосів. Цікаво, що індекс
Бельгії і Нідерландів вище за їх відсоток голосів, а бідолашний Люксембург взагалі має
нульовий вплив.

В 1973 до ЄС додалися Великобританія, Ірландія і Данія. ПІсля переговорів вирішили, що


Британія повинна мати таку ж силу як Франція, Ірландія і Данія - менше ніж Нідерланди, але
більше за Люксембург.

В новій угоді розподіл голосів був такий:

Германія, Франція, Італія, Британія по 10

Бельгія і Нідерланди по 5

Данія і Ірландія по 3

Люксембург - 2

Необхідно для ухвалення рішення 41 з 58.

Тобто, кількість голосів у кожної країни зросла по різному. У великих країн у 2.5 рази, у
Люксембургу лише в 2. Цікаво, що в результаті індекс влади Шеплі-Шубіка Люксембурга виріс!
Це сталось тому, що тепер можливі комбінації де він буде вирішальним (в попередньому
випадку таких комбінацій просто не могло існувати).
Реформа ООН
В раді безпеки ООН, як відомо, спочатку було 5 постійних членів і 6 непостійних. Для
проходження рішення потрібно обов’язково всі 5 голосів постійних членів + 2 непостійних.
Інакше рішення ухвалене не буде. Зрозуміло, що право вето - це потужна сила, але все таки:
наскільки потужна?

Якщо обчислити індекс влади Шеплі-Шубіка, то вийде, що всі постійні члени (разом) мають вагу
0.987. Власне ділити немає сенсу, оскільки рішення вони можуть ухвалити тільки разом. Всі
непостійні члени мають індекс 0.013.

В 1965 році США запропонували реформу. Ідея була в тому, щоб зробити раду безпеки більш
демократичною. В неї додали ще 4 непостійні члени і підвищили вимоги до проходження -
тепер потрібно 5 голосів постійних членів і 4 непостійних.

Як змінилась сила країн?

Обчислення показує, що індекс влади постійних членів зменшився до 0.982, відповідно індекс
влади непостійних зріс до 0.018. Тобто формально так, став більш демократичним, але
реформою це важко назвати.

Влада президента
Обчислимо індекс влади Президента України. Для цього розглянемо всі можливі перестановки
його і 450 депутатів. Президент буде вирішальним гравцем якщо перед ним розташовані не
менш як 226 депутатів але не більше 300. В цьому разі його накладання / не накладання вето є
ключовим для проходження закону.

Потрібно обчислити перестановки 226 можливих перших депутатів, потім 227 можливих
перший депутатів, … 300 можливих перших депутатів (далі вже буде подолання вето). Знайти
суму всіх комбінацій, коли президент ключовий і поділити на загальну кількість.

Після здійснення цього отримуємо, що індекс влади Шеплі-Шубіка дорівнює 0.159. Тобто, якщо
взяти всю владу за 100% у президента приблизно 16%.

Цікаво, що оскільки насправді в Верховній Раді зараз менше 450 осіб, то влада президента
трохи більша, приблизно 17%.

Для порівняння, влада президента США також 16%.

Індекс Шеплі-Шубіка є корисним для розуміння структурної ваги тої чи іншою сторони,
наприклад, в процесі законотворчості. Це не єдиний можливий підхід, існують і інші. Наприклад
індекс влади Банзафа.

P.S. На головній картинці один з найстаріших трикутників Паскаля для обчислення


комбінаторних коефіціентів з китайського трактату, що був написаний за 300 років до
народження Паскаля.
Говорили-балакали - КУНШТ
Блог Олексія Ігнатенка: просто склади
Просто склади

У 538 році буддійський монах, подорожуючи з Китаю через Корею приніс в Японію секрет
виготовлення паперу. Ймовірно, тоді ж японці познайомились і з традиціями згортання паперу
та створення простих форм. Враховуючи його високу вартість, папір використовували для
декорацій важливих ритуальних подій, як-от весільні подарунки або поховальні квіти. Схеми
складання були жорстко фіксовані і втаємничені. Тільки під час епохи Едо (1603-1868) папір
став доступний для вільного використання достатній кількості багатих людей. У цей час
з’являється найстаріша відома на сьогодні книга зі схемами оригамі Hiden senbazuru origata
(Секрети складання тисячі журавлів, 1797 рік), яка містила 49 схем складання журавлів –
символів удачі й довголіття.
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

my.science.ua

Коли мінус на мінус не дає плюс навіть в математиці


14-17 minutes

Про елементарні операції і їх розуміння. Про числа і множини і про те, що трапляється,
коли робиш крок у невідоме. Що робити, якщо ви опинились у невідомому просторі множин
і з чого почати його облаштування? Як додавати і головне віднімати множини, щоб це мало
сенс.

Для мене задача вирішена в той момент, коли вона поставлена.


Джон Ф. Неш, математик, лауреат Нобелівської премії

Вступ

Математичні конструкції і формули часто відлякують від читання, особливо це стосується


науково-популярної літератури. І дійсно, невже не можна обійтись без них? Стівен Гокінг

1 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

колись сказав, що кожна формула зменшує кількість читачів вдвічі (це стосувалось лише
науково-популярної літератури!) і спочатку залишив в своїй “Короткій історії” одну-єдину
Е=mc2, а потім, в черговій редакції, викинув і її. Уникнення формул стало трендом і,
мабуть, мейнстрімом. І це, можливо, прийнятно в багатьох областях – біології, археології,
фізиці – але не в математиці. Справа в тому, що формули є абстракціями, які дозволяють
швидко оперувати загальними категоріями. Завдяки цим символам можливо формулювати
ідеї та будувати складні конструкції. Формульні структури утворюють спільний простір, в
якому математики можуть спілкуватись незалежно від їх мови. В цій статті я спробую
показати на дуже простому прикладі, як такі структури виникають та за якими законами
вони розвиваються (і постараюсь майже без формул).

Коли все начебто очевидно просто, але ніт

Всім відомий вираз “мінус на мінус дає плюс” і його значення. Формульно він записується
дуже коротко:

– (- а ) = + а

а ідея в тому, що мінус – це щось “погане”, але іноді комбінація поганого і поганого дають в
результаті щось “хороше” – плюс.

2 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

Як правило, плюс перед числом не пишуть, але важливо пам’ятати, що він там є.
Зрозуміло, що мінус без плюса не має сенсу, отже потрібно почати з цієї елементарної
операції. Для того щоб пройти шляхом абстрагування, потрібно згадати, як взагалі
будуються числа й здійснюються операції над ними? Спочатку потрібно визначити базовий
елемент – це може бути будь-що: наприклад, стілець.

Один стілець (базова одиниця)

Якщо у нас є стілець, то ми можемо поставити поруч ще один (уявімо собі, що в нас їх
нескінченний запас) і ця можливість вже визначає всі натуральні числа.

3 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

Один стілець і ще один стілець (ідентичний першому)

Важливо зробити крок до абстрактної кількості стільців. Хоча це цілком очевидно для нас,
далеко не всі народи в історії змогли зробити цей крок. Відомі племена, які зупинялись на
визначенні понять “один, два, багато” або ті, які мали окремі чисельники для округлих,
квадратних та лінійних предметів – бо як можна додуматись додавати дерева і оленів? Але
коли ми зробили крок до додавання кількості об’єктів, операція суми цілком інтуїтивно
зрозуміла – потрібно поставити стільці поруч і сказати: ось два стільці. Отже стілець і
стілець – тобто сума цих стільців 1 + 1 = 2. В принципі, позначати окремим символом
результат необов’язково, але це суттєво економить час. Цей крок можна, наприклад,
спостерігати у австралійських племен, у яких числа на момент приходу європейців мали
такий вигляд (плем’я Каміларої): 1 = мал, 2 = булан, 3 = гуліба, 4 = булан-булан, 5 = булан-

4 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

гуліба, 6 = гуліба-гуліба.

Таким чином, ми можемо отримати будь-яке натуральне число, просто додаючи одиницю:

1 + 1 + 1 = 3, 1 + 1 + 1 + 1 = 4, …

При цьому ми використали поки що лише один (стілець), операцію додавання й загальну
ідею абстрагування. Чому це важливо? Тому що одна проста операція (правило додавання)
утворила цілий простір чисел, який вже починає існувати за власними законами.
Наприклад, цей простір необмежений, не існує найбільшого числа оскільки до нього завжди
можна додати ще одиницю.

Наступний принципово важливий крок – знаходження елементу, який був би “нейтральним”


відносно операції. Тобто, це має бути такий “стілець”, щоб його сума з будь-яким числом не
змінювала це число. Для операції додавання традиційно такий елемент називається нулем.
Його поява (можливо в Месопотамії, можливо в Індії) була дійсно науковим проривом –
адже з практичної точки зору вводити окремий символ для позначення пустоти досить
дивно. Цей винахід зробив можливою десятичну позиційну систему числення, яка через
арабів потрапила до Європи (тому і арабські числа). Додавання нуля записується
наступним правилом:

0+а=а+0=а

5 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

Поки що все чудово й узгоджено. Є нуль і натуральні числа (деякі математики вважають
нуль натуральним, деякі – ні), сума дозволяє отримувати нові числа з існуючих і не
виводить за межі простору. Тобто, неможливо, додаючи натуральні числа, отримати
ненатуральне число.

Але в цей числовий рай потрапляє змій сумнівів і питань. От наприклад, яке число потрібно
додати до 3, щоб отримати 5? Можна підібрати це число напряму: 2 + 3 = 5, а можна
відняти від 5 (стільців) 3 (стільці) і отримати той же результат. Очевидна штука, але її
ефект прихований і руйнівний. Ми щойно ввели нову операцію, обернену до додавання. І
вона виводить за межі нашого відомого простору чисел! Щоб це зрозуміти достатньо
спитати: а яке число потрібно додати до 5, щоб отримати 2? Це число -3 і мінус тут є
частиною числа. Так, це число пов’язане з відомою нам трійкою певним співвідношенням,
але по суті від’ємні числа – це окремий клас. Тобто,

-3 = 0 – 3

Або інакше: -3 це таке число, яке при додаванні до 3 дасть 0. Множина всіх таких чисел
(додатніх і від’ємних) називається цілими числами. Цікавою є геометрична інтерпретація,
числа 3 і -3 симетричні відносно нуля, тобто операція 0 – 3 це те саме, що відобразити 3
відносно нуля (помножити на -1). Подвійна симетрія повертає точку саму в себе, саме тому
для чисел у виразі “мінус на мінус дає плюс” немає нічого дивного.

6 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

Як одна операція та інтуїтивне бажання узагальнювати створюють нові простори.

Послідовність кроків, яку ми щойно зробили повторюється при введенні множення.


Множення – це, по суті, сума сум чисел, і в стародавньому Єгипті, де не було позиційної
системи запису чисел, це суттєво використовували. Відомий приклад множення 11 на 13,
якому вже під 4000 тис. років. Папірус пропонує знаходити відповідь наступним чином.
Запишемо 13 = 1 + 4 + 8, потім зведемо до додавання та множення на два:

*1 11
2 22
*4 44
*8 88

Тепер додаємо числа в рядках з зірочками і отримуємо результат – 143.

Оберненою операцією до множення є ділення. Ділення виводить за межі цілих чисел і його
необхідно розширити. Наслідком є виникнення раціональних чисел (тобто чисел виду m/n,
де m, n – натуральні).

Але і це не все, бо ще є піднесення до квадрату (множення множень), яке також має


обернену операцію – видобування кореню. Видобування кореню знов таки виводить за
межі простору, доводиться розширювати його до комплексних чисел. А далі ще є поле

7 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

кватерніонів… Як видно, узагальнення – це залежність, іноді важко зупинитись. Ці нові


простори можуть бути дуже різні, але для всіх виконується правило, що мінус – це симетрія
відносно нуля. Тому мінус від мінуса таки плюс (те саме число), хоч для дійсних, хоч для
комплексних. Множення цю властивість вже втратило, тому корень кореня це корень 4
степеня а не саме число (є виключення – одиниця).

Однак узагальнювати можна не лише в напрямку введення нових операцій: що буде якщо
замість однієї точки ми розглянемо множини точок?

Вихід у невідомий простір. Вітаю в просторі множин.

Множини є дійсно фундаментальним поняттям в математиці. І, завдяки Рене Декарту, ми


можемо зв’язати числа і множини. Кожне число є точкою на осі, то чому б не розглянути
множини точок, або, скажімо, відрізки? Невже щось зміниться якщо ми будемо додавати не
числа а множини?

NB. Тут потрібно зробити невеликий відступ. Якщо математики переносять стару, відому
операцію на новий простір, то вони мають це відповідно обгрунтувати. Якщо це сума, то
вона має відповідати властивостям суми, або називатись по іншому. Особливо це
стосується ситуації, коли старий простір є частиною нового. Тоді операція має
перетворюватись на звичну операцію на старому просторі, інакше виникне плутанина.

8 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

Розглянемо спочатку множину, яка складається з відрізку [1,2]. Як розуміти додавання [1,2]
+ [1,2] (не плутати з об’єднанням множин, де ми просто беремо точки однієї множини і
дописуємо точки іншої)? Герман Мінковський, німецький математик (відомий тим, що
ставив трійки Альберту Ейнштейну), запропонував такий спосіб: візьмемо всі можливі пари
точок з цих множин і знайдемо суму окремо кожної пари. Як додавати окремі точки ми
знаємо. А потім об’єднаємо результати в одну множину. Ця операція отримала назву сума
Мінковського (але іноді її називають просто сумою множин). Формульно це записується
просто:

X + Y = {z ∈ Rn: z = x + y, x ∈ X, y ∈ Y}

9 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

Герман Мінковський (1864–1909). Як пізніше згадував Ейнштейн: “Всю необхідну для теорії
відносності математику я взяв з лекцій Мінковського.”

Праці Мінковського щодо загальної теорії відносності нещодавно видані окремою книгою
[1].

Спочатку спробуємо додавати множини в одновимірному просторі. Найпростіша множина з


двох точок {-1,1}, додамо її до самої себе:
{-1,1} + {-1,1} = {-2, 0, 2}

Тут ми утворили пари -1 -1, -1 1, 1 -1, 1 1 і знайшли суми для кожної пари.
{-1,1} + {-1,1} + {-1,1} = {-3, -1, 1, 3}
{-1,1} + {-1,1} + {-1,1} + {-1,1} = {-4, -2, 0, 2, 4}

Щось не дуже схоже на числа. Спробуємо додати відрізок [1,2]:


[1,2] + [1,2] = [2,4]
[1,2] + [1,2] + [1,2] = [3,6]
[1,2] + [1,2] + [1,2] + [1,2] = [4,8]

Це вже схоже на додавання чисел, чи не так? Адже [2,4] = 2*[1,2], якщо множення розуміти
аналогічно додаванню. Але вже з першого прикладу зрозуміло, що X + X ≠ 2X для довільної
множини.

10 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

Ще один приклад, коли X + X ≠ 2X ([2]):

Ще один цікавий приклад: що можна сказати про множину X, для якої виконується X + X =
X? Для чисел відповідь очевидна – це може бути тільки нуль. А от множин таких
нескінченно багато. Дійсно, візьмемо множину всіх цілих чисел {…-3, -2, -1, 0, 1, 2, 3,…},
для неї властивість виконується. Візьмемо будь-яке ірраціональне число, нехай це буде π.
Помножимо його на кожне ціле число – {…-3π, -2π, – π , 0, π, 2π, 3π,…}, для цієї множини
також X + X = X.

Навіть якщо ми введемо додаткове обмеження щоб множина Х була опукла. (опуклість
означає, що вона завжди містить відрізок який сполучає дві будь-які її точки. На числовій
прямій опуклими множинами є відрізки або півнескінченні інтервали), то таких множин на
числовій прямій буде рівно шість (чи зможете ви їх знайти?).

Спробуємо тепер додати множини на площині. Виявляється, що найпростіше додавати


круги (нагадую, що круг – це точки площини, обмежені колом). Якщо взяти два круга, то їх
сума теж буде кругом з центром у сумі центрів і з радіусом рівним сумі радіусів. Цей

11 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

елегантний результат дає інтуїтивне очікування, що операція має сенс.

Схожа ситуація відбувається при додаванні однотипних квадратів, трикутників і т.д. А що


буде при додаванні квадрата і круга?

Результатом буде такий квадрат з “згладженими” кутиками (його границя виділена


червоною лінією). Додавання різних фігур у двовимірному та тривимірному просторі можна
глянути в презентації [3].

12 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

Але якщо додавання ще можна дещо зрозуміти, з відніманням справжня катастрофа.


Спробуємо спочатку очевидний шлях – поточкове віднімання (так само як ми зробили з
сумою):
[-1,1] + [-1,1] = [-2,2]
[-1,1] – [-1,1] = [-2,2]

Виходить, що X + X дає той самий результат, що і X – X? Так, і це виконується для всіх


симетричних відносно нуля множин (пам’ятаєте, що мінус – це симетрія), тобто, якщо
множина симетрична, то –X = X. Якась Орвеллівська математика виходить: свобода – це
рабство, мінус – це плюс.

Різниця Мінковського.

13 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

Простір множин (ми будемо тут говорити лише про компактні множини, ті які можна вписати
в кулю й у них суцільна границя, без дірок) виглядає як числовий простір – є сума й
множення на числа. Для них виконуються багато властивостей, звичних нам з простору
чисел. Але віднімання і множення на від’ємні числа інші. Мінковський, який одним з перших
досліджував ці простори, запропонував дуже дивну операцію. Пам’ятаєте, на початку ми
визначали -3 як число, яке потрібно додати до 5, щоб отримати 2? Мінковський використав
схожу ідею. Якщо нам потрібно знайти X -* Y (де дивний значок -* означає різницю
Мінковського), то спробуємо знайти таку множину Z, щоб Z + Y була підмножиною X (для
множин рівність виконується рідко, довелось використати оператор підмножини).
Формульно це довге визначення записується так:

X -* Y = {z ∈ Rn: z + Y ⊂ X}

Спробуємо відняти від великого червоного круга (позначимо A) маленький синий круг
(позначимо B). Якщо до круга з центром в нулі додати точку – вийде круг з центром в цій
точці. Отже нам потрібно знайти всі точки, такі щоб синій круг, перенесений в цю точку, не
виходив за межу червоного.

14 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

Отже різниця Мінковського двох кругів (з центром в нулі) теж буде кругом (позначений
зеленим) а його радіус буде дорівнювати різниці радіусів – більший мінус менший. Тепер
спробуємо додати до результату круг, який ми віднімали: виходить, що A -* B + B = A. Також
виконується, що різниця Мінковського двох однакових куль буде дорівнювати множині, яка
містить лише точку 0. А це вже зовсім схоже на числа. На жаль, так красиво виходить лише
з кругами (і лише коли вони з центром в нулі), але загалом це набагато краще ніж те, що
було. При цьому важливо, що різниця Мінковського для чисел (одноточкових множин)
співпадає зі звичайною різницею.

Сума і різниця Мінковського мають багато чудових властивостей. Ці операції є основою

15 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

опуклого аналізу, дослідження багатозначних відображень і диференціальних включень. Є


й більш практичні застосування для обробки зображень[4] та алгоритмів уникнення зіткнень
у робототехніці[5].

Замість епілогу

Повертаючись до початкової фрази: виходить, що мінус на мінус дає плюс, тільки коли ми
звужуємо наше багатогранне життя до чисел – одноманітних, одноточкових множин, а
операцію – до суми. Цікаві питання, які можуть спасти на думку при читанні цієї статті:

Чи існують від’ємні множини?

Що таке добуток множин?

Що таке корень з множини?

Чи можна множину піднести до степеню множини?

Залишимо їх відкритими.

Література

[1] Minkowski, H. (2012) Space and Time Minkowski’s Papers on Relativity. Ed.: Petkov, V.,
Minkowski Institute Press, Moscu. http://rgs.vniims.ru/books/spacetime.pdf

16 of 17 8/21/19, 4:32 PM
Коли мінус на мінус не дає плюс навіть в математиці about:reader?url=http://my.science.ua/koly-minus-na-minus-ne-daye-ply...

dq=inauthor:%22Hermann+Minkowski%22&hl=uk&source=gbs_navlinks_s

[2] https://en.wikipedia.org/wiki/Minkowski_addition

[3] Minkowski Sums: definition, complexity, construction, applications. Efi Fogel Tel Aviv
University, Israel. Algorithmic Robotics and Motion Planning March 14th, 2011

[4] https://en.wikipedia.org/wiki/Erosion_(morphology)

[5] Ericson, Christer. Real-time collision detection. CRC Press, 2004.

Заголовне фото “Chess Board, External Transparency, Both Poles Showing, Droste Effect”
авторства Josh Sommers позичене на сторінці Flickr

17 of 17 8/21/19, 4:32 PM
Олексій Ігнатенко: Міфи стародавньої Індії,
контракти і трішки теорії ігор
11 місяців тому
Курйози
4 378
38
1
8

Контракти є одним з потужних механізмів зміни ігрових ситуацій. В теорії ігор під контрактом
розуміють угоду, яка регулює поведінку гравця: змушує його грати ту чи іншу стратегію у
відповідь на дії іншої сторони. Виявляється, що контракт може змінити навіть однокрокову
дилему ув’язненого (трішки про неї тут).

Дійсно, розглянемо простий приклад дилеми:

C D

C2206

D6011

Тут рівновагою є пара стратегій (D, D), тому, що стратегія D є домінуючою - вона дає кращий
виграш за будь-яких умов. Пара (С, С) дає більші виграші для кожного з гравців, але вона
недосяжна за умов однокрокової гри (та раціональності гравців).

Тепер припустимо, що у сторін з’являється можливість підписати контракт з наступними


умовами (позначимо цю стратегію А) :

1. Якщо контракт підписаний обома сторонами, то кожна сторона вибирає С.

2. Якщо контракт підписаний тільки першим гравцем, то перший гравець вибирає D.

3. Якщо контракт підписаний тільки другим гравцем, то другий гравець вибирає D.

Нова матриця гри

C D А

C220606

D601111

А601122
Тепер стратегія (A, A) є слабко домінуючою і в грі виникає інша рівновага, яка забезпечує
кращий виграш, ніж до появи контракту.

Безумовно, контракти, у певному розумінні, є чітерством, оскільки вимагають додаткових


зовнішніх сил - ми неявно припускаємо, що контракт неможливо порушити (або плата за
порушення значно переважає можливий виграш). Це вірно для бізнес-відносин, які забезпечені
ефективною правовою системою. Але є ще один приклад. У віці приблизно 11 років автором
була знайдена (і багатократно перечитана у всіх напрямках) книжка МИФЫ ДРЕВНЕЙ ИНДИИ.
На обкладинці були написані автори:

Эдуард Наумович ТЕМКИН, Владимир Гансович ЭРМАН

анонс (дрібним шрифтом) повідомляв:

“Второе издание книги (первое вышло в 1975 г.) значительно расширяет представление
читателя о древнеиндийской мифологии: оно содержит 20 не упоминавшихся в первом издании
мифов, а многие мифы, изложенные в первом издании, пересказаны теперь более подробно.
Книга рассчитана на взрослого читателя.”

Остання фраза була ключовою… тому майте на увазі, я попередив.

Міфи. Механізми проклять, угод і заслуг


Розглянемо міфи у контексті контрактів (тут я вибрав найбільш яскраві приклади). Згідно з
індуїстськими уявленнями Три світи (Небесний, Земний і Підземний) пронизані жаром
(тапасом), який є основою всього живого. У богів і інших супер-істот його більше, у людей,
очевидно, менше. Жар можна накопичувати різними способами. Основний спосіб - це
праведний спосіб життя і подвижництво. АЛЕ, накопичувати жар можна також, якщо мучити
своє тіло спеціальними процедурами (що називається аскезою).

Цікавим є те, що жар можна витрачати на вплив на світ. Подовжувати своє життя та
забезпечувати всякі плюшки. Тобто можна побажати стати багатим і, якщо жару достатньо, він
буде мінусований з вашого балансу і піде на коригування майбутнього. Можна проклясти когось
іншого, наприклад: А щоб в тебе пір'я в роті поросло. І якщо вашого жару достатньо, то так і
станеться. Особливість в тому, що необхідна кількість жару ніде не регламентується залежить
від суб’єкта прокльонів (неявно зазначається залежність від його кількості жару), тому
проклинати Шиву досить складно. З іншого боку, якщо жару на бажання вистачило, воно
неодмінно має справдитись. З точки зору теорії ігор це ідеальний контракт - зовнішня сила
гарантує його виконання за будь-яких умов. Загальна картина світу міфів - боротьба богів (які
по суті є невеликою групою молодших за статусом надістот) за збереження статус кво проти
різноманітних демонів, асурів, ракшасів та інших. Основний спосіб боротьби - використання
жару для отримання суперсили - непереможності, безсмертя, невразливості.

В міфах проявляється загальний шаблон поведінки укладання такого контракту:

1. Певна ображена особа починає накопичувати жар. Якщо концентрація стає великою,
виникає ризик катастрофи. Тому Брахма, як верховний суддя, пропонує обміняти жар на
певні корисні властивості.
2. Майже завжди особа просить непереможність, невразливість від усіх та безсмертя.
3. Безсмертя Брахма не дає (аргументує по різному, але суть - якщо в тебе погані наміри,
ніякого безсмертя). Тоді особа починає думати, як можна отримати “майже безсмертя” і тут
виникає два типи мислення.
4. Перші намагаються перелічити всі потенційно небезпечні класи ворогів, для яких вони
будуть невразливі.
5. Другі намагаються сформулювати неможливу подію, яка і тільки яка може їх погубити.
Як видно, центральна ідея, навколо якої формуються події - порушення контракту по суті без
порушення його формально.

Не баг, а фіча
Виявляється, жар можна додавати, така можливість згадується у міфі 20. Шива після втрати
коханої дружини був у депресії і тому намагався розвіятись (у своєму неповторному стилі).
Хроніки сухо повідомляють:

Шива з’явився біля житла божествених мудреців (їх взагалі семеро і вони проходять через усі
міфи) голий, покритий попелом, з очами налитими кров’ю, та з тліючими головешками у руках.
Він сміявся страшним сміхом, співав і кричав як осел і бик. Прямо на очах дружин мудреців він
почав тіліпати танцювати і так вразив присутніх, що дружини почали слідувати за ним, не
зводячи очей.
Спочатку мудреці, яким це не дуже сподобалось, намагались перетворити його на віслюка, але
жару не вистачило (Шиву вони не впізнали). Це їх здивувало, але не зупинило. Об’єднавши свої
сили і додавши жару, вони прокричали на чистому санскриті: А шоб у тебе прутень відпав,
наволоч!

Результат перевершив їх очікування. Шива зник, все потемніло на землі, природа завмерла.
Виявилось, що нормальне функціонування всесвіту просто неможливе без працездатного
Шиви. Довелось йти до нього на поклон, молити про прощення… про розв’язання проблеми
нічого не говориться. Але з того часу Шиві ставлять кам’яні лінгами, що натякає.

Взагалі ця тема (втрата прутня після прокляття мудреця за ігри з його молодою дружиною)
повторюється і для Індри. Йому після аналогічного випадку приставили баранячі причандали.
Мабуть це одна з причин його запального характера - важко бути спокійним, коли всі Три світи
знають і твій біль нікого..., ну ви зрозуміли.

Головні діючі особи


У перших 20 міфах швидко пояснюється походження світу і його структура і вводяться основні
дійові особи. Події концентруються навколо двох проблем, які, очевидно, мучили стародавніх
індусів: крадіжки корів, бухла та дівок і відповідальності за це.

Брахма, Шива, Вішну


Брахма - творець світу, все що є у всесвіті народилось від нього. Він суддя, слідкує за
балансом.

Шива - бог руйнування, але також і джерело енергії хаосу.

Вішну - зберігає існуючий лад (хронологічно у міфах його роль спочатку незначна, потім
зростає).

Разом вони утворюють Тримурті - трійцю богів, яка визначає долю всесвіту - Брахма створює,
Вішну охороняє, Шива руйнує.

Індра і інші боги


Власне боги або сури діти Адіті (Нескінченності). Їх старші (двоюрідні) брати і вічні суперники -
асури, діти Дану і Діті (всі троє - дочки мудреця Кашьяпи, внука Брахми).

Індра - головна діюча особа щоб було зрозуміло це такий Тор з болівуду. Гультій, бабник, алкаш
і іноді бог блискавки. В основному править небесами і розрулює дрібні конфлікти.

Вайю - бог вітру, Сур’я - сонця, Агні - вогню, Яма - смерті, Кубера - мудрості, Варуна - моря.

Дани, діті, ракшаси, якші і всі всі всі


Дани і діті або асури традиційно зображаються багаторукими, зловмисними, могутніми і т.д.
Можуть міняти подобу та володіють чарами. Їм було призначено володіти світом (разом з
богами), але щось постійно йшло не так. Причина - надзвичайна могутність призводила до
гордості, яка призводила до втрати благочестя, яка призводила до загибелі (така офіційна
версія, написана богами).

Яскравий приклад - Хіраньякшипу, цар асурів. Мав дар невразливості від сурів і асурів та від
людей і звірів. Але, повіривши у свою всемогутність, почав жорстко притісняти живі істоти. Його
син Прахлада намагався опиратись батькові, за що був жорстоко покараний.
Хіраньякшипу намотує кишки свого сина Прахлади

На щастя Прахлади, йому допоміг Вішну - він надав йому невразливість до всіх тортур. А потім
сам прийшов у гості. В образі людинолева. На лідинолевів дар Брахми не розповсюджувався
(от не повезло пацану), тому Хіраньякшипу був розірваний на шматочки. Взагалі асурів боги
розводили як кошенят як хотіли, навіть тоді, коли ті грали за правилами.

Прахлада був дуже благочестивим і тому його ніхто не міг перемогти. Але Індра (в образі
брахмана) перед двобоєм попросив (!!!) у нього віддати благочестя. Прахлада не зміг відмовити
брахману і був вбитий.

Його внук Балі був ще більш благочестивим і отримав за це владу над Всесвітом. Але це не
дуже сподобалось богам. Тоді Вішну в образі карлика прийшов і попросив у нього стільки землі,
скільки зможе відміряти трьома кроками. Балі погодився. За перший крок Вішну покрив Небо, за
друге Землю. Третій (Підземний світ) він милостиво залишив ох...им здивованим асурам.

Що вже говорити про різних зловмисників.


Контракти прихильників скінченного
перелічення
Намучі
Намучі був царем асурів. Намучі і Індра уклали контракт: “жоден не вдарить іншого ні вдень ні
вночі, ні на суші ні у воді, ні сухою ні вологою зброєю”. Це мало гарантувати їх вічну дружбу.

Але Намучі втратив береги і “поцупив силу” Індри, накачавши того дешевим пійлом. Щоб це не
означало, Індра був дуже розлючений. Рішення знайшлось досить швидко:

на світанку,

на лінії прибою,

зброєю, покритою морською піною

Індра відрізав Намучі голову.

Просто і елегантно і не порушує контракту.


Равана
Равана відомий за епосом Рамаяна досить добре, тому підкреслимо лише ті моменти, які
стосуються його контрактних відносин з богами. Отже, Равана і його брат Кумбхакарна
вирішили отримати силу і почали поститись 1000 років, лежати між вогнів (зрозуміло
негасимих). Равана відрізав свої десять голів одну за іншою… дістали дідуся Брахму нарешті.
Але їх зловмисні наміри були надто очевидні, тому ніякого безсмертя і всемогутності.
Кумбхакарну взагалі красиво прокинули, йому перед візитом Брахми підіслали богиню мудрості,
яка сховалась в гортані. І коли власне настав час побажання, перехопила контроль за ротом і
сказала: бажаю заснути на 1000 років. (А ШО ТАК МОЖНА БУЛО?).

Й
Равані дали можливість позагадувати. Його бажання було таким:

Хочу бути невразливим для

1. асурів
2. богів
3. птиць-супарнів
4. якшів
5. ракшасів
6. змій

За логікою виходило, що ще були люди і мавпи (про них нижче). Ну цей простий контракт боги
розіграли масштабно. Цілий епос наваяли. З цікавих моментів, коли Равана зовсім втратив
береги і наїхав на Шиву, той просто придавив йому руки горою. Це не порушувало контракт і
повністю знерухомило Равану (А ШО І ТАК МОЖНА БУЛО?).
Контракти прихильників “неможливих”
випадків
Сунда і Упасунда
Два брати вирішили отримати силу та перемогти всіх богів. Для цього вони: голодали, не
мились, стояли на одному (великому) пальці однієї ноги і дивились на небо.
Хотіли: уміти міняти подобу, владу над будь-якою зброєю, бути невразливими для будь-якого,
крім один одного, і безсмертя.

Отримали: все, крім останнього.

Після цього зібрали армію та пішли воювати небеса.

Боги втекли від битви.

Брати гуляли, пиячили, грали гусей любили апсар. Боги кинулись жалітися Брахмі і він сказав:
спокійно, я зроблю їм пропозицію дівку, від якої вони не зможуть відмовитись. Так була
створена Тілоттама - ідеальна апсара

Тілоттама прийшла до братів “з маленьким шматочком червоної тканини на стегнах” і ефект був
такий, що брати відразу кинулись… але не на неї а один на одного і почали лупити палицями з
криками моя прелєсть це буде моя дружина. Аж поки не впали мертві. Премію Дарвіна цим
двом моногетеросексуалам!

Цікаво, що боги в аналогічній ситуації знайшли цілком очевидне рішення. Тут індуси прозоро
натякають на важливість кооперації і пошуку взаємовигідних варіантів. Власне міф про це (міф
38) настільки вражає, що мимоволі заздриш стародавнім індусам, які, використовуючи лише
алкогольні напої, змогли придумати таку історію.

Ліричний відступ про появу божественних мавп


Отже, Брахма сидів і думав про щось благочестиве (а як інакше) і від натуги напружених думок
у нього пішли сльози. З цієї сльози народилась мавпа, якого він назвав Рикшараджа. Брахма
наказав йому йти у гори і їсти плоди і корінці а також розмножуватись (ЧТОА?). Рикшиджака
зробив все як наказано, пішов у гори, їв корінці. Але з розмноженням не дуже вийшло, оскільки
він був у єдиному екземплярі (дивно га?). Якось він дійшов до чарівного озера і побачив своє
відображення. Це його розлютило і він кинувся на іншу мавпу. Потрапивши у воду він змінив
стать і став самкою. Доцільно навести опис без перекладу:

“стал...красавицей, чарующей взоры и сердца, со стройным станом, черными бровями и


вьющимися локонами, с высокой упругой грудью и широкими округлыми бедрами.”

Еммм, … це про мавп, раптом що. Ну і про стародавніх індусів.


Тепер Рикшараджа була/був самкою, але розмножитись все ще не міг/могла.

І тут її/його побачили двоє богів, сонця Сурья і грому Індра. В їх серці запалала хіть і розум
помутився і вони кинулись на Рикшараджу. Після цього в неї народилось два сина. А потім вона
знов перетворилась на самця. І потім у трьох мавп-мужиків народились тисячі мавп, які
оселились у чудовому місті Кішкіндху.
Тарака
Тарака був дуже мотивованим до перемоги над богами. Для отримання сили та безсмертя він
почав мучити своє тіло аскезою. Запалив кільце негасимих багать, відмовився від їжі. Потім
почав зрізати м’ясо з кісток і кидати у вогонь. Очевидно, що це дало високу швидкість
накопичення жару і незабаром сам Брахма прийшов до нього і спитав, що ж він хоче. Тарака
хотів безсмертя і повної могутності, але одержав відмову. Тоді, він проявив винахідливість і
сказав: нехай тільки семиденне немовля зможе мене вбити. На це Брахма погодився.

Далі Тарака зібрав військо асурів, осідлав восьмиколісну колісницю з 1000 коней (мабуть одне з
найменш працездатних транспортних засобів) і пішов на небеса. Боги були розгромлені та (як і
завжди) пішли жалітись Брахмі. Брахма заявив, що тільки син Шиви зможе вбити Тараку у
семиденному віці. І тут почався один з найбільш чудернацьких квестів у Трьох Світах.

Після певних подій (описаних вище) Шива мав особливості не планував одружуватись. На всі
дрібні розборки богів йому було начхати. Тому боги придумали хитрий план:

1. Одружити Шиву
2. Дочекатись народження дитини
3. Дитина вбиває Тараку
4. …
5. Profit

Спочатку була знайдена кандидатура на дружину. Це була дочка Хімавата (тобто Гімалаїв, які у
індусів чоловічого роду) Ума Турман (взагалі якщо хто не знав Ума Турман завдячує ім’ям саме
цій богині), яка ще у юному віці безнадійно закохалась у Шиву. Тут боги вирішили трохі
пришвидшити події і Кама, бог любові підкрався до Шиви і спробував засадити йому квіткову
стрілу пробудити любов у його серці. Шива спелелив Каму і його стріли поглядом, але все вже
закрути... Шива взяв Уму за дружину, і всі боги раділи на весіллі.
Потім Шива з нареченою зникли у своїх покоях, а боги сіли чекати навколо. Шлюбна ніч Шиви
тривала небесний рік (дорівнює 360 земним рокам), тому присутні дещо занервували. Врешті
решт нерви не витримали і всі почали горланити: та скільки ж можна дзюмбатись! Виходь, о
великий бог! Притісняє нас Тарака, не дає пирувати на небесах.

Як ви розумієте Шива вийшов дещо розлюченим, і відразу “зронив своє плодоносне сім’я у
вогонь Агні”. Але Агні не втримав і викинув його у Гангу (це теж богиня і річка). Ганга теж не
витримала і винесла на берег, де ріс очерет. Очерет не був взагалі ніяким богом і йому було
начхати, тому там народилась дитина, яку назвали Скандою.

В цей же час, в обителі сімох мудреців (тих, що проклинали Шиву) розгорілась інша драма. Агні
давно намагався звабити дружин мудреців (взагалі це було щось типу суперліги - звабити
дружину мудреця, попастись, огрести прокляття і потрапити у міф. Всі боги цим займались). А
мудреці якраз вирішили (ще до народження Сканди - часу ж було багато) провести обряд з
вогнем… кортше кажучи Агні отримав можливість підглядати за дружинами через домашнє
вогнище і його хіть розгоралась все більше. Врешті решт Агні не витримав і … втік у ліс (логічно
ж). І там у лісі його знайшла одна богиня, яка давно хотіла звабити самого Агні (а ви думаєте
індійське кіно просто так з’явилось?) і вона почала приходити до нього у образі однієї з дружин.
І так шість днів підряд. Чому шість, спитаєте ви? Виявляється, що сьома дружина була така
вірна, що жару на перетворення не вистачило. А сьомий день, був якраз той, коли Агні отримав
у лице повну порцію прийняв майбутню дитину Шиви і передав її у Гангу. І в цей день був грім і
блискавка, тому люди, які бачили як богиня приходила до Агні в подобах дружин почали
пліткувати, мовляв ці хвойди з Агні закрутили, а нам тут будуть проблеми… В цей же день
мудреці дізнались про це, та, розлючені, повиганяли своїх дружин (так, знаю, логіки тут немає,
але не завалювати ж квест через такі дрібниці). І шість дружин, ридаючи пішли топитись до
Ганги і знайшли в очереті дитя. Агні теж прискакав і допоміг їм вигодувати це дитя.
Вигодовування йшло прискореними темпами, бо ж семиденний дедлайн підганяв. Тому у
Сканди було шість годувальниць. Внаслідок цього в нього виросло шість голів і шість ротів та
шість рук. Чому шість голів а не дванадцять? Чому шість рук для шести голів?

Відповідь: Fuck you thats why.


Після закінчення дружини мудреців зійшли на небо і стали сузір'ям Пеляд, а мудреці (яким
стало соромно) теж зійшли на небо і стали Великою Медведицею. А дружина сьомого мудреця -
це подвійна зірка у ковші. Тому цей міф абсолютно правдивий, не вірити - подивіться вночі на
небо.

Власне, решта була вже справою техніки. Після короткої підготовки Сканда разом з військом
богів розбив військо Тараки та зніс йому голову палицею.

Тобто, для забезпечення своєї влади дуже важливо уміти правильно порушувати контракти, ця
лінія простежується не тільки в міфах Індії.

P.S. Контракт в одній російській казці


В чудовій книжці “Код Горыныча: что можно узнать о русском народе из сказок” Валерій
Панюшкін аналізує казки і що народ виражає через них. Одну з казок (про контракт) я без
перекладу наведу в кінці.

В соответствии с договором
Напоследок я припас любимый мой вариант поучительнейшей сказки о том, как соблюдаются в
России договоры.

В этом варианте сказки мужик и медведь — друзья. Так и написано черным по белому в
сборнике Афанасьева — друзья. Не то что случайно встретились, не то что мужик пахал, а
медведь вышел к нему из леса, а друзья. Живут по соседству, дружат. И вот друзья решают
посадить репу, и мужик спрашивает друга, как разделить урожай. «Давай тебе вершки, а мне
корешки?» — предлагает мужик другу. И медведь соглашается и соблюдает договор: жует
целый год ботву, глядя, как друг его мужик набивает брюхо корнеплодами.

А на следующий год они решают посеять пшеницу. Мужик спрашивает друга, хочет ли тот
вершки или корешки, и медведь, наученный горьким прошлогодним опытом, выбирает корешки.
Договор опять соблюден. Медведь забирает несчастные свои корешки и уходит домой. И сидел
бы дома тихо, если бы мужик не напек из пшеницы хлеба и не пошел бы к медведю хвастаться,
какой чудный у него получился хлеб. Тут уж медведь чувствует нестерпимую несправедливость
и грозится мужика съесть.

Тогда мужик нанимает лису. Мужик обещает лисе принести ей двух куриц в мешке, если лиса
спасет его от разъяренного медведя. Лиса является и громко, так, чтобы медведь слышал,
заявляет, будто она представительница охотников. Лиса спрашивает, нету ли здесь поблизости
волков или медведей, на которых открыта охота.

Медведь пугается. Как только лиса уходит, он обещает не есть мужика и просит только, чтобы
мужик спас его от охотников. Когда лиса является снова, медведь прячется за телегой. «Так
нету ли волков или медведей?» — понаведывается лиса. «Нету», — отвечает мужик в точном
соответствии с достигнутыми между ним и медведем договоренностями. «А за телегой что
лежит?» — продолжает лиса. «Да колода», — отвечает мужик, насколько медведь может
судить, совершенно в медвежьих интересах. «А почему же, — лиса говорит, — колода лежит за
телегой, а не на телеге? Почему же она не привязана? И почему же в нее не воткнут топор?»

Бедный медведь! Перепуганный несуществующими охотниками, он, как только лиса уходит, сам
забирается в телегу, сам просит, чтобы мужик привязал его, и сам просит, чтобы мужик воткнул
в него топор Мужик, действуя, насколько медведь может судить, в интересах медведя и по его
поручению, привязывает друга к телеге и втыкает в друга топор. И тем убивает. Коллизия
разрешена. Удовлетворены все, включая покойника.

Теперь пришло время расплатиться с лисой. За хитрую спецоперацию мужик, если помните,
обещал лисе принести двух кур в мешке. И мужик свято соблюдает договор. Берет двух кур и
сажает их в мешок. Но в договоре лисы и мужика нигде не было сказано, что кроме кур в мешке
ничего не должно быть. Поэтому мужик в полном соответствии с договором сажает в мешок
еще и собаку.

Лиса, радуясь тяжести мешка, относит мешок в чащу и открывает его. Из мешка выпархивают
сначала куры, а потом выскакивает собака. И разрывает лису в клочки.
Олексій Ігнатенко: Alpha Zero, шах і мат
рік тому
Наука
6 549
236
5
11

Го

У 2015 році компанія Deep Mind закінчила роботи над першою робочою нейромережею для гри
у го. До цього моменту для цієї гри не існувало ефективних алгоритмів, а найкращі комп’ютерні
програми відповідали рівню сильного аматора. Головна причина полягала в особливостях
правил гри та ключових відмінностях від шахів. Гра го - це той випадок, коли декілька простих
правил генерують дуже складну структуру.

Спробую змалювати процес гри “в цілому”, без усіх деталей.

Правила можна почитати у Вікі. У го гравці ходять по черзі і виставляють на перетини ліній сітки
19 x 19 чорні і білі камені.

Ключові елементи для розуміння складності створення програми для го:

1. Величезна кількість варіантів, починаючи з першого ходу - 361 можливий хід чорних (у го
першими ходять чорні), 360 можливих ходів білих - 129960 можливих позицій після
першого ходу. Для порівняння - у шахах 20 можливих перших ходів білих (та чорних) та
400 позицій. Одним з наслідків цього є відмінність в “дебюті” (в го приблизною аналогією є
джосекі та фусекі - послідовність розіграшу ходів у кутку дошки та загальний вибір таких
послідовностей, що враховує загальну ситуацію, відповідно), що в шахах розроблений в
деяких началах аж до переходу в ендшпіль і часто є шляхом в один бік (з кількома
розгалудженнями) - відхилення від канонічної послідовності карається миттєвим
програшем. У го існують певні принципи та ідеї плюс конкретні послідовності, що
вважаються оптимальними для сторін, однак в цілому відомі ходи швидко закінчуються, а
відхилення часто не мають миттєвого ефекту.
2. Го - це боротьба за територію. У кого в кінці гри її буде більше - той і переміг. Територію
можна отримати або створюючи вцілілі групи (вони називаються фортецями, тоді
територія - це пункти всередині), або вбиваючи (це з китайською політкоректністю
називається “взяти у полон”) камінчики суперника - кожен камінь рахується за один пункт
території. При цьому нічия неможлива, оскільки на поатку гри чорні дають білим “плату” за
перший хід (спочатку віддавали 4.5, нині 6.5 та, навіть, 7.5)*. Це створює декілька
стратегій гри: можна надійно будувати фортеці, можна охоплювати більшу територію у
надії її відстояти, можна вдиратися у територію супротивника і намагатися будувати там
фортецю, можна, нарешті, полювати за великими групами, які ще не гарантували собі
життя (вони називаються драконами). В будь-якому випадку, в кінці гри на дошці
залишаються вцілілі групи та відбувається підрахунок території. Особливість у тому, що
гравці оцінюють територію на кожному ходу з початку гри - і це ймовірністна оцінка (моя
територія, моя ймовірна територія, моя можлива територія). Ця оцінка змінюється з
кожним ходом і часто хід на одному боці дошки впливає на ситуацію на іншому. Одночасно
потрібно добре прораховувати конкретні варіанти. Однак професіонали виконують це
настільки добре, що в будь-який момент гри вони розуміють, хто виграє і скільки (+-
декілька очок похибки). Цікавий момент - партії, що завершуються з мінімальною
перевагою у 0.5 очка, часто, насправді, не означають рівності гри. Просто іноді профі
отримують велику перевагу, прораховують можливі ходи, а потім дозволяють супернику
наблизитися до мінімального програшу - така собі демонстрація у кого го крутіше. Звісно,
це вимагає ювелірної точності та техніки.
3. Взаємозв’язок усього, що відбувається на дошці. Особливість го ще й у тому, що завдяки
“сходам” хід на одному боці дошки може змінити усю ситуацію на іншому. Оскільки
зазвичай починають ходити у кути дошки (це найбільш цінні ходи з точки зору території),
потім по сторонах, то часто стається ситуація, коли кілька слабких груп намагаються
втекти у центр. Гравець при цьому має постійно оцінювати статус своїх груп (живі - мертві)
і вплив на цей статус майбутніх ходів. Тому, до речі, важкістю для програмування є факт,
що одна й та ж послідовність ходів має різну цінність у різний час. Наприклад, можна
залишити напівживу групу з невизначеним статусом і ходити у іншому місці дошки, якщо
хід може принести там більше очок. А за кілька ходів, коли цінність будь-якого іншого ходу
на дошці зменшиться - повернутися до цього питання.

Успіх комп’ютерів до появи AlphaGo були дуже помірними в основному внаслідок тотального
взаємозв’язку усього, що відбувається на дошці, та проблем з перебором варіантів. Найбільших
успіхів досягли Zen та Crazy Stone, що досягли рівня сильного аматора і навіть перемагали
професіоналів (з форою). Основним компонентом, що дозволив досягнути такого результату,
був пошук Монте-Карло по деревам (Monte Carlo tree search), однак все гальмувалося на
спробах пояснити програмі, як побачити усю дошку загалом.

AlphaGo

Алгоритм AlphaGo наведено в статті в Nature [1]. Щоб не забрідати в хащі, спробую пояснити
ідею простими словами. Три головних компоненти: дві згорткові нейромережі та пошук Монте-
Карло по деревах. Згорткові нейромережі дозволили вирішити проблему навчання, а їх
взаємодія полягає у тому, що одна відповідає за оцінку позиції, інша - за вибір можливих
(перспективних) ходів. Їх об’єднує дерево позицій (для кожної точки гри вибудовується 10
мільйонів позицій, для якого алгоритм використовує метод Монте-Карло для знаходження
хороших гілок - тих, що гарантують максимальну вірогідність виграшу.

Ключовим нововведенням було саме поєднання цих трьох елементів.

Матч з Лі Седолем

Лі Седоль є одним з топ-гравців (історичні графіки рейтингу) і вважається одним з найсильніших


гравців за всю історію, але його пік припав на 2010 рік. Однак, і він, і інші профі випромінювали
впевненість у перемозі, а загальний настрій був таким: якщо програма виграє одну партію - це
буде дуже круто.
Лі Седоль грає партію

Після першої програної партії Седоль ще посміхався та відважував компліменти - мовляв, яку
гарну програму зробили. Але після другого та третього програшу посмішки ставали все більше
удаваними. Бажаючі можуть знайти ютуб трансляції з докладними коментарями (на каналі
DeepMind). При цьому Седоль боровся на найвищому рівні (за людськими вимірами), однак,
здавалося, що слабкостей у програми просто немає. Вона чудово прораховувала варіанти,
оцінювала ситуацію на всій дошці, краще рахувала територію та, навіть, застосовувала новинки
у дебюті.

Кульмінація цієї драми в стилі старих майстрів настала на четвертій партії, коли долю матчу
вже було вирішено (усього було заплановано 5 партій).

Лі Седоль зрозумів, що вже можна спалювати всі мости та застосував виключно ризиковану
стратегію гри - він забрав територію по бокам дошки, дозволивши AlphaGo побудувати дві
стінки. Територія між стінками перетворилась, таким чином, у мішок. Якщо цей мішок
конвертується у вірну територію чорних, то гра стає безнадійною для білих. Загалом, приблизно
так ситуацію і оцінювали коментарі. Настрій був доволі пригніченим. В цей момент Седоль
зробив хід, що перевернув усю ситуацію на дошці. В го є термін тесудзі - кращого (єдиного) ходу
у складній ситуації. Седоль зміг знайти мега тесудзі - це, приблизно, як знайти голку у скирті
сіна (з 10 мільйонів варіантів), яку до нього вже перевірила програма.
Лі Седоль грає білими. Трикутником позначений “божествений хід”

Хід на малюнку відімчений трикутником - він “виламує” стіну чорних, рятує білу групу і відбирає
внутрішню територію чорного мішка. Найбільш дивовижне те, що він працює. Після цього ходу
AlphaGo поплила - почала робити необов’язкові ходи і через деякий час капітулювала. П’яту
партію Лі Седоль програв, але в історію він себе вже вписав - як, ймовірно, остання людина, що
змогла виграти у топ-програми з го (на той момент).

Якщо за цими подіями будуть знімати фільм, то це буде найліпший момент для фіналу -
переможений майстер, який в битві з цифровим демоном створив шедевр усього свого життя.
Він йде у захід сонця, завіса, всі плачуть. Далі все було просто і брутально. Розробники почали
шукати можливості покращення програми та позбавлення її вразливостей (адже вона програла
одну партію).

Цікаво, що основною проблемою виявилось попереднє навчання на партіях людей - в наступній


версії вони зменшили цей елемент. Результатом стала програма AlphaGo Master, яка спочатку
виграла у попередньої AlphaGo, потім зіграла (інкогніто) 60 бліц-ігор на найсильніших го-
серверах tygem і FoxGo з топовими профі (виграла всі). Нарешті на саміті «Майбутнє Го» на
початку 2017 AlphaGo Master виграла у поточного першого номера рейтингу Ке Цзе. Виграла
без шансів, хоча Ке Цзе в першій партії і програв з мінімальною перевагою у 0.5. Контрольним
пострілом у голову стала поява Alpha Zero - алгоритма, який взагалі не використовував партії
людей для навчання. Alpha Zero було надано правила та обчислювальні ресурси. За три дні
вона навчилась і обіграла усі попередні версії. Було оголошено, що більше матчів не буде і
релізити програму DeepMind не буде (хоча потім зробили сервіс для навчання).

І правильно - бо людство може зовсім впасти в депресію (як мінімум гравці го).

Stockfish

Тепер трохи про найкращу шахову програму. Простими словами, вона складається з функції
оцінки позиції на основі загальних принципів і конкретних факторів (наприклад, співвідношення
матеріалу, безпека короля, контроль за клітинками, здвоєні пішаки - це, як правило, погано,
тури - найкращі, коли контролюють вільні вертикалі, а слони погані, коли впираються у власних
пішаків і т.д.), дебютної бази, що напрацьована людством на сьогодні, таблиці закінчень, для
яких є відомий результат, та движка розрахунку комбінацій на базі оптимізованого Alpha-Beta
відсічення.

Відповідно, програма не помилялась у дебюті, рахувала комбінації краще за людину,


отримувала кращу позицію і перемагала. Максимальний рейтинг Магнуса Карлсена 2882,
рейтинг останньої (офіційної) версії Stockfish 8 64-bit 4CPU - 3495.

Надії білкових шахістів

Але була причина, яка тішила его шахістів, а саме - позиційне мислення. За деяких умов
програма оцінювала позицію гірше не дуже сильного гравця. Власне ось одна задачка 1912
року (хід білих)

Якщо завести цю позицію у шаховий движок, то він покаже вирішальну перевагу чорних. Просто
без шансів. Тим не менш, білі елементарно роблять нічию і це очевидно кожному, хто хоч трохи
грає. Пояснимо для інших, тим більше, що це демонструє хід думок гравця:

1. Своїх пішаків брати не можна, тому якщо поставити білих пішаків на білі поля - це
заблокує позицію (оскільки у чорних немає білопольного слона і коней). В результаті
фігури чорних не зможуть ні перетнути ні зруйнувати ці "велику стіну" пішаків. Це наша
мета, тепер будемо думати, як ми можемо її досягти.
2. Звідси випливає конкретна ідея - потрібно ставити пішаків з шахом, інакше чорні сунуть
своїх пішаків і створять пролом для прориву своїх фігур. Завдяки білому слону у тилу
чорних чорний король обмежений у рухах, але комбінація з с4+ не проходить - після її
закінчення залишається два пішака, які потрібно переставити на білі поля і тільки один хід.
3. Отже тактичне рішення - жертва слона на полі a4, щоб заманити туди ворожого короля.

Після очевидної послідовності ходів Ba4+ K:a4 b3+ Kb5 c4+ Kc6 d5+ Kd7 e6+ K:d8 f5 отримуємо
позицію, де тури, слон і король чорних можуть займатись чим завгодно у будь-якій
послідовності - ситуація не зміниться.
Смішно, що навіть у цій позиції комп’ютер вважає, що у чорних перевага, і лише через 50 ходів
знехотя визнає нічию (діє правило 50 ходів без взяття фігур і ходів пішаків - нічия). На жаль, на
практиці використати цю особливість було неможливо, але певний черв’ячок сумнівів був - а все
ж таки люди оцінюють такі позиції моментально.

Alpha Zero vs Stockfish

Застосування ідеї Alpha Zero до шахів і шогі описано в статті [2]. Цей матч коментували багато
гросмейстерів (можете знайти на ютубі). Варто відмітити фактори, що робили протистояння
нерівним (є різні думки того, як їх оцінювати):

1. Програми використовували різні обчислювальні ресурси.


2. Stockfish заборонили користуватись дебютними базами та таблицями закінчень.
3. Stockfish обмежили в оперативній пам’яті.
4. Налаштування часу були дуже незвичні - час на 1 хід було обмежено 1 хвилиною.

Tore Romstad з команди Stockfish сказав, що результати не є показовими, оскільки Stockfish


фактично зв’язали та позбавили її сильних сторін (зокрема дебютних баз, Stockfish також має
складну систему балансування часу на хід для стандартних налаштувань часу). Те, що Alpha
Zero навчалась 4 години - насправді нічого не означає, оскільки навчалась вона на декількох
тисячах TPU - спеціалізованих процесорах. Тому за таких умов матч Stockfish vs AlphaZero це
порівняння яблук з орангутанами (стандартна програма, яка працює на звичайному харді і
спеціалізована нейромережа на кастомних процесорах).

Результатом матчу стала ніщивна поразка Stockfish - вона не виграла жодної гри і програла у 28
партіях (72 нічиї). Не зважаючи на те, що у деяких позиціях Stockfish рахувала варіанти краще,
Alpha Zero просто переграла суперника, майстерно використовуючи позиційні ідеї (це, мабуть,
найбільша несподіванка матчу). Шахові коментатори відмічають, що вони вперше побачили у
програми настільки глибокі і людські ходи. Фактично Alpha Zero за 4 години самонавчання
перевідкрила стратегічні принципи шахів, вивчила тактичні прийоми та перевідкрила дебюти
(причому в одній з партій пішла на принциповий найбільш гострий варіант, який з’явився у
турнірній практиці зовсім нещодавно).

Висновки

Як сказав один коментатор: “я завжди мріяв щоб якісь розвинені інопланетяни прилетіли на
Землю і показали як ще можна грати в шахи. Сьогодні я це побачив.”

Основний результат власне такий: спочатку ми створили програму, яка грає як програма і грає
краще за людину і ми розуміємо алгоритм її роботи. Тепер ми створили нейромережу і ми не
розуміємо як вона грає, але це набагато ближче до того, як грає людина, краще, ніж грає
людина, і перша програма (із зважанням на нерівність умов гри).

Другий результат - мережа взагалі не використовувала всі попередні надбання людства


(дебюти, стратегію, підручники закінчень - а книжок з шахів порядку 200000 назв - sad but true) і
навчалась, граючи сама з собою. Вішванатан Ананд сказав з цього приводу: “Ми 600 років
грали в шахи, а вона навчилась за 4 години. Гарний жарт.”

Враховуючи, що кількість і якість даних - це ключова проблема для навчання нейромереж, жарт
і дійсно гарний. Трохи обідно за людство.

Третє - Alpha Zero рахувала набагато менше варіантів ніж Stockfish, швидко відмовляючись від
поганих гілок. Це свідчить про те, що програму, яку довго писали багато програмерів, можна
замінити на нейромережу, яка швидко навчиться і буде робити ту ж роботу навіть швидше (тут
ще багато проблем, але приклади успіхів вже є).

З відносно хороших новин: поки що область застосування цього алгоритму обмежено іграми з
детерміністичними правилами (швидше за все ненадовго).
І це ще один крок до створення алгоритмів для загальних когнітивних здатностей - уміння
вчитись без вчителя, розуміння і, можливо, свідомості (насправді кінцевий результат ніхто не
може передбачити).

Джерела

1 Mastering the game of Go with deep neural networks and tree search

2 Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm

P.S. За наводкою Антона Сененко (завдяки якому була написана і ця стаття) додаю ще чудові
статті Dmytro Mishkin тут https://goo.gl/5BNqGc і тут https://goo.gl/3QBzoZ де можна більше
дізнатись про алгоритм роботи нейромереж і нерівність матчу з Stockfish.

* насправді нічия можлива в тому розумінні, що при трикратному повторенні позиції гра
вважається такою, що не відбулась. Але в го, на відміну від шахів, це трапляється надзвичайно
рідко.
Олексій Ігнатенко: Математика, політика та
американська конституція
10 місяців тому
Наука
3 715
118
1
3

“Від початку світу не існувало іншого способу знайдення співмірності двох чисел як
використання найбільшого спільного дільника, перетворення “лишків” у числа шляхом
округлення угору значень більших за 0.5 і округлення вниз значень менших за 0.5; і не може
бути ніякого іншого методу. Цей процес є чисто арифметичним… Якщо сотню чоловіків
розпанахають від кінцівки до кінцівки або тисячу немовлят розчавлять, цей процес буде мати
не більше почуттів з цього приводу ніж айсберг; оскільки наука математика має стільки ж жалю
як залізна собака.”

Джон А. Андерсон, 1882 рік.

“Боже, врятуй штат Мен, бо його намагаються знищити ці математики!”

Чарлз Е. Літлфілд, 1901 рік, засідання комітету Конгресу після здійснення нового перерахунку
кількості представників від штатів.

Проблема призначення
Конституція Сполучених Штатів Америки в статті першій наголошує, що члени палати
представників повинні призначатись від різних штатів відповідно до їх населення.

Також є обмеження, що кожен має представляти не менше ніж 30 тисяч населення, але при
цьому кожен штат має отримати принаймі одне місце.

Кожні 10 років має відбуватись ценз, який повинен враховувати зміни у населенні або кількості
штатів.

Так виникла проблема призначення кількості місць, тобто пошуку методу, який найкраще
задовольняє вимогам конституції. Кількість місць у палаті представників (Конгресі) починалась
з 59 у 1789 році, потім поступово зростала відповідно до включення нових штатів (наприклад
кількість дорівнювала 105 у 1793 році) і на сьогодні дорівнює 435 депутатам.

Ділити цю кількість потрібно відповідно до населення, тобто штат у якому проживає 10 відсотків
населення Сполучених Штатів має отримати 10 відсотків від 435. Однак 435 * 0.1 = 43.5, а
призначити половину депутата трохи проблематично. Число 43.5 тут є ідеальною квотою, яку
неможливо виконати. Очевидно, що просто округлити квоти штатів неможливо, потрібна якась
узгоджена система, яка б гарантовано давала 435 місць і при цьому виконувала вимогу
конституції. Починаючи з 1792 року таких пропозицій було досить багато (п’ять
обговорювалось, чотири застосовувались) і з кожною виникали певні проблеми. Нарешті
прийшли математики і довели теорему про неможливість такої системи в принципі (спойлер:
але все таки можна запропонувати достатньо “хорошу” систему).

Перша спроба
Перший метод запропонував Александр Гамільтон (як повідомляє вікіпедія - один з батьків-
засновників, видатний діяч і мислитель, перший міністр фінансів)

Метод запропонований Гамільтоном був дуже простим:

1. Округлити всі квоти до найменшого цілого. В результаті залишається певна кількість не


занятих місць.
2. Далі починаємо роздавати ці місця штатам відповідно до розміру дробової частини їх
квоти - спочатку тому, хто має найбільшу і т.д.

Наприклад, для уявної країни розподіляємо 100 місць (приклад зі статті [1]).

Метод Гамільтона.

Додані
Штат Населення Ідеальна квота Квота Лишки Усього
місця

А 1 908 578 40.7051980664 40 0.7051980664 1 41

B 1 366 072 29.1349011321 29 0.1349011321 0 29

C 651 832 13.9019472434 13 0.9019472434 1 14

D 250 657 5.3458872688 5 0.3458872688 0 5

E 163 904 3.4956626262 3 0.4956626262 0 3

F 157 147 3.351552706 3 0.351552706 0 3


G 120 419 2.5682362712 2 0.5682362712 1 3

H 70 173 1.4966146859 1 0.4966146859 1 2

100 96 4 100

Начебто все в порядку, але виявляється, що метод Гамільтона спричиняє численні проблеми і
парадокси.

Припустимо, що зростає кількість місць у Конгресі. Що ми очікуємо від системи призначення?


Ну, очевидно, що місця, які виділяються кожному штату можуть зростати, або не змінюватись.
Але випишемо місця для штату H залежно від кількості:

Розмір палати 100 105 107 108 111 113 115

Місця для H 2 1 2 1 2 1 2

Саме це сталось зі штатом Мен після цензу 1900 року і спричинило обурений вигук з епіграфу.
Цей парадокс (його ще називають парадоксом Алабами або парадоксом представників)
характерний для методу Гамільтона і є одною з головних причин його заміни, але не єдиною.

Інша проблема - парадокс населення, ситуація, коли штати, у яких населення зростає швидко
- втрачають місця, а штати, які зростають повільніше - отримують.

Нарешті останній парадокс, який виникає для методу Гамільтона це парадокс нових членів.
Припустимо, що новий штат J з населенням 604,642 приєднується, за правилами конституції
для нього виділяється кількість місць, яка відповідає його населенню. До його приєднання
кожне місце з 100 відповідає 46887.82 населення. Тому штат J має отримати 604,642 / 46887.82
= 12.89, тобто 13 місць. Отже Конгресу додається 13 місць і після цього запускаємо метод
Гамільтона.

До приєднання Після приєднання

Штат Населення Місця Населення Місця

E 163 904 3 163 904 4

H 70 173 2 70 173 1

J 604 642 - 604 642 13

Виходить, що приєднання нового штату зменшило кількість представників штату H, а в чому він
тут винуватий?

Чекайте, так, а є хоч якась хороша властивість методу Гамільтона? Ну окрім простоти для нього
завжди виконується властивість квоти. Якщо у штату ідеальна квота. наприклад, 3.67, то
логічно, що він має отримати або 3 або 4 місця. Ця властивість і називається властивістю
квоти.

Метод Гамільтона був оформлений у закон і був проголосований, але потім заветований
Президентом в 1792 році (не ким-небудь, а самим Джорджем Вашингтоном) і став першим
законом в історії США, до якого було застосовано право вето. Формальна причина полягала у
тому що для деяких штатів він давав більшу кількість представників, що порушувало умову:
одне місце не менш як 30 тис населення. Однак у 1850 він був повернутий до життя, та
використовувався наступні 40 років.

Наведені парадокси є відображенням порушення властивостей, які б ми хотіли для хорошої


системи призначення. Ось ці властивості (вони здаються очевидними):

1. Монотонність за представниками. Якщо населення кожного штату не змінюється і кількість


представників зростає, жоден штат не повинен втратити місце.
2. Монотонність за населенням. Неможлива ситуація, коли у штаті збільшується населення і
при цьому зменшується кількість представників, в той же час інший штат втрачає
населення та збільшує кількість представників.
3. Властивість квоти: штат має отримати кількість представників, яка відрізняється від його
ідеальної квоти не більше як на 1.

Дівізорні методи
Відразу після появи методу Гамільтона його головний політичний суперник Томас Джефферсон
запропонував контрпропозицію - метод Джефферсона.

Метод Джефферсона починається з вибору певного цілого числа, яке називається дівізором
(дільником) і означає бажаний розмір населення кожного “Конгрессного району”. Тепер
призначимо кожному штату одне місце у Конгресі за кожен район, тобто розділимо населення
штату на розмір району і округлимо вниз до цілого числа. Якщо сумарна кількість місць за
усіма штатами вийшла рівна потрібній кількості місць у Конгресі - вуаля! Якщо вийшло менше
число, то треба збільшити розмір району і повторити, якщо вийшло більше, то треба зменшити
розмір району і повторити. Загалом відомий метод “іноді виходять кораблики”.

Але з практичної точки зору не все так погано, крім того, для всієї групи дівізорних методів
виконуються властивості монотонності за населенням і представниками, але не завжди
виконується властивість квоти.

Метод Джефферсона переміг у 1792 році і використовувався наступні 50 років. Однак


виявилось, що його недолік полягає у систематичному зміщенні в сторону великих штатів.
Дійсно, округлення вниз для великого штату з 49.9 до 49 позбавляє його 2% ідеальної квоти, в
той же час округлення з 4.9 до 4 позбавляє маленький штат вже біля 20% того, що йому
призначено конституцією! (Сам Джефферсон представляв великий штат Вірджинія. Цікаво, що
метод Гамільтона навпаки - дискримінував Вірджинію, але давав більше місць його рідному
невеликому Нью Йорку).

Приклад. Ділимо 10 місць для 3 штатів

Штат Населення Ідеальна квота Гамільтон Джефферсон

1 1 500 000 1.5 2 1

2 3 200 000 3.2 3 3

3 5 300 000 5.3 5 6

Як ви розумієте коли в Конгресі біля 50 депутатів, голос кожного може мати велику вагу, тому у
1830 році представник маленького Масачусетса Джон Квінсі Адамс

запропонував зміну - давайте округлювати не вниз а вгору! Метод Адамса дискутувався, але не
був прийнятий як закон з тієї самої причини - він систематично давав більше місць маленьким
штатам.

Врешті решт конгресмен Даніель Вебстер запропонував безжальну “золоту середину” : давайте
округлювати у відповідності з правилами математики, до найближчого цілого.
Перша цитата з епіграфа стосувалась саме цього методу. Метод Вебстера був принятий у 1840
році але вже у 1850 замінено на метод Гамільтона. Пізніше цей метод знов застосовувався у
1910 та 1930 році (ценз 1920 року визнаний таким, що не відбувся). Здавалось, що ще можна
придумати, але у 1929 Едвард Хантингтон, професор математики з Гарварду запропонував
ідею округлення відповідно до геометричного середнього.

Справка: геометричне середнє чисел А і Б дорівнює кореню квадратному з їх добутку.


Наприклад для чисел 2 і 3 геометричне середнє дорівнює приблизно 2.45, а для 1 і 10
приблизно 3.16.

Причини появи цього методу досить курйозні. У 1911 році Йозеф Хілл, головний статистик
бюро, яке завідувало цензом запропонував принцип, якому, на його думку, має задовольняти
хороший метод призначення. Його головна ідея була - максимально зменшити відносну
відмінність кількості людей, яка відповідає одному місцю для різних штатів. Наприклад, в
одному штаті місце призначається на 1.50 мільйони населення, а в іншому на 2 мільйони.
Абсолютна різниця 500 тис., але відносна - 0.5 / 1.5 = 33.33%. Принцип Хілла полягає у
зменшенні цієї різниці при розподілі місць. Хантингтон показав, що метод геометричного
середнього, на відміну від інших, відповідає принципу Хілла.

Свій внесок також додала Американська Академія Наук. В 1929 році чотири математики
світового рівня [2] написали звіт, який рекомендував метод Хантингтона-Хілла. На основі цієї
доповіді у 1941 році Конгрес приймає метод на постійній основі, але у 1948 році замовляє
додаткове дослідження у таких зубрів математики як Марстон Морс, Джон фон Нейман і Лютер
Ейзенхарт. Вони підтвердили доповідь 1929 року, хоча останнім часом стали з’являтись думки
(детально описані у статті [1]), що великі математики, у яких було дуже мало часу, трохи
схалтурили і просто повторили попереднє дослідження, тим більше, що Лютер Ейзенхарт був
одним з авторів попереднього звіту.

Порівняння методів
Розглянемо на прикладі різні методи і де вони відрізняються.

Ідеальна квота
Населення Джефферсон Адамс Вебстер Хантингтон - Хілл Гамільтон

1 908 578 40.705 42 39 41 40 41

1 366 072 29.135 30 28 29 29 29

651 832 13.902 14 14 14 14 14

250 657 5.346 5 6 5 5 5

163 904 3.496 3 4 4 4 3

157 147 3.352 3 4 3 3 3

120 419 2.568 2 3 3 3 3

70 173 1.497 1 2 1 2 2

Сума: 100 100 100 100 100 100

дівізор: 44 600 49 000 46 800 47 300

Пізніше виявилось, що і метод Хантингтона-Хілла не позбавлений парадоксів.

Парадокс міграції

до міграції після міграції 351 000 з С в G

Штат Населення Хантингтон - Хілл Штат Населення Хантингтон - Хілл


A 1 908 578 40 A 1 908 578 41

C 651 832 14 C 300 832 6

G 120 419 3 G 471 419 10

351 000 мігрувала з одного штату в інший, але в результаті штат А отримав додаткове місце в
Конгресі?!

Зауважимо, що це не дефект саме цього методу, таке може трапитись і в інших методах також.

Нарешті фіналом суперечок про найкращий метод призначення став результат, отриманий
Янгом і Балінскі [3].

Теорема про неможливість і її наслідки


Загадаємо три властивості, які ми вважали бажаними для методу призначення. Виявляється,
що не існує методу, який би забезпечував всі три властивості. Навіть більше, не існує
методу, який би давав властивість квоти та монотонність за населенням. Тобто, потрібно
змиритись з думкою, що будь-який метод буде вразливий до деяких парадоксів і, можливо,
порушувати квоту.

Питання, яке природно виникає: який метод найкращий? Аргументи були отримані за
допомогою комп’ютерного моделювання, яке показало, що метод Вебстера краще за метод
Хантингтона-Хілла принаймі у таких аспектах:

1. Ймовірність порушення квоти для методу Вебстера 1 на 1640 призначень, тоді як у метода
Хантингтона-Хілла 1 на 350.
2. Метода Хантингтона-Хілла зміщений на 3.5% на користь малих штатів, в той же час метод
Вебстера є єдиним незміщеним методом з усіх.
3. У середньому метод Вебстера дає менше відхилення від ідеальної квоти ніж метод
Хантингтона-Хілла.
4. Метод Вебстера більш простий і логічний.

Отже, метод Вебстера є найкращим з наявних, але навряд чи Конгрес буде змінювати правила
заради красоти математики і відхилення у 3.5%.

Джерела

1. Park, Efton (2000) "The Mathematics of Apportionment," The University of Chicago Law School
Roundtable: Vol. 7: Iss. 1, Article 9. Available at:
http://chicagounbound.uchicago.edu/roundtable/vol7...
2. G.A. Bliss, E.W. Brown, L.P. Eisenhart, R. Pearl, Report to the President of the
NationalAcademy of Sciences 21-3 (1929).
3. M.L. Balinski and H. Peyton Young, The Apportionment of Representation, 33 Proceedings of
Symposia in Applied Mathematics 1, 25 (1985).
Олексій Ігнатенко: Теорія ігор: моделі
переговорів, ігри “ультиматум” і “диктатор”
Теорія ігор: моделі переговорів, ігри
“ультиматум” і “диктатор”
рік тому
Наука
5 684
132
5

Моделі переговорів
Процес переговорів також є предметом дослідження теорії ігор. Як і в кожній моделі теорії ігор,
у ньому є гравці (сторони переговорів), стратегії (їх пропозиції) і виграші (результат
переговорів).

Як правило, в процесі переговорів учасники мають дійти згоди, як поділити певну додаткову
вартість. Якщо переговори невдалі, то їх виграші менші (або взагалі нульові).

Простим прикладом переговорів є продаж товару. Уявимо собі Єгипет, “музей” каміння, товар
без цінників і продавець намагається продати вам вазу. Продавець знає, що ціна вази 20$ - це
нижня границя можливого (озвучена ціна звичайно буде вп’ятеро більша). Ви, припустимо,
захотіли купити товар, але точно не готові платити більше 60$ (тобто при купівлі за меншу ціну
різниця буде Вашим виграшем). Таким чином під час переговорів потрібно досягти згоди як
розділити 40$ можливого прибутку від ухвалення угоди. Ці 40$ - додаткова вартість, яка
виникає від кооперації; якщо угода не ухвалюється, кожен з гравців отримує 0. Подібна
властивість характерна для будь-яких переговорів. Інша властивість полягає у тому, що це не
гра з нульовою сумою. Якщо додаткова вартість з’являється, гравці намагаються її поділити, і
всі їх стратегії спрямовані на отримання більшої частки. Це може здаватися схожим на
некооперативні ігри, але всі сторони знають, що якщо угода не буде ухвалена, то ніхто нічого не
отримає. Ця взаємно шкідлива альтернатива, якої вони намагаються уникнути і це породжує
можливість застосування погроз, обіцянок та зобов’язань, що робить переговори цікавою грою,
складною для дослідження.

Розглянемо ще один приклад. У силиконовій долині зустрілося два підприємці: Енді і Білл. Енді
виробляє чіп, який він продає за 900$, Білл розробив програмний пакет, який він може
продавати за 100$. Після зустрічі вони розуміють, що після невеликої доробки вони можуть
створити єдиний модуль, який буде коштувати 3000$. Тобто разом вони створюють додаткові
2000$, і вони очікують продавати велику кількість модулів кожен рік. Єдина перешкода для
початку запуску виробництва - це як ділити отримані з продажу кожного модуля 3000$. Якщо
подумати, то це непроста задача.

Наприклад, Білл може почати з того, що без його програми чіп - це звичайна мікросхема без
особливих властивостей і тому він має отримати 2100$, а Енді - свої 900$. У відповідь Енді
скаже, що без його чіпа програма Білла - це просто алгоритми, які не надто ефективні на
звичайному харді, тому він має отримати 2900$, а Білл свої 100$. Сторонній спостерігач може
резонно запропонувати поділити додатковий виграш пропорційно, але і тут все непросто.
Білл запропонує ділити навпіл (оскільки один без одного не можуть створити продукт), тобто
1100$ собі і 1900$ - Енді. Енді запропонує ділити прибуток пропорційно початковому вкладу у
вартість продукту (1/10 та 9/10), тобто 2700$ йому і 300$ - Біллу. Очевидних причин взяти за
основу той чи інший варіант немає, тому так може продовжуватись досить довго. Кінцеве
рішення буде залежати від впертості, терпіння і винахідливості сторін.

Перед тим як розв’язувати цей приклад, розглянемо найпростішу постановку задачі переговорів
та парадокси, які з нею пов’язані.

Гра “ультиматум”
У цій грі є тільки один раунд переговорів і двоє гравців. Перший гравець пропонує, як розділити
певну суму між учасниками, після цього другий гравець затверджує або відхиляє цей розподіл.
Якщо другий гравець не затверджує розподіл, то ніхто нічого не отримує.

Правила цієї гри (безуспішно) намагався пояснити герой Марка Волберга в фільмі “Гравець”,
коли намагався продати годинник.

У цій сцені він насправді зробив усе, щоб НЕ продати годинник: демонстрував невпевненість,
нетерплячість, дав зрозуміти, що йому дуже треба гроші. Запропонував гру “ультиматум”, у якій
верхня ціна 6000$, а нижня 0 (очевидно, що для Гравця, якого мали вбити через декілька днів,
годинник не мав ніякої вартості) та запропонував розподіл (3500 і 2500), тобто приблизно 60%
собі і 40% покупцю. Цікаво, що ця пропозиція узгоджена з експериментами: люди досить часто
погоджуються і на 40% (відсоток відмов відрізняється в залежності від умов гри), але в фільмі
діяли інші фактори - очевидно, що покупець хотів багатораундову процедуру, у якій можна було
б у повній мірі використати свої переговорні переваги (тобто простими словами - не можна ж
просто так взяти і купити годинник... а поторгуватись?). Крім того, експерименти показали, що
результат гри залежить від культурних особливостей.

У базовій теорії ігор існує два основних підходи до аналізу таких ситуацій: зворотня індукція та
рівновага Неша. Але є одна проблема - в переговорах вони не працюють.

Справа в тому, що (якщо переформулювати переговорну гру у термінах некооперативних ігор)


кожний розподіл буде рівновагою Неша.

Застосування принципу зворотної індукції приводить до одного (але дуже несподіваного)


рішення. Для попередньої гри воно таке - запропонувати годинник за 5999$ і, оскільки один
долар краще за 0, покупець має погодитись. Але це суперечить досвіду і здоровому глузду теж.
Ця суперечність між теоретичною конструкцією і практикою спричинила численні
експерименти. Найбільш повний опис результатів експериментів приведений в [1].

на рисунку зображений розподіл пропозицій у грі ультиматум, червоною лінією - відсоток відмов
для даного інтервалу пропозицій.

Ці результати можна інтерпретувати, наприклад, так. Або гравці нездатні порахувати на крок
вперед, або їх функції виграшу містять невідомі параметри. Останній варіант досить
реалістичний, оскільки крім суми виграшу є інші елементи гри. Виділяють три значимих
фактори.

По-перше, сильно нерівна пропозиція може спричинити відмову, тоді виграш буде
нульовий. Тому гравець має приймати у свої розрахунки ризик відмови.
По-друге, якщо гра відбувається у загальній кімнаті з випадковим паруванням, неможливо
гарантувати анонімність. Якщо я запропоную поганий розподіл, я можу зашкодити своїй
репутації і тоді мені також будуть пропонувати невеликі суми. Це твердження вірне і для
ситуації, коли гравці знають один одного.
Нарешті, існує також певне внутрішнє відчуття справедливості, що виникло в результаті
розвитку особистості або є нормою спільноти, до якої гравець належить. Нижче ми
розглянемо варіації, які досліджують вплив цих факторів.

Більша сума - вище ризик


При збільшенні суми поведінка гравців змінюється: з одного боку частіше пропонують середній
розподіл (50:50), оскільки не хочуть ризикувати значною сумою. З іншого боку, навіть 20%- 30%
- це в абсолютних значеннях досить суттєва величина, тому більший відсоток людей
погоджується на неї.

Вплив культури
Одне з перших серйозних досліджень (1991 року) було проведене в Америці, Словенії, Японії
та Ізраїлі. Результати Америки і Словенії були досить близькими - учасники пропонували
близькі до половини розподіли; пропозиції, які були менше 20%, були відхилені. У Японії
пропонували менші (на 10%) суми, в Ізраїлі - ще менші. Важливо, що відсоток відмов скрізь був
приблизно однаковим, тобто зменшення суми пропозиції в останніх двох країнах не було
спричинено жадібністю чи агресією, а просто відображало прийняту у суспільстві норму для
такого роду угод.

Однак усі ці країни все таки досить схожі, тому дослідники пішли далі.
У 2000 році дослідили плем’я мачугенга у Перу. І тут результати сильно відрізнялись: середня
пропозиція була 26%! І всі пропозиції (крім однієї) були прийняті. Таким чином, були знайдені
люди, які вели себе найбільш узгоджено з результатами теорії ігор, і це виявилося примітивне
фермерське плем’я. З огляду на те, що теорія ігор створювалася як спроба пояснити світову
економіку і поведінку людей - дуже смішний результат. Після цього експериментатори почали
вишукувати віддалені народності і знущатися з них, змушуючи грати в ультиматум (цікаво, що
собі думали ці мешканці, коли до них приходили дивні бородані в окулярах та пропонували
поділити гроші).

Експерименти були проведені в селі китобоїв Ламалера, в Монголії, серед народів Папуа Нової
Гвінеї, в Африці і Південній Америці.

В основному, пропозиції розподілу були менше, ніж у країнах першого експерименту, відсоток
відмов теж.

Виділялися дві культури: мисливці за головами Аче з Парагваю та китобої з Ламалери. По-
перше, вони в середньому пропонували більше половини! А Ламалера ще і відхиляли ці щедрі
пропозиції у 20% випадків (частіше, ніж маленькі пропозиції)! Зовсім несподіваний результат -
навіщо пропонувати більше половини?

Одне з можливих пояснень наступне: в їх культурі полювання є ключовою частиною життя і


пропонування іншому більшої частини “здобичі” накладає на нього зобов’язання перед тим, хто
пропонує. Пропонування більшої частини, таким чином, є образою і певним способом показати,
хто краще.

Ще одне цікаве дослідження міряло кросс-культурну взаємодію в Ізраїлі. Були відібрані 2 групи
студентів: перша, що відноситься до ашкеназі,і друга, яку назвали східним типом. Потім
учасників розділили на пари і вони грали в ультиматум (при цьому вони знали, з ким грають).
Виявилося, що перша група отримувала у середньому менші суми, ніж пропонувала сама. При
цьому рівень відмов був приблизно однаковий, тобто якогось негативного відношення не було
знайдено. Одне з можливих пояснень полягає у існуючому стереотипі, що східний тип більш
імпульсивний і тому пропонувати невеликі суми небезпечно з огляду на можливу відмову [2].

Гендер і все таке


Звичайно, були поставлені експерименти для виявлення впливу жіночої вроди (гендерні
відмінності ніяк не проявились на експериментах). Однак, результати були дещо
несподіваними. Так чоловіки майже ніяк не змінювали розмір пропозицій вродливим жінкам,
але навпаки було виявлено значиму залежність: жінки пропонували красивим чоловікам на 5%
більше.

Гра “диктатор”
Страх відмови можна зняти, якщо модифікувати правила. В цьому варіанті гри “ультиматум”
другий гравець позбавляється права вето - він може тільки дивитись. Зрозуміло, що в такому
випадку розподіл стає суттєво нерівним, але все одно більшість гравців розподіляє гроші у
пропорції 70 : 30. Це явно сигналізує про існування внутрішнього почуття справедливості. Але
це відчуття має свої межі.

В іншому експерименті роль того, хто ділить гроші розподілялись не випадково (як зазвичай), а
за результатами виконання певного тесту. Це давало відчуття “заслуженості” ролі і пропорції
ставали більш нерівними.

Ще один варіант гри називається анонімний диктатор. У цьому випадку другий гравець не може
бачити того, хто ділить гроші, йому просто повідомляють про результат (дуже схоже на
визначення бюджету академії наук). Тут пропорції ставали зовсім нерівними, але навіть у цьому
випадку 5% гравців ділили гроші 50:50. Тобто почуття справедливості все ж проявляло себе.
Як покращити свій виграш в цій грі, якщо Ви у неї потрапили у ролі другого гравця? Ну по-
перше, спробувати розкрити анонімність того, хто ухвалює рішення - це трохи підвищить
шанси.

Справедливість і помірність
Авінаш Діксіт запропонував незвичний експеримент, який надає перевагу моральним якостям.
У ході експерименту 20 студентів були зібрані разом у комп’ютерному класі. Програма
парувала їх випадковим чином і вони повинні були розділити 100 балів. Ролі не були визначені -
кожен пропонував свій розподіл, а інший міг погодитись або пропонувати свій. Кожен міг
змінювати свою пропозицію будь-коли і скільки завгодно разів, але через випадковий час 3-5
хвилин гра закінчувалася. Якщо на цей момент згоди не було досягнуто - обоє отримували 0.
Було 10 раундів з випадковими опонентами. Найвищий результат, якого було досягнуто,
дорівнював 515. Велику кількість балів набирали ті, хто швидко пропонував 50:50 і швидко
погоджувався на ділення з невеликим розривом.

Ті, хто намагався отримати значно більше і відмовлявся затверджувати більше ніж 10 балів
різниці, затягували процес і програвали по часу.

Таким чином, справедливість і помірність, принаймі у цій грі, були винагороджені.

Гра “ультиматум” є найпростішим видом переговорів, але разом з тим вона повна складностей і
неочікуваних зв’язків. Приклад, який ми описали на початку і більш складні моделі
розв’язуються кооперативним рішенням Неша, але йому буде присвячено окрему публікацію.

далі буде...
Олексій Ігнатенко: Монополізація у Країні
Див. Чому це так погано?
рік тому
Суспільство
3 125
11
2
3

Мова піде про монополізацію на прикладі процесу виробництва капелюхів. Відомо, що


капелюшники у Країні Див виготовляють капелюхи з картону*. Оскільки капелюшники
божевільні, то вони працюють безкоштовно, тому функція продуктивності залежить лише від
кількості картонок. Якщо капелюшник поспішає, то він починає нервувати і псувати заготовки,
тому витрачає більше матеріалу. Припустимо, цей факт відображений наступною залежністю:

Це означає, що r картонок перетворюються на

капелюхів. Для створення одного капелюха потрібна одна картонка, але для створення двох -
вже чотири. Кожна картонка коштує 1 долар.Тож мінімальна собівартість одного капелюха
дорівнює 1$.

Монополія
Королева тримає монополію на ринку і може вирішувати, скільки виробляти капелюхів. Її
прибуток

визначається ціною p та кількістю капелюхів a, які вона вирішила виробити, за наступною


формулою

Тут від загальної виручки відняли витрати на виробництво.

Для того, щоб максимізувати прибуток, потрібно знати ціну, за яку ми можемо продати наш
товар. У Країні Див є великий попит на капелюхи, який описується залежністю

Оскільки Королева - монополіст, вона може визначати ціну через вибір кількості вироблених
капелюхів. Якщо вона вибирає зробити a капелюхів, то ціна на кожен буде

Підставляючи цей вираз у рівняння прибутку, отримуємо формулу, яка демонструє, як саме
монополісти роблять гроші:
Монополісти максимізують прибуток шляхом обмеження пропозиції - найбільше значення
досягається для одного капелюха! Тобто Королева виробляє один капелюх, витрачає 1 долар,
продає його за 30$ (ще й черга стоїть - бо інших варіантів немає) і отримує прибуток 29$.

У даному прикладі монополіст диктує ціну, оскільки Королева повністю контролює ринок. На
повністю конкурентному ринку продавці стають тими, кому диктують ціну, оскільки вони майже
ніяк не можуть впливати на ціни. Це досягається, як правило, тоді, коли продавців стає дуже
багато і вони не можуть домовлятися. Відповідно і вплив кожного гравця на ціну ринку
практично нульовий. Реальні ринки знаходяться десь між цими двома полюсами. Продавці
впливають тією чи іншою мірою на ринок, але цей вплив обмежений інтересами інших гравців.

Дуополія
Припустимо, що на ринок заходить інший виробник, який починає конкурувати з Королевою.
Розглянемо спрощену ситуацію, коли вони можуть виробляти 1, 2 або 3 капелюхи. Результати з
розподілу прибутків відповідно до вибраної кількості капелюхів у наступній таблиці

Рівновагою Неша є пара стратегій (2, 2). Дійсно, для будь-якої іншої пари стратегій принаймні
один гравець може покращити свій виграш, вибравши іншу кількість вироблених капелюхів.
У результаті ціна на капелюх падає до 7.5$. Тобто королевам хотілося б виробляти по одному
капелюху і отримати прибуток 14$, але це гра типу дилема ув’язненого (яка описувалась у
попередній статті), і, оскільки вони не можуть домовитися, єдина точка рівноваги забезпечує їм
11$ прибутку. Результатом руйнування монополії навіть у такому мінімальному варіанті є
падіння ціни для споживачів майже в чотири рази!

Цілком зрозуміло, чому монополісти так не люблять конкуренцію.

Дійсно, припустимо, що червоній королеві вдалося домовитися з білою і вони будуть діяти як
один гравець. При цьому вони узгодили ділити прибутки навпіл. Виявляється, що в такому разі
їм потрібно виробити один капелюх, продати його за 30$ і вони отримують по 14.5$ - це буде
вигідніше, ніж конкурувати. Такі штуки є прихованою монополією і називаються картельними
змовами.

Чим більше стає учасників ринку, тим важче їм домовлятися, тому картельні змови характерні
для ситуації, коли ринок поділений між кількома великими гравцями.

Інша крайність - досконала конкуренція, коли капелюхи починають виробляти 10 - 20 гравців.


Припустимо, наявні 10 учасників, кожен виробляє один капелюх, але отримує дуже невеликий
прибуток. Жоден не може значно вплинути на ціну ринку або вирватися з цієї пастки “одного
капелюха”.

Чому монополії погані?


Головні мінуси монополізації певної області:

Покупці за все платять. Виробництво товару штучно обмежується, споживачі змушені


купувати те, що є в наявності.
Виробники не мають ніяких стимулів до розвитку, впровадження нових технологій (наука
не потрібна), зменшення витрат.
Монополізація призводить до концентрації значних ресурсів в одних руках. Монополіст
має всі стимули корумпувати владу для збереження свого монопольного становища і
прибутків. Власне, це і є олігархія.

Кожен може спостерігати наслідки монополізації у державному житті: нечіткі і заплутані правила
ведення бізнесу, прописування умов тендерів, які неможливо виконати, пожежні норми, які не
мають сенсу, тощо. Як правило, за кожним таким бюрократичним витвором прихований
ланцюжок чиновник - свій бізнес. Україна пронизана сотнями тисяч маленьких і великих
монопольних ніш - на усіх рівнях влади, кожна з яких генерує значні кошти за рахунок звичайних
споживачів. При цьому кожна така монопольна ніша працює як демультиплікатор - сумарно усі
втрачають мільйон, щоб потрібна людина заробила десять тисяч.

Усі спроби боротьби з цими монопольними нішами зустрічають запеклий опір. Можна згадати
УкрСпирт, який намагалися демонополізувати десяток років.

Єдина реформа, яка реально бореться з монопольними нішами у масштабі країни - система
Прозорро. Вона постійно зустрічається зі спробами обійти, обманути, відмінити, але працює і
поступово розмиває монопольні ніші. Хорошою новиною тут є те, що вся ця гіганська
неефективність є джерелом резервних коштів, які у випадку успіху вивільняються і їх можна
використати для розвитку. Можливо, колись так і станеться.

P.S. Фактично, єдина монополія, яка може вважатися “хорошою”, та, що з’явилася внаслідок
технологічного або наукового прориву. Наприклад, Ілон Маск може отримати монополію на
подорожі на Марс аж поки хтось інший не увійде на цей ринок. Однак на конкурентному ринку
така монополія не може існувати довго.
* ідея прикладу взята з книжки Ken Binmore Playing for Real
Олексій Ігнатенко: Ринок "лимонів", теорія
ігор і проблеми науки
рік тому
Наука
6 968
198
3
7

Моделі теорії ігор часто мають справу з невизначеністю. Джерелом невизначеності можуть бути

зовнішні події, що настають з певною ймовірністю (погода, карта, яка випала у грі ...),
конфліктна природа самої гри (наступний хід в шахах залежить від багатьох факторів,
але, в основному, від суперника),
недостатня інформація про елементи гри (наприклад, різні гравці використовують різні
стратегії у покері; інформація про тип гравця може значно допомогти).

Розглянемо простий приклад. Вам пропонують купити на відкритому аукціоні закриту коробку в
якій може бути 1 гривня або 100 - з рівною ймовірністю. Як міг би проходити такий аукціон? Ну,
за початкову ставку 1 гривня всі б хотіли купити коробку. За 20 - 30 гривень теж було б досить
багато бажаючих ризикнути. Очікувана вартість коробки 50.5 (100*0.5 + 1*0.5) і, якщо всі
учасники аукціону володіють однаковою інформацією про коробку і ймовірності, купити коробку
за 50.5 грн означає отримати нульовий очікуваний виграш. Однак, деякі учасники можуть
зробити і таку ставку - це буде залежати від готовності ризикнути, азартності. Азартність
кожного гравця відома тільки йому, інші учасники її не знають. Стратегічні ситуації, коли один
учасник знає щось важливе про гру, а інші - ні, отримали назву ігор з асиметричною
інформацією, про них ми і поговоримо далі.

“Лимони” і “персики”
Для ілюстрації проблем, що виникають за умов асиметричної інформації, розглянемо ринок
вживаних автомобілів. На жаргоні “лимоном” називають машину з проблемами, “персиком” - у
дуже хорошому стані. Розглянемо гру, у якій покупець заходить у магазин та вибирає
автомобіль, який йому подобається. З рівною ймовірністю цей автомобіль може виявитися
“лимоном” або “персиком”. Для спрощення пояснення головної ідеї будемо вважати, що для
продавця “лимон” коштує $999, “персик” - $4999. Покупець готовий купити “лимон” не дорожче
$2000, а “персик” - не дорожче $6000. Угода здійснюється наступним чином: покупець вибирає
машину і робить одну пропозицію БЕРИ-АБО-Я-ЙДУ (тобто ультиматум), продавець
погоджується або ні, і гра закінчується (така постановка може здатися дещо штучною, але вона
дозволяє продемонструвати суть проблеми). Ми також обмежимо можливі ціни, які може
запропонувати покупець і розглянемо три варіанти 1000, 3000, 5000. Це не дуже суттєве
обмеження, оскільки ці три ціни відповідають наступним ситуаціям:

1. ціна 1000 вигідна при купівлі “лимона” обом, при купівлі “персика” вигідна тільки покупцю і
за будь-яку меншу ціну продавець не буде продавати жодну машину.
2. ціна 3000 вигідна при купівлі “лимона” продавцю і невигідна покупцю, при купівлі “персика”
вигідна тільки покупцю.
3. ціна 5000 вигідна при купівлі “лимона” тільки продавцю, при купівлі “персика” - обом.

Тобто, охоплюють всі цікаві для аналізу варіанти. Намалюємо дерево гри у розширеній формі.
Спочатку покупець вибирає машину, яка може виявитися одним з типів з ймовірністю 0.5 (і
учасники це знають до початку торгівлі). Далі покупець робить пропозиції (сині лінії), після
цього покупець погоджується або ні (чорні лінії). Кожна стратегічна ситуація закінчується
виграшами: перше число - виграш покупця, друге - виграш продавця (рис. 1).

Рис. 1. Дерево гри з повною інформацією

Як розв’язувати таку гру? Метод зворотної індукції пропонує для кожного вузла виділити гілку,
що дає максимальний виграш гравцю, який ухвалює рішення на цьому вузлі. Починаючи з
кінцевих ланок графу, виділимо червоними найкращий вибір у кожній точці гри (рис. 2). В
результаті, отримуємо два розв’язки, які є рівноважними: якщо вибраний “лимон”, покупець
пропонує 1000 і продавець погоджується. Якщо вибраний “персик”, покупець пропонує 5000 і
продавець погоджується.
Рис. 2. Розв’язок гри з повною інформацією

Ці ціни відповідають мінімально прийнятній вартості для ухвалення угоди, очевидно, що в


реальній ситуації продавець буде вимагати більшу ціну. Описана модель відповідає ситуації
повної інформації, коли всі гравці знають все про гру.

Чи зміниться ситуація, якщо обидва гравці не будуть знати, за яку машину вони торгуються?
Виявляється, не дуже.

Дійсно, розглянемо гру (рис. 3), в якій інформація про те, чи є машина “лимоном” або
“персиком” розкривається після продажу. В цьому разі гравці максимізують очікувані виграші.
Наприклад, якщо покупець пропонує 1000 і продавець погоджується, тоді у половині випадків
покупець отримує “лимон” (виграші 1000 і 1) і у половині “персик” (виграші 5000 і -3999). Їх
усереднена сума і буде очікуваним виграшем : 3000 і -1999. Оскільки останній вузол відповідає
рішенню продавця і його очікуваний виграш від вибору рішення Так -1999, він відмовиться
продавати машину за таку ціну і отримає більший виграш 0.
Рис. 3 Гра з неповною симетричною інформацією.

Продовжуючи так само для всіх вузлів (Рис 4.), отримаємо дерево рішень для покупця (Рис. 5)

Рис. 4. Очікувані виграші


Рис. 5. Рішення покупця

В результаті найкраща стратегія покупця за умов даної гри пропонувати 3000. Це дає
прийнятний очікуваний виграш обом гравцям, але слід розуміти, що ця стратегія є ймовірнісною
- виграш є математичним сподіванням, тому конкретний покупець може отримати “лимон” за
3000, але може і “персик” за 3000.

Висновок. Таким чином, якщо обоє володіють повною інформацєю, покупець пропонує 1000 за
“лимон”, 5000 за “персик” і продавець погоджується. Якщо ніхто не знає справжнього стану
автомобіля, гравці максимізують очікувані виграші - покупець пропонує 3000 і продавець
погоджується.

Але тепер розглянемо третій, найбільш цікавий варіант. Для неспеціаліста відрізнити “лимон”
від “персика” непросто. А от продавець, який цим професійно займається і, до того ж, має
можливість дослідити машину до продажу, може це зробити. Що буде, якщо продавець, на
відміну від покупця, знає, за що йдуть торги? На рис. 6 зображена гра з асиметричною
інформацією. Цей факт описується пунктирною лінією, що з’єднує точки ухвалення рішення
для покупця. Покупець пропонує свою ціну в ситуації, коли він не знає “лимон” чи “персик”
перед ним. А от продавець це знає, тому його рішення розділені на окремі вузли.

Застосуємо метод зворотної індукції. Рішення гравців позначені червоними лініями. Але
тепер…. все інакше - якщо покупець пропонує 1000, то якщо він потрапляє на “лимон”,
транзакція відбувається, а якщо на “персик”, продавець відмовляється. Для інших варіантів все
ще гірше. Пропонуючи 3000, покупець може розраховувати тільки на “лимон”, а пропонуючи
5000 він може отримати “персик” але лише з ризиком отримати “лимон” - його очікуваний
виграш в цьому разі дорівнює -1000. Повний розв’язок показаний на рис. 7.
Рис. 6. Гра з асиметричною інформацією.

Рис 7. Варіанти для покупця

Джордж Акерлоф і його висновок


Вперше ця ідея була висловлена в статті [1]. Цікаво, що Акерлоф не міг певний час
опублікувати цю роботу - перші три спроби виявились невдалими, оскільки рецензенти двічі
давали негативну оцінку через “очевидність” і один раз через “неправильність” (мотивація була
така, що якби це було вірно - економіка не могла б існувати). Однак після опублікування
виявилось, що ідея впливу асиметричної інформованості на учасників ринку не така очевидна,
як здається. Акерлоф, в решті решт, отримав Нобелівську премію з економіки (2001 року), а
його стаття має 28552 посилання (дані Google Scholar).

Підкреслимо ще деякі моменти:

1. Асиметрична інформація руйнує ринок “персиків”. Їх неможливо купити, неможливо


продати (для раціональних гравців), залишається тільки ринок “лимонів”. Це явище
отримало назву лимонізація ринку.
2. Припустимо, Ви все одно бажаєте купити “персик”. Ви вибираєте автомобіль, питаєте у
продавця: Це “персик”? Продавець запевняє, що це найкраща машина у його салоні. В
результаті довгих торгів Ви знижуєте ціну до $3000 і … продавець погоджується. В цей
момент з’являється відчуття, що щось тут не так. Згода продавця - це сигнал, який
означає, що ця машина точно не “персик”. Такий от цікавий наслідок - на твої умови
погодились і ти зрозумів, що треба тікати.
3. Взагалі структура гри створює продавцям стимул продавати тільки “лимони”. Після
публікації роботи стало зрозуміло, що процеси лимонізації зустрічаються у багатьох
областях.
4. Одним із способів боротьби з лимонізацією ринку вживаних автомобілів став carfax - база
даних з історією всіх вживаних автомобілей Америки. Вона з’явилась 1984 року.

Застосування. Універсальна страховка.


Покажемо, як працює лимонізація ринку на прикладі. Припустимо, ми захотіли створити
добровільну універсальну страховку. Кожна людина страхується, сумарні витрати протягом
року діляться на всіх і отриману невелику суму кожен сплачує. І всім дуже добре. В чому
проблема? Асиметрична інформація - кожна людина досить точно може оцінити своє здоров’я і
річні витрати (точніше за страхову службу). Ймовірнісний розподіл витрат виглядає приблизно
так Рис. 8 (цифри умовні):

Рис. 8. Розподіл річної вартості медичних витрат

Щоб збалансувати систему, кожному потрібно заплатити біля $ 20 тис. Але всі люди, які
впевнені у своєму здоров’ї і які витрачають на рік меншу суму, відмовляться. Тоді, щоб
збалансувати нову ситуацію потрібно виставити кожному вже по $ 50 тис. Після цього від
страховки відмовляться всі, хто платить менше… Сподіваюсь, Ви побачили проблему: в решті
решт, вартість страховки дійде до $ 120 тис і купувати її не захоче ніхто взагалі.

Тому в реальності така штука як універсальна добровільна страховка (без зовнішніх джерел
оплати) не може існувати.

Проблема асиметричної інформації в науці


Останнім часом стали з’являтися дослідження, у яких висловлюється думка про лимонізацію
“ринку” сучасних наукових досліджень (наприклад [2]) .

Дві головні думки, які наводяться у статті. По-перше, через комерційні журнали зацікавлені у
продажу більшої кількості статей, досить часто доступними є назва і (іноді) анотація. Таким
чином, вам потрібно купувати статтю, не знаючи її вартості. В результаті, дослідники мають
стимули до публікування статей з проміжними результатами та яскравими назвами або
анотаціями. В анотації часто перебільшують важливість роботи і результатів.
По-друге, наслідком несприйняття комерціалізації наукових публікацій стала поява “вільних”
журналів або журналів з “відкритим доступом”. В таких журналах ті, хто подає публікацію,
сплачують всі витрати на підготовку. Це негативно впливає на відповідальність журналу щодо
рецензування робіт. Фактично, відповідальність за якість покладається на авторів статті.

Хоча зовнішнє рецензування і є на сьогодні головним інструментом забезпечення якості,


існують зауваження щодо його адекватності сучасному розвитку науки. А саме - здатності
зупинити подальшу лимонізацію наукових публікацій і досліджень за умов зростання їх кількості
і складності (докладніше у [2]).

Український випадок
Якщо у світовій науці починають дискутувати про лимонізацію, в Україні процес уже майже
завершено. Лимони ростуть, цвітуть і активно плодоносять.

Звичайно, проблема багатогранна і будь-яка модель має свої обмеження, але розглядаючи
українську науку як ринок “лимонів” (неякісних досліджень) і “персиків” (якісних досліджень),
можна зробити декілька важливих висновків.

Перша проблема - держава, яка оплачує наукову сферу, і чиновники, які керують наукою, не
можуть оцінити якість наукових досліджень. Тобто в нашій термінології покупці не можуть
відділити “персики” від “лимонів”. Це складно, потребує часу, знань, і не кожен знайде в собі
сили зізнатися в обмеженості своєї експертизи. Крім того, як показує світовий досвід, єдиним
дієвим інструментом є зовнішнє анонімне рецензування. Чи були спроби його запровадити?
Була вимога при підготовці заявок на гранти і теми надати перелік рецензентів, які можуть
написати відгук (майже те саме :) ).

По-друге, що робити у разі виявлення неякісних результатів досліджень? Адже це збитки


держави, тобто потрібно шукати, хто ухвалив цю тему, починати кримінальну справу… нікому
не хочеться це робити.

Тому утворилась воронка погіршення якості:

1. Якість незадовільна, давайте зробимо вимоги більш жорсткими (кількість публікацій,


патенти, сертификати про міжнародне стажування...). Але за погану якість ніяк карати не
будемо, взагалі і перевіряти теж не будемо.
2. Результат - якість погіршилась ще більше, частина ресурсів витрачається на виконання
всіх вимог.
3. Через деякий час приходить розуміння, що якість ще гірше - виникає пропозиція зробити
вимоги ще суворіші. І платити менше.
4. Нормальні вчені тікають за першої можливості.
5. ...
6. В решті решт, комусь сяйне геніальна думка: нащо нам ці дармоїди, які тільки продукують
звіти, витрачають гроші і мають стільки ласої нерухомості?

З іншого боку, вчені (виробники наукового продукту), як правило, знають цінність власних
досліджень (ну, якщо не враховувати ефект ДК… але це вже тема іншої публікації). Це в
точності асиметрична інформація.

Якщо це так, то держава діє узгоджено з раціональною стратегією гри: раз ми не розуміємо, що
відбувається, і не можемо відділити персики від лимонів, давайте платити відповідно до
очікуваного загального виграшу - тобто менше середнього. Чим більше стає “лимонів”, тим
менше очікуваний виграш і, відповідно, кошти, які держава готова виділяти. Це відповідає
ситуації рис. 7, коли покупець пропонує 3000 за авто, сподіваючись іноді отримати “персик”.
Але це марні сподівання, “персики” не бувають за такі гроші … результат - “лимон”. Так, іноді за
рахунок ентузіазму, енергії молоді, закордонної підтримки виникають спалахи науки, але ...
ринку “персиків” немає - є тільки ринок “лимонів”. Тому навіть поява видатного дослідження
оплачується за тарифом “лимона”.

Так сталося, що раніше якість визначалась через систему звань, ступенів, нагород і т.д.
Розподіл коштів на дослідження проводився з урахуванням “табелю рангів” - академіки, член-
кореспонденти, доктори наук…

Експертиза публікацій у журналах + жорстка конкуренція давали можливість тримати якість


наукових досліджень. На сьогодні практично всі ці бар’єри скомпрометовано, а єдиний, який міг
би реально працювати (зовнішня анонімна експертиза), не був запроваджений. Остання
ініціатива відрізняти “лимони” від “персиків” на основі індексу цитування прогнозовано
перетвориться на профанацію.

Останнім часом науковий “ринок” почав захоплювати інший тип досліджень. Назвемо їх
“мухомори”. Це дослідження, які є або псевдонауковими або повністю сплагіаченими з
закордонних (наприклад російських) робіт. Ці роботи відіграють по відношенню до “лимонів” ту
ж роль, що “лимони” для “персиків”. “Лимон” це все таки певна наукова робота, що має цінність,
“мухомор” не має жодної і написати його набагато простіше. Тому можна мабуть казати про
мухоморизацію науки в Україні. Цікаво було б провести тест: дати людям, які ухвалюють
рішення анонімізовані роботи справжніх науковців і якусь псевдонаукову маячню. Який відсоток
зможе вірно вказати що є що?

Джерело цієї проблеми (в рамках даної моделі) - це асиметричність інформації. Парадокс -


покупець не здатен/не хоче/не має часу (потрібне підкреслити) створити адекватну систему
оцінки якості, але винуваті у цьому науковці. І саме вони будуть відповідальні за стан наукової
галузі.

Висновок. Якщо держава вирішить припинити фінансування науки, вона це зробить під будь-
яким приводом. Зі своєї сторони науковцям потрібно спробувати знищити інформаційну
асиметрію.

Очевидно, проблема перезріла, тому схожі ідеї виникають останнім часом у різних науковців.
Буквально декілька напрямків, які виникли і стали відомими завдяки соціальним мережам :

популяризація науки (висвітлення “персиків” і пояснення їх цінності як на широкий загал


так і для керівництва держави). Наприклад всім відомий Антон Сененко...
організація масових науково-популярних заходів (Дні науки, марш за науку, шкільні лекції).
дисергейт - Боротьба з “мухоморами”, спроба змусити систему боротись принаймі з
явними проявами недоброчесності. Відкрита база “мухоморів”.
база даних тих, хто спроможний робити “персики” -ініціатива Семена Єсилевського -
аналог carfax - повна історія по кожному вченому, стажування, здобутки, топ-публікації,
повні тексти дисертацій.

Посилання

1. Akerlof, George A. "The market for “lemons”: Quality uncertainty and the market mechanism."
Uncertainty in Economics. 1978. 235-251.
2. Cottrell, Richard C. "Scientific integrity and the market for lemons." Research Ethics 10.1
(2014): 17-28.
Олексій Ігнатенко: Дуелі, вестерни і теорія
ігор
рік тому
Наука
3 788
34
1
1

Дуель як гра

Дуель – кристально виражена ситуація конфлікту між двома учасниками. Жоден вестерн не
обходиться без дуелей. Теорії ігор також є що сказати з цього приводу. Для представлення
дуелі у формі гри потрібно визначити гравців, їх стратегії та функції виграшу. Отже, уявимо
двох суперників, які розійшлися на 100 кроків і кожен має пістолет з одним патроном. Для
спрощення ми розіб’ємо процес дуелі на дискретні кроки – на кожному кроці гравці вирішують,
що робити: або стріляти або зробити крок уперед. Гра закінчується, коли один з учасників
мертвий або не залишилось куль.
Якщо гравець вже вистрілив, а гра ще не закінчена, то він завжди робить крок вперед.
Визначимо виграші учасників. Якщо гравець вистрілив і влучив, то він отримує 1, а той, кого
вбили, одержує -1. Якщо гравець не влучив, то інший підходить на надійну відстань і стріляє. У
цьому разі він влучає з ймовірністю 1. Якщо обоє гравців вистрілили одночасно і одночасно
влучили або схибили, вони отримують нульові виграші.

Щоб зрозуміти, яка стратегія поведінки найкраща, потрібно визначити функцію точності, яка
дорівнює ймовірності влучання для даної відстані. Щодо неї будемо вважати, що для
початкової відстані між учасниками вона дорівнює нулю. Якщо ж відстань між учасниками
мінімальна (0 кроків), то точність дорівнює 1. Також будемо вважати, що функція точності
монотонно спадає, тобто точність тим більша, чим відстань менша.
Оскільки відстань між гравцями скінченна і кожен має рівно одну кулю, то гра закінчиться не
більше як за 51 хід. Приклади функцій точності показані на наступному рисунку.

Кожен гравець вибирає відстань, з якої він буде стріляти, – це його стратегія. Припустимо,
вибрані стратегії X та Y. Якщо відстань першого учасника Х більша, то він стріляє раніше,
влучає з ймовірністю P(X). З ймовірністю 1 – P(X) він хибить і тоді другий гравець спокійно
підходить впритул і вбиває його напевно (з ймовірністю 1). Якщо ж відстань першого учасника
менша, то він має витримати постріл суперника (Q(Y) що той влучив і 1 – Q(Y) що ні). Ситуація
для другого учасника аналогічна з точністю до заміни результату на його функцію точності.
Що вони отримують в результаті? Виграш першого учасника дорівнює 1 з ймовірністю P(X) і -1 з
ймовірністю 1 – P(X). Тобто його очікуваний виграш дорівнює 2 P(X) – 1 для першого випадку і 1
– 2Q(Y) для другого випадку. Якщо ж відстані пострілу однакові, то вони стріляють одночасно і
виграш першого дорівнює P(X) – Q(X) (а другого Q(X) – P(X)).

Кожен гравець прагне максимізувати свій виграш, тобто стріляти в іншого з максимальною
ймовірністю влучання. Це гра з нульовою сумою (виграш одного дорівнює мінус виграш іншого),
тобто вибір відстані гравцем одночасно мінімізує виграш суперника. Цю ідею можна
використати для знаходження рішення і вона пов’язана з відомою теоремою про мінімакс
Джона фон Неймана.
Для кращої ілюстрації розглянемо конкретний приклад. Нехай функції точності стрілків такі як
показані на рисунку.

Нанесемо на графік виграші першого гравця. Тут червона лінія “вмикається” для відстані X > Y,
синя для X < Y і зелена для X = Y. Як це працює?
Якщо другий стрілок вибрав стріляти з відстані 50 кроків, то у першого виникає можливість
збільшення своїх шансів на виграш. Якщо він вибирає стріляти з більшої відстані (тобто
раніше), його виграш – червона крива. Якщо він вибирає стріляти з ближчої відстані, його
виграш – синя крива. Якщо ж вони стріляють одночасно, то його виграш описується зеленою
кривою (на наступному рисунку – чорна точка).

Другий гравець намагається вибрати свою стратегію таким чином, щоб позбавити першого
можливості максимізації, іншими словами другий гравець намагається мінімізувати максимум
першого (в ідеалі – зменшити йому вибір до однієї точки). Точка, в якій йому це вдається,
називається сідловою точкою гри. Це точка, де мінімакс дорівнює максиміну. На правому
рисунку – це точка перетину двох кривих.
Визначається ця точка рівнянням P(X) + Q(X) = 1 – і для розглянутої задачі вона завжди існує і
єдина.
Сідлова точка є розв’язком для всіх скінченних ігор двох гравців з нульовою сумою.
Нейман особливо пишався цією теоремою (а він був одним з найбільш яскравих математиків /
фізиків двадцятого сторіччя):

“Наскільки я розумію, ніяка теорія ігор неможлива… без цієї теореми…. Я вважаю, що до
доведення Теореми про мінімакс в цій області взагалі не було нічого вартого опублікування.”
Джон фон Нейман"

Цікаві наслідки:

1. Якщо є двое ідентичних гравців з функцію точності P(X) = X, то для них найкраще рішення
– підійти впритул (на 50 кроків) і вистрелити. Результат – гарантована смерть обох, але
вони максимізували свої шанси.
2. Для довільних функцій точності учасники дуелі мають стріляти одночасно. Це дає їм
найкращі шанси. Це цілком відповідає сценам дуелей з вестернів. Щоправда там є
додатковий елемент, який не враховано в нашій простій моделі – той, хто вихоплює зброю
першим, є порушником закону. Після такого вбивства прямий шлях на побачення з
вішальником. Тому потрібно вихопити зброю другим (або хоча б одночасно), але
вистрелити першим.
3. У ситуації коли висококласний стрілок зустрічається з посереднім виявляється, що
найкраща можливість для посереднього стрілка стріляти здалеку за першої ліпшої нагоди
(коли сума ймовірностей дорівнює 1). Отже, коли в головного героя не можуть влучити 30
чоловік з різних дистанцій – це не тому, що фільм поганий. Просто у інших учасників
погані функції точності (що є математичним способом сказати, що вони криворукі), а так
вони діють цілком раціонально.

Труелі. Парадокс слабкого гравця.

Ситуація кардинально змінюється, якщо додати ще одного учасника дуелі. Нехай троє стрілків
А, Б та В стоять у вершинах правильного трикутника з необмеженим запасом куль. У теорії ігор
такі взаємодії отримали назву труелей. Розглянемо труель з такими правилами:

Вибирається фіксований порядок дій;


Відповідно до черги кожен гравець вибирає одну ціль і виконує один постріл;
Всі влучання смертельні і всім відомо, що А влучає у 100% випадків, Б у 80% і В лише у
50%.
Кожен вибирає стратегію, яка максимізує його шанси на виграш;
Кожен гравець може (за бажанням) стріляти вгору.

Питання: Ким би Ви хотіли бути у цій дуелі А, Б чи В? В кого найбільші шанси вижити, в кого
найменші? Як впливає порядок ходів на результат?
Як ми пам’ятаємо з попереднього розділу, у дуелях шанси кращі у більш точного гравця. Чи
виконується те саме для труелі? (відповідь після картинки)

Виявляється, ні! Найкращі шанси у В, потім А і в кінці Б. Більш того, це ніяк не залежить від
вибраного порядку.

Причина такого стану речей полягає у природі стратегічної взаємодії. Учасники намагаються
діяти найкращим для себе чином. Тому найращі снайпери А та Б знають, що В не є для них
великою загрозою. Кожен з них досить легко переможе його один на один.
Тому ні А, ні Б не будуть стріляти в В. Вони будуть стріляти один в одного, аж поки хтось не
буде застрелений. Отже, В обов’язково доживе до фіналу і потім буде стріляти першим! Цікаво
також, що цей результат не залежить від порядку ходів. Припустимо. Що В ходить першим. Тоді
навіщо стріляти в А чи Б і ризикувати влучити? Краще вистрілити у повітря и почекати.
Порахуємо ймовірність для одного порядку ВАБ:
В стріляє у повітря, А стріляє у Б (бо Б більш небезпечний суперник) і вбиває його з
ймовірністю 1. В стріляє у А і вбиває його з ймовірністю 0.5. Якщо А вижив, то на наступному
кроці він вбиває В.
Загальний результат для довільного порядку (повні викладки є цікавою задачею з теорії
ймовірності. Розв'язок, наприклад, тут) такий:
В перемагає у 52% випадків, А – у 30% і Б у 18%.

Загальні висновки для труелей (і дуелей з більшою кількістю учасників):

1. Якщо Ви найслабша ланка то найкраща стратегія – просто чекати поки сильніші гравці
вирішують хто буде Вашим суперником.
2. Сильному гравецю дуже вигідно створити собі репутацію слабкого.

The good, bad and ugly. Труель Серджіо Леоне.

(аналіз Філа Мелінгера)

Фінальна сцена фільму “Хороший, поганий, злий” є чудовим прикладом труелі (і взагалі
стратегічної гри). Троє чоловіків на площі, камінь з ключем до скарбу посередині і кожен
озброєний і небезпечний. Всі чудові стрілки, і кожен повинен вирішити, у кого йому стріляти
першим.

За сюжетом Клінт Іствуд написав на камені ім'я, яке приводить до грошей, але чи повинні інші
йому вірити? Можливо там нічого не написано (а так насправді і є). Тоді вони не можуть
ризикувати і стріляти у Клінта – так вони втратять шанс отримати золото. Це означає, що їх
найкращий шанс – стріляти один в одного і сподіватись, що потім буде можливість обеззброїти
або домовитись з Іствудом.

Що вони не знали так це те, що одному з них Клінт дав незаряджений пістолет. Тому Клінт міг
ігнорувати суперника з незарядженим пістолетом та зосередитись на тому, чий пістолет був з
кулями. “Хороший” Клінт гарантував собі безпеку у першому раунді і використав Туко у якості
приманки… Єдине чого він чекав – це розуміння у Ангельских Очах, що його найкращий шанс -
стріляти у Туко. Ця гра була спланована ще до початку, і шансів у інших не було.
Чудовий приклад того, як люди вибирають найкращі рішення на основі доступної їм
інформації… і хтось інший маніпулює цією інформацією.

Як потім виявилось, золото було заховане у могилі з написом Невідомий. Тобто, коли Клінт не
написав на камені нічого, він власне не збрехав, але і нічого не сказав.

Джерела
1. https://mindyourdecisions.com/blog/2007/09/25/game...
2. Alexander Mehlmann The Game’s Afoot! Game Theory in Myth and Paradox.
Олексій Ігнатенко: Теорія ігор і Талмуд.
Задача про банкрутство
11 місяців тому
Наука
6 165
155
1
5

Як правило теорія ігор досліджує конфлікти між учасниками, коли виграш одного призводить до
програшу іншого. Для таких ситуацій придумали некооперативні ігри, тобто ситуації де гравці
(за умовами) не можуть домовлятися. Тому що про що можна домовитись з суперником,
наприклад, у шахах? Для таких ігор була доведена теорема про мінімакс, визначена рівновага
Неша та інші штуки. Пізніше стало зрозуміло, що трапляються ситуації, коли гравці мають
співпрацювати для досягнення бажаного результату, але які все таки, по суті, також є
конкурентними.

Наприклад купівля товару. У Вас є оцінка цінності об’єкту і якщо ціна буде нижча - Ви у виграші.
У продавця є знання собівартості і якщо ціна буде вище - він у виграші. Ви купуєте “унікальний”
папірус з поклонінням Анубісу вважаючи, що він прикрасить вашу квартиру (спойлер: насправді
ні) за певну договірну суму, яка (як вважається), має бути вигідною обом сторонам, тобто
давати кожній певні виграші. Але для створення цих виграшів ви повинні домовитись до
спільного рішення - ціни продажу. Ця ціна може давати більший виграш Вам або продавцю і
залежить від переговорних здібностей сторін. Мета кожного гравця, таким чином, є досягнення
спільної угоди, але, разом з тим, отримання більшого виграшу. Досить суперечливо? Так і є в
житті.

Рішенням цих проблем займається теорія кооперативних ігор. Кооперативні ігри охоплюють
різні напрямки: переговори, укладання угод щодо розподілу прибутків/витрат, ігри голосування,
спільне використання інфраструктури, товарів, послуг тощо.

Головна властивість кооперативних ігор - зв’язуюча угода (binding agreement). Після того як
гравці досягли домовленості вважається, що домовленість буде виконуватись. Це може
забезпечуватись нормами суспільства або судовою системою, коли витрати на розрив
домовленості значно більше за вигоди..

Як випливає з назви, в цій статті мова буде йти про кооперативні ігри, які мають відношення до
Талмуду. Вавілонський Талмуд є збірником текстів про єврейські закони, етику, звичаї і
філософію та був записаний між другим і п’ятим сторіччями нашої ери. Він складається з Мішни
- збірки оригінальних текстів та Гемари - коментарів, які трактують та доповнюють Мішну.

В трактаті Ketubot 93a (авторства ребе Натана) розбирається наступний випадок. Один чоловік
був одружений на трьох жінках (позначимо їх А, Б та В) і уклав з ними шлюбні угоди на 100, 200
і 300 зуз відповідно (далі просто числа). Після його смерті виявилось, що його майно коштує
менше 600. Рекомендації поділу майна для різних випадків вказані в наступній таблиці:

А Б В

100 33 ⅓ 33 ⅓ 33 ⅓

200 50 75 75
300 50 100 150

Написано, що якщо майно коштує 100, то потрібно поділити порівну. Якщо майно коштує 300, то
поділ пропорційний. А якщо 200 - то взагалі не дуже ясно звідки взялись цифри. Ребе Натан
ніяких додаткових коментарів не залишив.

Ця Мішна була джерелом суперечок протягом довгого періоду, висловлювались припущення,


що в процесі написання сталась помилка.

Один впливовий ребе Hai Gaon висловлював припущення, що цей приклад зв’язаний з
випадком поділу накидки (буде розглянутий нижче), але він не зміг обгрунтувати своє
твердження.

Нарешті у 1985 році з’явилась публікація Роберта Аумана та Майкла Машлера яка пояснила
загальний принцип поділу (узгоджений з випадком поділу накидки), що призводить до чисел у
таблиці. Спробуємо розібратись на простих прикладах яким чином їм це вдалося.

Задачі поділу майна


Перш за все зазначимо, що кооперативні ігри називають також коаліційними (там є відмінності,
але для цієї статті вважаємо їх синонімами). Коаліційні ігри моделюють ситуації коли гравці
утворюють коаліцію та генерують певну величину прибутку. Максимальна величина прибутку,
яка генерується коаліцією називається її вартістю. Головна проблема, яка виникає: яку коаліцію
створять раціональні гравці і як вони мають поділити її вартість між собою. Будемо розглядати
ігри у яких вартість виражається в універсальних одиницях (зузах, драхмах, доларах), які мають
однакову цінність для всіх учасників і вони можуть (при визначенні розподілу вартості)
передавати її один одному. Таки ігри називаються іграми з трансферабельною корисністю.
Задачі поділу майна потрапляють у цей тип ігор.

Дійсно, кредитори, яким винна людина мають або домовитись самостійно про розподіл майна
боржника, або піти в суд. Суд призначить кожній стороні певну суму, при цьому гравці мають
делегувати йому право визначати частку кожного. З іншого боку суд також має керуватись
певним справедливим принципом поділу, інакше всі будуть незадоволені результатом.

Принцип рівного поділу спірної частки


Проблеми поділу власності, швидше за все, виникли тоді, коли виникло поняття власності. В
Талмуді (Baba Mezi’a 2a) описується суд, де відбувається суперечка щодо знайденої одежі
(накидки).

“Один заявляє, що вся вона належить йому, а інший - що половина належить йому... то
перший отримує три чверті, другий - одну чверть”.

Тут фактично сформульовано правило для судді як виконувати розділ будь-якого спірного
майна між двома учасниками з нечіткими правами власності. І ситуація досить цікава. Думаю
більшість в подібній ситуації запропонували б пропорційний розподіл - один заявляє права на
дві частки, інший на одну частку, отже поділити треба - (⅔,⅓). Однак Талмуд пропонує іншу
відповідь : ( ¾,¼) - яка відповідає принципу рівного поділу спірної частки. Як він працює?
По-перше, потрібно вирішити яка частина одежі спірна. В нашому випадку один претендує на
все, інший на половину, отже спірною є половина одежі.

По-друге, потрібно поділити спірну частку порівну - тобто по чверті, та віддати її кожній стороні.

По-третє, потрібно віддати решту (те що не є спірною часткою) тій стороні. яка заявила на нього
права.

Виявляється, що цей алгоритм (якому приблизно 2000 років) має зв’язок з сучасними задачами
і є більш справедливим у багатьох ситуаціях ніж ділення пропорційно.

Приклад 1. Двоє кредиторів давали гроші боржнику. Один дав йому 300, інший 90. Все майно
боржника оцінюється в 120. Це проблема банкрутства яку ми розв’яжемо відповідно до
принципу рівного поділу спірної частки.

Перший кредитор претендує на 300, але у боржника є тільки 120. Більше наявної кількості він
не може вимагати, отже його вимога це вся наявна кількість. Другий кредитор вимагає 90 - це
менше за наявну кількість, отже 30 переходить першому кредитору відразу (другий на цю суму
не може претендувати). Таким чином спірна частка 90 і вона ділиться навпіл.

Результат: перший кредитор отримує 45 + 30 = 75, другий 45.


В попередньому прикладі ми ділили борги, фактично гравці об’єднуються у коаліцію щоб
зменшити свої втрати (якщо не домовляться, то втрачають все, якщо домовляються - тільки
частину).

Принцип справедливого поділу пирога


За допомогою схожого принципу розв’язуються і більш складні задачі. Він носить назву
принципу справедливого поділу пирога. Пиріг тут це термін, що використовується у теорії ігор.

Пиріг = спільний сумарний виграш від кооперації (досягнення угоди) мінус сума виграшів
гравців у разі самостійної роботи.

Для отримання справедливого рішення потрібно ділити пиріг порівну між сторонами угоди.

Приклад 2. Розглянемо таку ситуацію: дві фірми А та Б вирішили інвестувати у програмний


продукт, який коштує 30. Перша фірма отримає прибуток від створення продукту 50, а друга 80.
Як поділити витрати?

Якщо фірма А самостійно інвестує, то вона отримує 50 - 30 = 20. 20 - це її виграш у разі


самостійної роботи.

Якщо фірма Б самостійно інвестує, то вона отримує 80 - 30 = 50.

При спільному виконанні проекту їх сумарний виграш дорівнює 50 + 80 - 30 = 100.

Пиріг дорівнює 100 - 20 - 50 = 30. Ділимо його навпіл.


Прибуток першої фірми таким чином 15 + 20 = 35

Прибуток другої фірми 15 + 50 = 65

Отже вони поділили витрати на інвестиції порівну.

Розберемо тепер випадок коли вартість розробки зростає до 60.

Перша фірма не інвестує смостійно, бо її виграш від’ємний.

Друга фірма самостійно отримує виграш 80 - 60 = 20.

Спільний виграш 50 + 80 - 60 = 70

Пиріг дорівнює 70 - 0 - 20 = 50. Ділимо його навпіл.

Прибуток першої фірми таким чином 25

Прибуток другої фірми 25 + 20 = 45

Витрати на розробку слід поділити 25 на 35

Як цей принцип узгоджується з попереднім? Для першого випадку разом вони отримують
прибуток 100, їх претензії 50 і 80. Як видно, спірна частина прибутку - 30, ділимо її навпіл і
отримуємо ті самі цифри: 35 і 65.

Задача про банкрутство і її розв’язок


Отже повернемось до задачі ребе Натана. Важливо не просто знайти розв’язок, а зрозуміти
принцип, який був би узгодженим з принципом рівного поділу спірної частки.

Розглянемо спочатку середній рядок.

А Б В

200 50 75 75
Виберемо будь-яких двох вдов, скажімо першу і другу. Разом вони отримують 125. Чи
узгоджується їх поточний розподіл з принципом? Їх вимоги 100 і 200, тобто спірна частка 100,
вона ділиться навпіл. Отже за принципом вони мають отримати 50 і 50 + 25 = 75. А це якраз
суми, які пропонуються!

Аналогічно можна перевірити і числа для інших гравців. Виявляється, що поділ 50 75 75 є


єдиним, узгодженим з принципом справедливого поділу спірної частки. Для інших рядків теж
перевіряється, що вони узгоджені з цим принципом.

Загальний принцип поділу


Тепер ми можемо сформулювати загальний алгоритм, який дозволить поділити майно для
будь-якої вартості.

Алгоритм. Спочатку гравці отримують однакову кількість аж поки найменший кредитор не


отримав половину своєї частки. Після цього він перестає отримувати гроші аж поки всі не
отримають по половині того, на що вони претендують.

Якщо вартість майна більша за суму половин боргів, то гроші починає отримувати учасник, чиї
втрати найбільші. Як тільки його втрати зрівнялись з втратами другого кредитора, вони
починають отримувати гроші на рівних і так далі.

Резонно може виникнути питання - чому половина? Чому кредитор, що отримав половину
повинен чекати аж поки всі не отримають свої половини? Одне з припущень полягає в
необхідності узгодженості ще з одним принципом Талмуду: Отримати половину - все одно,
що отримати все.

Справа в тому, що якщо ви дали гроші під заставу якогось майна і вартість майна є меншою за
половину суми позики, то ви не можете розраховувати на гарантоване повернення суми. Така
позика дається “на довірі” і все що ви отримаєте в результаті поділу є кращим за те, на що ви
можете розраховувати.

Якщо ж вартість майна більша за половину суми, то ви розраховуєте отримати свої гроші, і в
цьому випадку все, що ви недоотримуєте є втратою.
Боб Ауман. Нобелівський лауреат з економіки за 2005 рік (разом з Томасом Шелінгом) за
дослідження ситуацій конфлікту і кооперації на основі ігрового аналізу.

Існує яскрава фізична інтерпретація цього принципу на основі сосудів, які сполучаються. Отже,
сосуди відповідають боргам, кількість води - поточній вартості майна. Розташування сосудів на
рисунку показує порядок отримання грошей.
Поки найменший кредитор не отримав половину - всі отримують порівну, отже якщо вартість
майна менша за 150, це майно розподіляється на всіх однаково.

Якщо найменший кредитор отримав половину, то він перестає отримувати гроші аж поки його
втрати не зрівняються з втратами інших.

Розглянемо випадок, коли вартість майна дорівнює 500:

Спочатку отримують всі по половині боргів 50 + 100 + 150 = 300. Залишається ще 200. Далі
борги починають віддавати починаючи з тієї, якій винні найбільше. +50 третій вдові. Після цього
третя і друга на рівних отримують борги - +50 + 50. Нарешті залишається ще 50, які діляться
порівну між усіма.

Відповідь. 66 ⅔ 166 ⅔ 266 ⅔

Алгоритм легко узагальнюється на будь-яку кількість боржників.

Таким чином, можна вважати, що задача ребе Натана розв’язана. І вона дійсно узгоджується з
принципом поділу накидки з іншої Мішни. Єдиний несподіваний момент - Ауман і Машлер
використали ідею теорії ігор (нуклеоси), яку придумали аж в 1969 році. Очевидно, що автор
задачі майже 2000 років назад мав якісь свої міркування, невідомі нам.

Інші способи вирішення


1. Інший спосіб був запропонований ребе Альфасі і відрізняється тим, що кожна копійка
ділиться між кредиторами порівну. Тобто вони отримують гроші на рівних умовах аж поки
найменший кредитор не отримає все. Після цього він перестає отримувати гроші. Цей метод
поділу самоузгоджений, завжди дає єдине рішення і значно простіший.

Для цього методу таблиця поділу виглядала б так:

А Б В

100 33 ⅓ 33 ⅓ 33 ⅓

200 66 ⅔ 66 ⅔ 66 ⅔

300 100 100 100

500 100 200 200

2. Ще один спосіб поділу зв’язаний з таким міркуванням. Припустимо кредитор А дійшов до суду
перший, а про інших нічого невідомо. Тоді він забирає стільки, скільки йому винні (виходячи з
наявної суми). Потім приходить кредитор Б і вибирає гроші з залишку і нарешті останнім
приходить В. Зрозуміло, що за такої схеми перші отримають набагато більше, але штука в тому,
що ми випишем всі можливі перестановки і усереднимо виграші гравців за ними:

Випишемо всі перестановки для випадку 200.


Загальна таблиця матиме вигляд

Цікаво, що для двох випадків цифри співпадають. Цей підхід є результатом застосування
загального принципу, який називається вектором Шеплі (але про нього іншим разом).
Ллойда Шеплі вважають одним з найбільш впливових вчених, що працювали в області теорії
ігор. Особливо важливими його ідеї і результати для кооперативних ігор, фактично, його внесок
є найвагомішим з усіх. Разом з Алвіном Ротом він отримав Нобелівську премію з економіки 2012
року за стійкі схеми розподілу та їх застосування для аналізу ринків.
Олексій Ігнатенко: Системи голосування і
теорія ігор. Частина перша: парадокси і
властивості
Системи голосування і теорія ігор. Частина
перша: парадокси і властивості
7 місяців тому
Наука
7 544
651
4
12

Який зробити наступний хід, якщо невідома гра?

Міст шпигунів.

Невеличка передмова
Проблема узгодженої поведінки та ухвалення рішень великими колективами ключова для всієї
історії людства. Якщо дивитись під цим кутом зору, то значні історичні зміни були наслідком
розвитку або появи нового типу взаємодії між рядовими учасниками процесу. Делегування
права ухвалення рішень (навіть і не добровільне) за ієрархією дозволила організувати великі
імперії Сходу і Єгипту. Відповідним було і обгрунтування. Наприклад, світогляд персів уявляв
світ ареною боротьби Добра і Зла, де цар на чолі бюрократії намагається привнести порядок та
наблизити перемогу, тому невиконання рішення старшого за посадою було, взагалі кажучи,
військовим злочином. Власне якість рішення визначалась місцем в ієрархії - цар не
помиляється.

І мабуть найбільш відомими, хто вибився з цієї протореної колії, були греки. Сильно
спрощуючи, ідея греків полягала в наступному: щоб ухвалити найкраще (оптимальне) рішення
потрібно спочатку почути всі можливі, а потім проголосувати. Те рішення, яке обере більшість -
найкраще. Інші народи правда казали, що грекам просто подобається триндіти в агорі замість
того щоб боротись за перемогу Добра у вселенський битві, але грекам було все одно, результат
на табло - персів вони перемогли.

Так чи інакше, саме греки (і потім римляни) прославили виборчі процедури, на сьогодні можна
констатувати, що демократія хоч і погана штука, але краще поки що немає. Далі мова буде йти
про виборчі системи, але з математичної точки зору. Виявляється, що, в певній мірі,
повторюється ситуація з попередньої статті про американську конституцію, коли політики
сформулювали умови виходячи з певних абстрактних понять про справедливість, загальність і
того, як має бути влаштований конституційний устрій. А потім (після акуратної математичної
формалізації) виявилось, що ці умови неможливо виконати (точно як у анекдоті про розумне,
добре і вічне).

Закінчуючи передмову зазначу, що після того, як системи голосування увійшли в життя


розвинутих країн важливим питанням стало можливість маніпуляцій або впливу на процес
голосування з метою отримання бажаного результату. Така задача може формулюватись в
термінах теорії ігор і це обумовлює назву.
Сьогодні покращені засоби доставки інформації пронизують кожну секунду існування де б ви не
знаходились, і скоро кожна новина, подія та загалом будь-яка активність буде спробою
маніпуляції і впливу на свідомість. Особливо це стосується сильних емоцій, бо так інформація
запам’ятовується найкраще. Отже є сенс спокійно почати ab ovo.

Теорія ігор і системи голосування


Коли ми говоримо про теорію ігор у застосуванні до голосування, природно виникає питання: А
в чому ж тут гра? Відповісти на це питання важливо для подальшої побудови моделі, яка
(звичайно) буде спрощенням реального життя, і висновків, які можна зробити на її основі.

Для визначення гри необхідно задати три речі: гравців, їх стратегії і їх виграші. На роль гравців
виникає дві можливості: кандидати та виборці. Ідеальною була б модель де були б і ті і інші,
але розв’язати таку модель буде вже неможливо. Модель з кандидатами-гравцями пов’язана з
теоремою про медіанного виборця (там виборці вважаються розподіленими вздовж певної осі,
наприклад, праві - ліві). Інший підхід полягає у розгляді системи з точки зору виборців.
Кандидати тут вважаються фіксованими альтернативами, які вибирають гравці. Їх вплив - це їх
голос, поданий за певного кандидата (або ранжування всіх кандидатів). Результат буде
залежати від обраної системи голосування, а виграш гравця це перемога кандидата який йому
більше подобається.

Приклад. Шестеро виборців (їм відповідають стовпці) мають наступні уподобання щодо напоїв:

виборці

1 2 3 4 5 6

1 чай кава чай кава сік сік

2 кава чай сік сік кава чай

3 сік сік кава чай чай кава

NB Тут число - порядковий номер виборця. В усіх інших прикладах - кількість виборців.

Як їм вибрати один напій? Або, більш загально, як агрегувати уподобання групи людей? В
ідеалі ми шукаємо функцію, яка відображає всі уподобання в один вектор-результат,
наприклад:

сік

чай

кава

Якщо ми говоримо про вибори, то в даному конкретному прикладі перемагає один варіант, який
стоїть на першому місці - тобто сік. Якщо ж нас цікавить весь вектор, то в загальному
формулюванні така функція називається функцією соціального вибору. В цьому випадку
виборці 5 і 6 найбільш задоволені - виграла альтернатива, яка є їх першим вибором. Виборці 3 і
4 помірно задоволені - виграв їх другий вибір. Виборці 1 і 2 зовсім незадоволені. Будемо
вимірювати задоволеність-незадоволеність цілими числами, наприклад виграші в даній
ситуації будуть такі

1 і 2 - 0 балів

4 і 3 - 1 бал

6 і 5 - 2 бали

Отже, виникає природна постановка гри. Гравці - виборці, дії - вибір кандидата у бюлетені,
виграш - місце переможця в особистих уподобаннях. Чим вище, тим краще. І тут виникає дві
проблеми:

1. Зрозуміло, що результат буде залежати від системи голосування, тобто механізму


агрегації. Очевидно, що деякі системи кращі за інших, яка з них найкраща для
конкретного випадку або взагалі? І які властивості має хороша система?
2. Найпростішою стратегією виборців є “щире голосування”, тобто голосування за найвищу
можливу альтернативу зі своїх уподобань. Однак не все так просто, іноді гравці можуть
забезпечувати собі кращий кінцевий результат проголосувавши за іншу альтернативу. Це
вимагає точного знання уподобань інших та системи голосування і називається
“стратегічним голосуванням”.

NB Далі ми розглянемо “ідеальний світ” де виборці голосують щиро, тобто вибирають свій
перший можливий варіант. Це зроблено з метою продемонструвати принципові можливості
систем голосування і поведінки виборців.

Дві альтернативи
Випадок двох можливих альтернатив найпростіший.

Нагадаємо, що Абсолютна більшість це правило, за яким перемагає той, хто набрав більше
половини перших місць у уподобаннях виборців.

І результат, який був отриманий в 1952 році Кеннетом Меєм звучить так (у спрощеній формі):

Для ситуації двох альтернатив абсолютна більшість є єдиною системою, яка забезпечує
наступні властивості:

вона відноситься до всіх виборців однаково;


вона відноситься до альтернатив однаково;
вона монотонна: якщо один з виборців забере свій голос у програвшого кандидата і
передасть його переможцю, то результат буде той самий.

Якщо кількість виборців непарна, то вона завжди забезпечує переможця. З практичної точки
зору для великої кількості виборців вона забезпечує переможця і для парної кількості, оскільки
точна рівність голосів має ймовірність дуже близьку до 0. В принципі правило абсолютної
більшості використовували дуже давно, грецька демократія загалом була побудована на цьому
правилі (з певними обмеженнями).

Три і більше альтернативи


Теорема дала надію що такий самий трюк можна провернути і для більшої кількості
альтернатив (тобто сформулювати систему властивостей і виділити виборчі процедури, які їм
задовольняють). Але виявилось, що для трьох і більше альтернатив метод абсолютної
більшості просто далеко не завжди визначає переможця. Це явно не те, що б ми хотіли від
виборчої системи. Отже, властивість 1: Виборча система має завжди визначати переможця.
Найближча до абсолютної більшості (для 3 і більше альтернатив) є відносна більшість.

Відносна більшість це правило, за яким перемагає той, хто набрав більшість перших місць у
уподобаннях виборців. Відносна більшість теж практично завжди визначає переможця. Чому ж
не використовувати її?

Розглянемо новорічний приклад.

виборці (кількість)

2 2 3

1 олів’є шуба холодець

2 шуба олів’є шуба

3 холодець холодець олів’є

Переможця за абсолютною більшістю не існує. За системою відносної більшості перемагає


холодець.

Але виявляється, що ця система вразлива до численних парадоксів:

Парадокс абсолютного лузера. Абсолютна більшість (4 з 7) вважають холодець


найгіршим вибором!
Залежність від нерелевантних альтернатив. Якщо виявиться, що оселедця немає і
шубу приготувати неможливо, то переможе олів’є.
Парадокс переможця за Кондорсе (про цю систему буде в наступній частині). Якщо ми
спробуємо проголосувати пари альтернатив, то отримаємо наступний результат: холодець
- шуба (3 виборців вважають, що холодець краще (третій стовпчик таблиці), виборці з
першого і другого стовпчика вважають, що шуба краще - в сумі це 4 голоси. Отже 3 проти
4, перемагає шуба), шуба - олів’є (5 vs 2), холодець - олів’є (3 vs 4). Тобто шуба попарно
перемагає будь-яку іншу альтернативу (є переможцем за Кондорсе), але програє в
результаті.
Також ця система вразлива до стратегічного голосування. Якщо двоє перших виборців
вирішать: Та ну його те олів’є, ми будемо голосувати за шубу, щоб тільки не холодець.
Тобто відхилення від щирого голосування (за перший вибір) дає їм більший виграш.
Ну і звичайно можлива ситуація, коли невелика група вибирає переможця, оскільки інші
поділені між конкуруючими кандидатами.

Відносна більшість з двома турами


Логічно запитати, а давайте якось "підкрутимо" цю відносну більшість щоб було краще.
Наприклад, візьмемо відносну більшість з другим туром - дуже знайома нам система. Але вона
теж вразлива до великої кількості парадоксів і маніпуляцій (тут опишемо лише декілька).

Приклад. Вибори на острові Скарбів.

виборці (кількість)
3 2 4 2 4 2

Капітан Капітан
1 Доктор Лівсі Доктор Лівсі Джим Джим
Смолет Смолет

Капітан Капітан Капітан


2 Доктор Лівсі Джим Доктор Лівсі
Смолет Смолет Смолет

Капітан
3 Джим Джим Джим Доктор Лівсі Доктор Лівсі
Смолет

Доктор Лівсі є переможцем Кондорсе. Дійсно:

Доктор Лівсі - Джим (9 : 8)

Доктор Лівс - Капітан Смолет (9 : 8)

Але в другий тур проходять (рахуємо перші місця) Джим і Капітан Смолет (по 6).

В другому турі розгромно перемагає Капітан (11 : 6) (Парадокс переможця за Кондорсе)

А от якщо Джим зніме кандидатуру, то все вирішиться в першому турі.

Доктор Лівсі - Капітан Смолет (9 : 8). (Залежність від нерелевантних альтернатив)

Найбільш вражає те, що ця система не є монотонною. Припустимо, що двоє останніх виборців


вирішують збільшити свою підтримку Капітану і ставлять його на перше місце. Як зміниться
результат?

Ну тепер в другий тур проходять вже Доктор Лівсі і Капітан Смолет, тому Доктор Лівсі стає
переможцем. Ще раз: ми додали голосів переможцю, а він в результаті програв!

Отже, додамо у перелік бажаних властивостей

властивість 2. Монотонність (М).


властивість 3. Переможець за Кондорсе (ПК). Якщо є єдиний переможець попарних
голосувань, то він має бути переможцем.
властивість 4. Незалежність від нерелевантних альтернатив (ННА)

Парування з вибуванням.
Парування з вибуванням застосовується, наприклад, в американському конгресі при розгляді
законопроектів. Існує чіткий порядок, який визначає як проходить законопроект. Для такої
системи можливий парадокс другорядного переможця - це ситуація, коли результатом
голосування є альтернатива, яку всі вважають гіршою за іншу. Звучить дивно? Припустимо, що
троє учасників зібрались випити і вибирають між чотирма варіантами. Їх відношення до них
задається так:

Перший: горілка < пиво < коньяк < вино

(тобто вино на першому місці, коньяк на другому і т.д.)

Другий: пиво < коньяк < вино < горілка


Третій: коньяк < вино < горілка < пиво

І треба швидко знайти прийнятний для всіх варіант. Вони вирішують голосувати альтернативи
попарно, відкидаючи ті, які набрали меншість голосів. Кожен голосує щиро, у відповідності до
свого відношення.

1. Спочатку вони голосують вино чи горілка. Двоє вважають, що горілка краще за вино, тому
вино відпадає.
2. Далі горілку голосують проти пива. Двоє вважають, що пиво краще за горілку, тому
залишається пиво.
3. Нарешті пиво проти коньяку. Двоє вважають, що коньяк краще, отже всі йдуть пити
коньяк.

Але чекайте, ВСІ троє насправді думають, що вино краще за коньяк! Виходить, що
запропонована система голосування не змогла вибрати альтернативу, яку всі б хотіли більше
ніж отриманий результат.

Властивість яка порушується тут називається Парето оптимальність. Це п’ята властивість яку
б ми хотіли бачити в ідеальній системі голосування.

(далі будуть інші, більш складні системи голосування)


Олексій Ігнатенко: Теорія ігор і системи
голосування. Частина друга: Кондорсе
проти Борда
Теорія ігор і системи голосування. Частина
друга: Кондорсе проти Борда
7 місяців тому
Наука
2 809
124
3
6

Abstract
Про наукове суперництво видатних вчених, парадокс Кондорсе і його систему голосування. Про
систему Борда, вченого, який придумав метр і як його виміряти та маніпуляції. Про систему
голосування, яка використовується зараз в Linux та Wikipedia і скандал в Кірібаті.

“Я збирався сказати, — ображено мовив Додо, — що найкраща штука, щоб


висохнути, це Партійні Перегони ... Додо усе влаштував… Спершу він намітив
маршрут — таке собі коло («Насправді форма не має значення», — запевнив Додо),
а тоді розташував усе товариство тут і там уздовж дистанції…. кожен починав бігти,
коли йому спадало на думку, й так само сходив з дистанції, коли йому було до
вподоби … після півгодинки біганини, коли всі вже майже повністю висохли, Додо
несподівано вигукнув:— Перегони закінчено! Усі скупчилися довкола нього,
відсапуючись та запитуючи: «Ну, так хто ж переміг?». Щоб відповісти на це
запитання, Додо був змушений поринути в тяжкі роздуми й довгенько стояв,
притиснувши пальця до чола … Перегодом Додо сказав:— УСІ перемогли, й усі
мають отримати призи.”
Аліса в Країні Див

У попередній публікації ми закінчили на ідеях, які важливо підкреслити:

1. Для системи двох альтернатив голосування абсолютною більшістю (більше половини “за”)
має хороші властивості, і фактично тому застосовувалося на практиці з часів афінської
демократії.
2. При перенесенні методу для випадку більшої кількості альтернатив виникають парадокси,
втрата властивостей. Коротше кажучи, результат нам категорично не подобається.

Історичний відступ. Цікаво, що хоча абсолютна більшість є для нас очевидним вибором, до
греків зазвичай застосовувалось одностайне схвалення. Ну дійсно, адже якщо за вождя або
царя проголосував 51 відсоток, це ж значить, що 49 відсотків - проти? І що з ними робити тоді?
Тому при оголошенні нового лідера схвалення відбувалось бряцанням мечей по щитам, або
схвальними вигуками, щоб зробити атмосферу повної підтримки. Якщо ж якась група осіб
виступала проти, то після коротких передвиборчих процедур, переможці викреслювали невдах
зі списків виборців, змивали кров і проводили переголосування.

Слід зазначити, що це досить звична річ для математики, коли при узагальненні на більшу
розмірність частина властивостей втрачається. У цьому разі перед дослідником виникає
декілька можливих варіантів, кожен з яких зберігає щось важливе з попереднього методу.
Проблема в тому, які ж властивості зберегти? Яка властивість найважливіша для нас?

Система Кондорсе
Після Греції і Риму наступний бурхливий розвиток систем голосування стався у
передреволюційній Франції. Саме тоді Марі Жан Антуан Ніколя де Каріта, маркіз де Кондорсе
(або просто Ніколя Кондорсе) опублікував в 1784 році есе про теорію виборів. Кондорсе був
визнаним математиком, членом французької академії наук (і інших), автором трактатів з
інтегрування. Кондорсе також дуже переймався питаннями справедливості і моралі, писав
памфлети і публіцистичні статті. Вважається, що він був першим, хто почав застосовувати
математику для аналізу суспільних процесів. Його робота була відповіддю на ідею виборчої
системи Борда (про нього далі), яка була опублікована трохи раніше.

Марі Жан Антуан Ніколя де Каріта, маркіз де Кондорсе

Пропозиція Кондорсе полягала у використанні переваг абсолютної більшості: потрібно просто


запропонувати до голосування всі можливі пари альтернатив і спитати виборців про їх
відношення до кожної. Альтернатива, яка переможе в усіх парах, стає очевидним переможцем.

Згадаємо приклад про напої з попередньої статті (без останнього виборця).

виборці

1 чай кава чай кава сік

2 кава чай сік сік чай


3 сік сік кава чай кава

Нагадую, що кожен стовпець відповідає одному виборцю. Для обчислення створимо всі
можливі пари:

1. чай - кава;
2. чай - сік;
3. сік - кава.

Тепер кожну пару потрібно проголосувати.

Чай вище за каву у 2 виборців і нижче у 3, тобто рахунок у парі чай - кава 3:2.

Чай вище за сік у 3 виборців і нижче у 2, тобто рахунок у парі чай - сік 3:2.

Сік вище за каву у 2 виборців і нижче у 3, тобто рахунок у парі сік - кава 2:3.

В результаті чай перемагає в усіх парах, тому він має бути оголошеним переможцем. Це суть
ідеї Кондорсе. Цей метод, як це часто буває, не був придуманий Кондорсе, він описаний ще в
трудах Миколи Кузанського (1401 - 1464) в контексті виборів германських монархів. Заслуга
Кондорсе в іншому: він сформулював проблему, яка отримала назву парадокс Кондорсе.

Розглянемо приклад.

Нехай є рада (міста, села, області), яка ухвалює рішення щодо розподілу коштів. І склад ради
такий: Ліва партія 3 місця, Центристи 4 місця, Права партія 5 місць. Є три можливих напрямки
фінансування: здоров’я, безпека та освіта. У кожної партії є своє бачення важливості цих
напрямків:

пріоритет ліві (3 голоси) центр (4 голоси) праві (5 голосів)

1 освіта здоров’я безпека

2 здоров’я безпека освіта

3 безпека освіта здоров’я

Тобто праві вважають, що найперше потрібно фінансувати безпеку, потім освіту і здоров’я в
останню чергу.

Очевидно, якщо поставити всі альтернативи на одне голосування (відносна більшість), то


переможе безпека (5 голосів), в той же час 7 депутатів (більше половини) вважають, що
здоров’я важливіше за безпеку, просто вони не можуть дійти згоди, фінансувати освіту чи
здоров’я.

Застосуємо ідею Кондорсе, для цього утворимо пари.

Безпека перемагає освіту (9 : 3), і потім програє здоров’ю (7 : 5).

Освіта перемагає здоров’я (8 : 4).

Тобто переможця за Кондорсе не існує, але це півбіди. Виникає циклічна структура як у грі
камінь-ножиці-бумага. Взагалі виходить, що порушується транзитивність “сили” альтернатив:
здоров’я перемагає безпеку

безпека перемагає освіту

освіта перемагає здоров’я

При цьому всі уподобання окремих виборців є транзитивними! Тобто кожен з них окремо може
визначити, що найкраще, а група (з таким правилом вибору) - вже ні.

Нагадую, що транзитивність - це властивість відношення (або системи уподобань), така, що


якщо А краще за Б, а Б краще за В, то А краще за В.

Наприклад, відношення “більше” для дійсних чисел транзитивне. А відношення підлеглості у


феодалізмі не завжди (оце саме “васал мого васала - не мій васал”).

Це мабуть найбільш важлива ідея, сформульована Кондорсе: при застосуванні правила


абсолютної більшості для визначення переможця у попарних “змаганнях” для більш як двох
альтернатив уподобання групи втрачають транзитивність і виникає парадокс Кондорсе (навіть у
дуже простих ситуаціях для трьох альтернатив).

Реальні випадки парадоксу Кондорсе


Чи зустрічається парадокс Кондорсе у сучасному житті? (Спойлер: теоретично так, але
практично досить рідко). Випадки появи цього парадоксу в американському політичному
процесі є джерелом публікацій і суперечок. Розглянемо один з них.

Процедура ухвалення нового закону в американському Конгресі складна і формалізована.


Один або декілька законів об’єднуються в білль, який передається на розгляд відповідному
комітету. Далі депутати можуть подавати поправки до білля, поправки до існуючих поправок,
альтернативний білль і поправки до альтернативного білля. Таким чином, протягом процедури
розгляду в залі можливо ШІСТЬ різних потенційних законів: статус кво (те що зараз),
рекомендований комітетом білль, білль з поправкою, білль з поправленою поправкою,
альтернативний білль, альтернативний білль з поправкою.

Процедура вимагає голосувати їх у певній послідовності: третій варіант проти четвертого, потім
п’ятий проти шостого. Потім переможці паруються, і білль, що отримав підтримку, голосується
проти статус кво, переможець стає новим статусом кво.

Така система дає можливість спробувати впливати на процес ухвалення за допомогою “вбивчої
поправки”, тобто поправки, яка створює парадокс Кондорсе. Для цього потрібно виконання
трьох умов:

1. Білль, що пропонується, перемагає статус кво


2. Поправка перемагає оригінальний білль
3. Поправка програє статусу кво

Досить рідкісне поєднання факторів, але вважається, що “вбивчі поправки” існують, наприклад,
в історії американського Конгресу їх нараховують до десяти (цілі публікації присвячені пошуку
таких ситуацій).

Одна з найбільш яскравих це Поправка Пауела (1956 рік). Президент Ейзенхауер зібрав 1.5
мільйона доларів (на той час значні кошти) на підтримку місцевих шкіл по усій країні.
Вважалося, що білль має пройти, як ніж крізь масло: хто буде голосувати проти допомоги
школам? Але Пауелл запропонував поправку, яка відсікала школи з сегрегацією від допомоги.
Мотивація була наступна: південні штати не хочуть припиняти свою практику, отже федеральні
кошти не повинні це підтримувати. Пауелл сам був афро-американцем і демократом. Він
очолював комітет з освіти і висував цю поправку до всіх законів, що стосувались коштів
федерального бюджету.
Адам Клейтон Пауелл молодший

Його поправка розколола конгрес. Частина республіканців і північних демократів голосували за


неї (і цього вистачило для того, щоб вона вибила оригінальний білль), всі південні демократи
були проти. Але потім білль з поправкою не отримав підтримки проти статус кво і загинув.

Система Борда
Найпринциповіший науковий суперник Кондорсе, Жан-Шарль шевалье де Борда був класичним
вченим того часу: інженер, фізик, математик, геодезист і морський офіцер. Можливо, вершиною
його діяльності було головування в комісії, де зібрались такі знаменитості: Лавуазьє, Кондорсе,
Лаплас, Монж, Кулон та Лагранж. Мета комісії була стандартизувати систему вимірів. І саме
Борда запропонував схему виміру і назву “метр”. Взагалі Борда був більш інженерно-
орієнтованим, тому він хотів привнести у вибори точність чисельних методів.

Жан-Шарль шевалье де Борда

Проблема, яку хотів розв’язати Борда, називається розщеплення голосів, тобто ситуація з
прикладу попередньої статті:

виборці (кількість)

2 2 3
1 олів’є шуба холодець

2 шуба олів’є шуба

3 холодець холодець олів’є

Ми вже знаємо, що переможець за системою відносної більшості - холодець (3 голоси). Це


сталось тому, що більша група виборців (4 голоса) поділена (розщеплена) між іншими
альтернативами порівну.

Система голосування, яку запропонував Борда, є ефективним замінником голосування пар і


полягає в обчисленні “рейтингу” альтернатив. Кожен виборець створює перелік: яка
альтернатива на першому місці, яка на другому і т.д. Якщо у нас є m альтернатив, то за кожне
перше місце альтернатива отримує m - 1 балів. За кожне друге m - 2 бал і т.д. За кожне останнє
- 0 балів.

За системою Борда:

олів’є отримує 2 перших місця, 2 других місця і 3 третіх місця, тобто 2*2 + 2 = 6 балів.

шуба отримує 2 перших місця, 5 других місць, тобто 2*2 + 5 = 9 балів.

холодець отримує 3 перших місця, 5 останніх місць, тобто 3*2 = 6 балів.

Перемагає шуба (і вона є також переможцем за Кондорсе для цього прикладу).

Якщо у нас є дві альтернативи, то система Борда - це те саме, що і абсолютна більшість. Для
більшої кількості альтернатив вона дозволяє повніше відобразити відношення до всіх
кандидатів, а не тільки до першого місця. Це страхує від появи кандидата, який не подобається
багатьом, але має підтримку достатньої групи для перемоги відносною більшістю за умов
розщеплення голосів між іншими. Також вона проста в обчисленні, набагато швидша за
голосування всіх пар (уявіть, якщо альтернатив більше 10). В 1784 році ця система була
затверджена для виборів нових членів Академії Наук.

Як і система Кондорсе, система Борда була придумана до нього. Є відомості, що вона


застосовувалась в римському Сенаті в 2 ст. н.е. Пізніше ця система і система Кондорсе
обговорювались в трактаті каталонського вченого Рамона Лулського “Мистецтво виборів”
(1299).

Однак у цієї системи був суттєвий недолік, який Борда не помітив. Давайте розглянемо
конкретний приклад. Припустимо, вибирається галузь для позачергового додаткового
фінансування і депутати формують список пріоритетів.

кожен стовпець - один депутат

армія медицина культура армія медицина культура армія

наука армія медицина наука армія медицина наука

культура наука армія культура наука армія культура


медицина культура наука медицина культура наука медицина

За системою Борда результат наступний:

1. Армія 3*3 + 2*2 + 2 = 15 балів (3 перших місця, 2 других місця, 2 третіх місця)
2. Медицина 2*3 + 2*2 = 10 балів (2 перших місця, 2 других місця)
3. Культура 2*3 + 3 = 9 балів (2 перших місця, 3 третіх місця)
4. Наука 3*2 + 2 = 8 балів (3 других місця, 2 третіх місця)

Також можна зазначити, що армія - переможець за відносною більшістю. Переможця за


Кондорсе немає.

Але тепер припустимо, що внаслідок якихось подій потреба в додатковому фінансуванні армії
пропадає і вона зникає з цього переліку. Логічно припустити, що перше місце перейде до
медицини? Давайте розберемось:

кожен стовпець - один депутат

наука медицина культура наука медицина культура наука

культура наука медицина культура наука медицина культура

медицина культура наука медицина культура наука медицина

Медицина: два перших місця + два других місця + три третіх місця = 6 балів (для трьох
альтернатив перше місце дає 2 бали)

Культура: два перших місця + три других місця + два третіх місця = 7 балів

Наука: три перших місця + два других місця + два третіх місця = 8 балів

І наука перемагає, хоча вона і була остання в попередньому раунді! (це мрії звичайно).

Цей парадокс має назву парадокс неявки. Система Борда також вразлива до деяких інших
парадоксів, але є і інша причина, яка зруйнувала використання цієї системи. Цією системою
дуже просто маніпулювати: потрібно просто розташовувати свої уподобання не щиро, а
“топити” найбільшого конкурента на найнижчу позицію. Розглянемо модифікований приклад.

виборці (кількість)

4 3

1 олів’є шуба

2 шуба олів’є

3 холодець холодець
Тут всі не люблять холодець, у нього 0 балів. За системою Борда:

олів’є отримує 4*2 + 3 = 11.

шуба отримує 3*2 + 4 = 10.

Тобто олів’є перемагає, якщо все чесно. Але припустимо, що 3 останніх виборці, знаючи
уподобання інших, поставили олів’є на останнє місце. В цьому разі:

олів’є отримує 4*2 = 8.

шуба отримує 3*2 + 4 = 10.

холодець отримує 3.

Перемагає шуба, і це настільки просто, що де б не застосовували цю систему, люди починали


поводити себе цілком однотипно - топити найбільших конкурентів. Це сталося і на виборах
нових академіків у Франції. Коли Борда повідомили про цю особливість, він вигукнув свою
знамениту фразу: “Моя система призначена лише для чесних!”. У 1800 році в Академію Наук
завітав перший консул Наполеон Бонапарт. Йому вистачило 5 хвилин на ознайомлення і перше
ж його рішення заміняло систему Борда на абсолютну більшість (якщо ніхто не набрав 50%+,
місце залишалось незайняте).

Забуття і нове життя систем Борда і


Кондорсе
Кондорсе загинув в результаті революції, яку він наближав і вітав. Його проект конституції з
гарантією базових громадянських прав не сподобався Робесп’єру. Кондорсе також протестував
проти страти королівської сім’ї. Таке якобинці не пробачили, Кондорсе був оголошений
ворогом, переховувався в лісах. Врешті-решт, його спіймали і кинули у в’язницю, де він помер.
Усе, що залишилось після, це книга, у якій система Кондорсе виявилася замкненою надовго.

Борда пережив терор і помер у віці 65 років в Парижі. Але його роботи з систем голосування
теж були забуті.

В 1873 році британський математик Чарльз Латвідж Доджсон почав досліджувати виборчі
процедури. Він перевідкрив (знову) систему Борда і парадокс Кондорсе. Вважається, що в
одній зі своїх книжок він зобразив цей цикл в алегоричній формі бігу по колу (див. епіграф).
Книжка називалася “Аліса в Країна Див”. Доджсон запропонував декілька способів для
вирішення проблеми циклів, але всі вони були невдалими. Пізніші спроби (в основному не дуже
вдалі) були сконцентровані на тому як покращити систему Кондорсе у випадку, коли виникають
цикли.

Однак, декілька десятиліть тому ситуація змінилася. Зникла одна з перепон на шляху
використання системи Кондорсе - витрати часу на процедури парування і підрахунок, які тепер
можливо автоматизувати. Також утворилися добровільні об’єднання програмістів, які
створювали вільні програмні продукти. Один з важливих елементів таких комьюніті -
врахування голосу кожного учасника. У 2000 році комьюніті Debian project вирішило провести
дослідження для визначення найкращої системи для внутрішнього голосування. Після трьох
років Debian почав використовувати модифіковану систему Кондорсе, назва якої радує душу
кожного кодера : cloneproof Schwartz sequential dropping, коротко CSSD або метод Шульце (там
є перелік всіх середовищ, які використовують цей метод. І цей перелік вражає, зокрема там
Debian, Ubuntu, TopCoder, Wikipedia (на деяких мовах), 11 піратських партій різних країн).

Метод Шульце працює, як Кондорсе за відсутності циклів. За наявності циклів він намагається
відкинути “слабші” зв’язки. Урешті-решт, цикл розривається і залишається один переможець.
Тобто на сьогодні можна сказати, що метод Кондорсе активно використовується в кіберпросторі
і, можливо, скоро перейде у реальний світ.

Система Борда принята офіційно у двох країнах: Науру і Кірібаті. Вона працює там з 70хх років і
відмітилась декількома скандалами. Зокрема, на виборах 1991 року представники правлячої
партії поставили свого головного конкурента на останнє місце. Тепер у вчених є предмет
дослідження, як поводяться виборці в цих умовах, на цю тему навіть серйозні статті пишуть
(наприклад така робота пруф). І все таки система Борда не популярна. Останнім крупним
вченим, який наразі захищає її є Дональд Саарі. Його аргументація по суті базується на тому,
що складні соціальні відносини не можна зводити до системи попарних “дуелей”. Крім того,
система Кондорсе так само вразлива до маніпуляцій і парадоксів (хоча те, що маніпулювати
системою Борда легше, це факт). Можливо з часом щось зміниться і заочна дуель Кондорсе і
Борда продовжиться.

(далі буде про Ерроу і його теорему)


Олексій Ігнатенко: Теорія ігор і системи
голосування. Частина третя: Теорема Ерроу
- неможливість чи можливість?
Теорія ігор і системи голосування. Частина
третя: Теорема Ерроу - неможливість чи
можливість?
7 місяців тому
Наука
2 524
117
3
5

Коли ціле - більше, ніж сума частин

Відблиск неможливості
Кеннет Ерроу з дитинства любив читати. Коли його карали за щось і за американською
традицією того часу зачиняли в кімнаті, він спокійно брав з полички том енциклопедії і поринав
у читання. Тому з часом йому придумали інше покарання: виганяли з дому гратися на вулиці.
Ерроу був студентом Оскара Моргенштерна (одного з батьків теорії ігор), досліджував
економіку. Але найважливішим моментом його життя стало отримання роботи у RAND. (RAND -
науково-дослідний відділ корпорації Douglas Aircraft, який вербував на роботу
найперспективніших вчених того часу. Така собі перша в світі спроба зробити фабрику
досліджень).

Там працювали Нейман і Неш, Айзекс і Белман. Там народився системний аналіз, лінійне і
динамічне програмування, метод Монте-Карло та інші. Цікаво, що більша частина отриманих
досліджень була “побічним ефектом”, який виникав від співробітництва і спілкування такої
кількості яскравих науковців.

Ерроу взяли на позицію статистика-математика для дослідження розташування американських


підводних човнів з ядерними ракетами, але про цю роботу нічого особливо невідомо. Одного
разу Олаф Хелмер (логік і філософ) висловив у розмові з Ерроу таку проблему:

“Сполучені Штати Америки - це абстракція. А от люди, виборці - це реальність, їх цінності


впливають на вибори і рішення. Але яким чином цінності окремих особистостей формують
цінності країни?”. Ерроу відповів: “Та це досить просто, я читав нещодавно щось на цю тему,
думаю, що можна застосувати певні механізми агрегації”. Хелмер запропонував йому написати
щось на цю тему.

Коли Кеннет сів за роботу, він зрозумів, що не все так просто. Поступово робота захопила його,
і в 1948 році він нарешті презентував свій результат. Пізніше цей результат став основою його
дисертаційної роботи, книги, яка стала найцитованішою роботою за все його життя, і однією з
причин присудження нобелівки з економіки. Ідея була проста: сформулювати декілька
очевидних математичних властивостей систем голосування, і знайти ті системи, які їм
задовільняють. Результат був несподіваним: для пари дуже простих властивостей єдина
система, яка підходила, була диктатура. Коли Ерроу додав властивість “і щоб не диктатура”,
жодної системи не залишилося.

Трохи забігаючи наперед, скажу, що результат - теорема Ерроу, - хоча і був по суті негативним,
створив цілу область досліджень (теорію соціального вибору). Після публікації дослідження
сконцентрувалися на напрямках, які доводили схожі результати для інших ситуацій або
пробували вийти за умови теореми (створити інші системи голосування). Так чи інакше,
теорема стала таким собі каменем на роздоріжжі, який кожен має пройти, і вирішити, куди ж іти
далі.

Важливо підкреслити, що теорема Ерроу є математичним результатом з усіма плюсами і


мінусами. Плюси в тому, що за виконання вхідних припущень вона завжди вірна. Мінус в тому,
що інтерпретації результату і вхідних припущень можуть бути різними і залежать від розуміння
конкретного науковця чи читача.

Так нерідко зустрічаються коментарі в дусі: “Ідеальна (або справедлива) система голосування
не існує” або “Теорема Ерроу прирікає нас на диктатуру” і навіть “Демократія неможлива, і це
довів Ерроу”.

Давайте розбиратися, що ж доведено.

Теорема Ерроу
Перед формулюванням теореми важливо визначити припущення і їх значення.

1. Кожен виборець має повні транзитивні уподобання. Повнота означає, що виборець має
визначити відношення до всіх альтернатив. Транзитивність означає, що якщо А краще за
Б, а Б краще за В, то обов’язково А краще за В.
2. Вимагається транзитивність результату виборів. По суті, це означає, що виборча система
повертає упорядкований список альтернатив, вершина якого - переможець. Таким чином,
забороняються цикли в результуючому векторі і завжди є переможець.

Ці два стартові припущення цілком зрозумілі. Далі йдуть ще дві властивості.

1. Парето. Якщо ВСІ виборці вважають альтернативу А кращою за альтернативу Б, то в


результаті альтернатива А має бути краще за альтернативу Б. Зокрема, якщо всі
вважають, що кандидат П краще всіх інших, то він і має перемогти.
2. Незалежність від нерелевантних альтернатив (ННА). Це мабуть найбільш важлива
властивість. Формальне визначення таке: співвідношення між А та Б в результуючому
векторі має визначатись тільки відношенням виборців до А та Б, наявність чи відсутність
інших альтернатив не має на це впливати. По суті питання ілюстрацією є історія (не знаю,
наскільки реальна) про філософа Сідні Моргенбессера, відомого своєю дотепністю, якому
офіціант запропонував на вибір десерт: яблучний або чорничний пиріг. Моргенбессер
вибрав яблучний. Через декілька хвилин офіціант підійшов знову і сказав: “Вибачте, я не
помітив, що у нас є ще вишневий пиріг”. На що філософ незворушно відповів: “У цьому
разі я буду чорничний”. (більше історій тут) Очевидно, що вишневий пиріг є
нерелевантним для вибору між яблучним і чорничним, але його наявність спричинила
зміну вибору. Ерроу вимагає у системи виборів бути незалежною від таких впливів.

Нарешті ми можемо сформулювати велику і жахливу її.

Теорема Ерроу. Для ситуації трьох і більше альтернатив єдина система голосування, що
задовольняє властивостям Парето та Незалежності від нерелевантних альтернатив є
диктатура.

Ця теорема дійсно “вибухнула” в 50-і роки. Нечасто ціла область науки виникає від одного
негативного результату. Чому негативного? Бо Ерроу додав ще одну властивість, яку б ми
хотіли від результату “і щоб була не диктатура”, тоді виходить, що жодна система не підходить.
Результатом стала поширена думка, сформульована Самуельсоном (також нобеліатом з
економіки): “Ерроу показав раз і назавжди, що ідеальна система голосування неможлива”.

Але диявол в деталях, як і завжди.

Той, хто в деталях


По-перше, теорема Ерроу стосується лише ситуацій, коли альтернатив більше двох. Другий
тур президентських виборів, голосування законів (де альтернативи - “за” і “проти”), голосування
за умов двопартійної системи (коли всі інші - малопопулярні) не потрапляє під дію цієї теореми.

По-друге, диктатура за Ерроу - це не стариган у військовій формі а-ля Зімбабве. Тут швидше
диктатура в класично-римському стилі: коли все погано, то призначаємо диктатора. Як він
скаже, так і буде. Тобто диктатура в цій теоремі означає, що вибирається один виборець,
уподобання якого і дорівнюють функції соціального вибору. Цікаво, що диктатура в цьому
розуміння є цілком “законним” способом визначення переможця. Дійсно:

1. Вона завжди дає результат і цей результат завжди транзитивний.


2. Виконується властивість Парето. Є такий жарт про Радянський союз з американської
книжки про вибори: “Якщо всі (з диктатором Сталіним включно) голосують, щоб народ
отримав безкоштовну горілку, то всі отримують горілку. Якщо всі, крім Сталіна, хочуть
безкоштовну горілку, то це вже зовсім інша історія.” Але, як видно з цього жарту, Парето
для диктатури виконується.
3. ННА також виконується для диктатури, тому що по суті колективний вибір зводиться до
індивідуального. А індивідуальні уподобання є транзитивними.
По-третє, теорема Ерроу стосується ординальних систем (там, де виборці вибирають порядок
розташування альтернатив: вище означає краще) з правилом одна людина - один голос. Хоча
це і охоплює майже всі виборчі системи, що використовуються в світі, існують і інші варіанти,
про які поговоримо нижче.

По-четверте, Ерроу ніяк не враховує можливість маніпуляцій або стратегічного голосування. У


його теоремі вважається, що виборці голосують щиро.

Нарешті головний результат теореми можна сформулювати так: будь-яка існуюча система, яка
не диктатура (і задовольняє вхідним визначенням), ДЛЯ ЯКОГОСЬ ВИПАДКУ не є Парето або
ННА. Але ж це не означає завжди, в цьому і є відмінність математики від життя. Якщо ми
зрозуміємо, що іноді (наприклад раз на 100 років) у нас буде порушуватись одна з
властивостей, можливо, це не так і погано? Наприклад, одне дослідження 1992 року показало,
що з 14270 трійок кандидатів тільки 71 створили цикли. Тобто, груба ймовірність парадоксу
Кондорсе 1 з 200, не так вже й багато.

Отже, досить багато АЛЕ перед тим, як оголошувати про неможливість демократії. Тим не
менше, сила теореми не стільки в тому, що вона визначила неможливість “ідеальної” системи
голосування, а у виявленні ПРОБЛЕМИ соціального вибору. Група раціональних людей не
може визначити правило агрегації їхніх уподобань навіть для досить “простих вимог” до цього
правила. Я взяв “прості вимоги” у лапки, оскільки, на думку Дональда Саарі, ННА насправді є
дуже суворим обмеженням. Але перед тим як описати його розуміння проблеми з теоремою
Ерроу опишемо ще декілька результатів, що виникли після появи теореми про неможливість.

Терема Сена і інші парадоксальні


результати
Теорема Сена
Амартія Кумар Сен (ще один нобелівський лауреат з економіки) запропонував модель, коли
деякі учасники (принаймі двоє) мають зробити індивідуальний вибір хоча б однієї пари
альтернатив. Сен назвав цю властивість Мінімальним лібералізмом. Звучить, як
абракадабра, аде це досить реалістична модель для засідання комітетів або рад. Приклад.
Припустимо, що певна рада з двох професорів кафедри конярства та бджільництва оголосили
конкурс на заміщення вакантної посади доцента. Є три претенденти.

Ім’я Публікації з конярства Публікації з бджільництва

А 7 5

Б 3 9

В 2 7

При цьому А та Б подають документи на конярство, тому їх оцінює професор Копитко, а А і В


подають документи на бджільництво (так, А подає документи відразу на два напрямки) і їх
долю вирішує професор Прополіс. Професори мають визначити, який претендент краще а який
гірше і вони ухвалюють рішення виключно по кількості публікацій. Якщо вони погоджуються
щодо певного відношення альтернатив, то це переноситься у функцію соціального вибору.
Найкраща альтернатива обирається у якості переможця. Виявляється, що:
Професор Копитко вирішує, що А краще за Б у конярстві;
Обоє одноголосно вирішують, що Б краще за В взагалі;
Професор Прополіс вирішує, що В краще за А в бджільництві.

Отримуємо не транзитивну систему уподобань А краще Б, Б краще В, В краще А…

Теорема Сена. Для системи з трьох і більше альтернатив не існує системи ухвалення рішень,
яка б задовільняла властивостям Парето та Мінімального лібералізму.

Список Ліста
Філософ Крістофер Ліст запропонував ще один парадокс. Отже, приклад.

На тій же кафедрі конярства та бджільництва проводять екзамени з конярства та бджільництва.


Троє екзаменаторів відмічають, пройшов студент екзамен чи ні. Якщо екзаменатор вважає, що
студент завалив хоча б один іспит, він ставить загальну оцінку незадовільно. Доля студента
вирішується більшістю голосів.

Приклад рішення щодо іспитів

іспит

професор конярство бджільництво загальна оцінка

Кіньяк так так так

Прополіс ні так ні

Копитко так ні ні

Чи пройшов студент? так так ні

Виходить, що більшість вважає, що студент склав обидва іспити, але загальне рішення
негативне - більшість вважає, що він завалив.

Парадокс Анскомб
Елізабет Анскомб, — британський філософ, учениця Вітгенштейна. Парадокс Анскомб
формулюється так:

Чи можливо, щоб більшість була у меншості по більшості питань? Виявляється - так, це


можливо.

Розглянемо приклад.

Виборець питання 1 питання 2 питання 3

А Так Так Ні
Б Ні Так Так

В Так Ні Так

Г Ні Ні Ні

Д Ні Ні Ні

Результат Ні Ні Ні

Виборці А, Б, В складають більшість, яка підтримує спільну позицію більшістю по всіх питаннях
(2 проти 1), але які програють меншості Г і Д по всіх питаннях.

Це, до речі, приклад того, як політична коаліція може бути нездатною провести жодне питання,
хоча члени коаліції підтримують кожне питання більшістю голосів. І саме тому для партій так
важливо підтримувати дисципліну з голосуванням своїх депутатів.

Суть проблеми
Виявляється, що всі ці парадокси є проявами старого знайомого - парадоксу Кондорсе, або
циклу Кондорсе. Цикл, тобто ситуація, коли для групи виборців А краще за Б, Б краще за В і В
краще за А є природним наслідком зростання розмірності. Це головна ідея Дональда Саарі,
який досліджує це у своїх книгах. Справа в тому, що для двох альтернатив простір рішень є
одномірним, точка відповідає рішенню більшості виборців. А якщо ми додамо ще одну пару,
простір стає вже ЧОТИРИВИМІРНИМ, оскільки для коректного представлення відношення
потрібно задати відношення виборців для кожної з чотирьох можливих пар.

Для того, щоб побороти це “прокляття розмірності” Ерроу і запропонував властивість ННА, яка
фактично розриває зв’язки між парами і зводить задачу до ситуації, коли вони мають бути
незалежні - кінцевий результат для кожної пари залежить лише від відношення до цієї пари.
Але нічого не буває безкоштовно і за це довелось заплатити скороченням можливих функцій
соціального вибору до однієї - диктатури. (Навіть найкращий з можливих Кондорсе-методів,
метод Шульце, порушує ННА). Тобто, це типова ситуація, коли ціле (відношення групи виборців
до альтернатив) є більш складним об'єктом ніж просто набір пар відношень.

Власне це і є інтерпретація теореми Ерроу від Саарі (і вона видається мені обгрунтованою).
Ерроу намагався звести складне переплетення соціальних зв’язків до незалежної системи пар і
отримав у результаті неможливість системи голосування, складнішої за диктатуру. Можливо не
потрібно зводити все до системи незалежних пар? Можливо властивість ННА не має такого
вже значення? І тоді ми можемо знайти інший варіант голосування, який би враховував “волю
виборців”?

Загалом теорема про неможливість спричинила такий бурхливий пошук та створення нових
методів голосування, що можна сказати, що вона більше все таки про нові можливості. І про
них піде мова далі.

Інші варіанти
Чи можливі інші варіанти, які б обходили умови теореми Ерроу? Так, такі системи є:
Approval voting. Голосування схвалення, коли кожен з виборців вибирає всіх кандидатів,
які йому подобаються (і іноді також всіх, які не подобаються).
Інтервальне голосування, коли виборці оцінюють альтернативу за шкалою. Так працює
Амазон і IMDB.
Зважене голосування, коли у одного виборця не один голос.

P.S. Всі імена кафедр, професорів, коней і бджіл, що зустрічаються у цій публікації є
вигаданими. Будь-які збіги випадкові.
Олексій Ігнатенко: Алгоритм розподілу
вступних місць у ВНЗ. Як це працює?
6 місяців тому
Наука
3 351
112
3
7

Нові правила прийому до ВНЗ, які діють з 2018 року, не дуже просто написані (сарказм).

Не занурюючись в деталі, схема така:

1. Кандидати готують всі документи для вступу (складають ЗНО, додаткові іспити і т.д.).
Вступники можуть подати до семи заяв на місця державного та регіонального замовлення
в фіксованих (закритих) та відкритих конкурсних пропозиціях не більше, ніж з чотирьох
спеціальностей. У кожній заяві зазначають її пріоритетність; при цьому показник
пріоритетності 1 (один) означає найвищу пріоритетність. Зазначену вступником
пріоритетність заяв не може бути змінено.
2. ВНЗ формують квоти і визначають кількість місць, які вони цього року мають заповнити та
формують рейтинговий список вступників, який впорядковується:
за конкурсним балом - від більшого до меншого;
за пріоритетністю заяви від 1 до останньої;
за середнім балом додатка до документа про здобутий освітній (освітньо-
кваліфікаційний) рівень - від більшого до меншого.
3. Списки вступників, рекомендованих до зарахування … перевіряються на предмет
достовірності поданих вступниками відомостей та дотримання передбачених цими
Умовами вимог ... оприлюднюються шляхом розміщення на інформаційних стендах
приймальних комісій та веб-сайті закладу вищої освіти
4. Магічний алгоритм розподілу (додаток 6) визначає. хто куди потрапляє.

Можливо, несподівано, але цей алгоритм теж відноситься до теорії ігор, тому в цій статті
спробую пояснити, чому саме такий алгоритм обраний і як він працює. Я намагався зробити
пояснення максимально простим, тому воно буде довгим і поступовим з прикладами.

Проблема парування

В 1962 році була надрукована стаття з дещо дивною назвою: “Подача документів у коледж та
стабільність шлюбу” за авторством Девіда Гейла і Ллойда Шеплі. Як пізніше згадував Гейл,
основним мотиватором стала поява в 1960 році в журналі New Yorker публікації про проблеми
вступу до Йельського Університету. Бажаючі вступити подавали документи в різні навчальні
заклади, і вступна комісія проводила відбір. Проблема полягала в тому, що у приймальної
комісії немає можливості зрозуміти, наскільки пріоритетний даний заклад для претендента, а у
претендента - оцінити свої шанси у конкуренції з іншими. В результаті виникає базова дилема:

Університет може вибрати рівно стільки кандидатів, скільки він може навчити, але якщо вони
пізніше відмовляться (бо пройдуть в більш пріоритетні для них заклади), то доведеться
аврально набирати всіх бажаючих або мати недобір. Якщо університет вибере кандидатів з
запасом, і всі вони принесуть документи, то буде переповнення.

Уточнення: звичайно, це стосується західних універів, які тримають репутацію, бо від неї
залежить конкурс, фінансування від спонсорів та пожертви від майбутніх успішних випускників.
Кандидат має вибирати між потужними універами з конкурсом і ризиком з одного боку та
слабкими універами з гарантованим вступом - з іншого. Таким чином, ситуація перетворюється
на гру “вгадай, куди поступати”. Нагадаю, що гра виникає, коли визначені гравці, їх стратегії і
виграші. Гравцями в даному випадку є абітурієнти і приймальні комісії ВНЗ. Стратегія - куди
подавати документи. Виграш - це особиста оцінка якості ВНЗ, у який вдалось вступити
відповідно до власного рейтингу.

У ситуації, коли є лише один шанс на вступ (наприклад, якщо законодавчо необхідно подавати
оригінал документу про освіту) виникають можливості для:

нервів;
хабарів;
порішать через дядю;
усяких підготовчих курсів у хороших ВНЗ;
мотивації вчитися (теж ймовірно, але не так сильно, як попереднє).

Врешті-решт, ще є варіант, який я власними вухами почув колись давно в КПІ: “Підем на сварку
[зварювання], там 0.33 людини на місце”.

Таким чином, хороша стратегія абітурієнтів: подача документів в декілька ВНЗ (далі він вибирає
кращий з тих, у які його взяли). Будемо вважати, що кожен знає сам (або його/її мама), який
ВНЗ кращий за інший, тобто визначене відношення кращий-гірший для всіх ВНЗ, у які абітурієнт
подає документи.

ВНЗ знаходиться в ще більш складній ситуації - він вибирає зі списку тих, хто йому підходить,
але не може гарантувати їх згоду.

Необхідно запропонувати алгоритм, який би гарантував “якісне” парування (далі буде


пояснено,у якому розумінні якісне). Саме це й зробили Гейл і Шеплі, цей алгоритм носить їх
імена.

Математична постановка задачі наступна:

є множина абітурієнтів a, b, c, …

є множина ВНЗ A, B, C, …

Кожен абітурієнт і ВНЗ розуміє, хто для нього краще або гірше.

Вибір у парах
Спочатку розглянемо більш просту задачу, яка називається задача про шлюб. Загалом
парування, або matching, є важливим і вживаним алгоритмом, що використовується для
аукціонів з багатьма лотами, у задачах призначення та інших. Тому шлюб тут використовується
у якості ілюстрації складної проблеми. Це спрощення попередньої задачі - ситуація, коли є N
ВНЗ і N студентів і кожному ВНЗ потрібен рівно один студент. Щоб уникнути плутанини, будемо і
далі використовувати цю термінологію.

Наприклад, для трьох студентів і трьох ВНЗ наступні матриці описують відношення переваги.
Одна матриця описує місця пріоритетності ВНЗ за спаданням для кожного абітурієнта.

Уподобання абітурієнтів (кожен стовпець - одна особа)

a b c

1- А 1 - B 1 - B
2-B2-A 2-C

3-C3-C 3-A

Друга матриця описує, як ВНЗ оцінюють абітурієнтів.

Уподобання ВНЗ (кожен рядок - один ВНЗ)

A1-b2-a3-c

B1-a2-c3-b

C1-c2-b3-a

Вже тут виникають проблеми, дійсно давайте розглянемо якесь довільне парування:

А --- а (2 х 1)

B --- b (3 х 1)

C --- c (1 х 2)

(у дужках - місце студента для ВНЗ та місце ВНЗ для студента відповідно)

Чим поганий такий варіант? Майже всі отримали перше або друге місце. І що таке взагалі
хороше парування?

Визначення. Парування є стабільним, якщо не існує двох учасників, які б могли


покращити свої виграші, утворивши нову пару.

Проблема (з запропонованим вище паруванням) в тому, що B і с можуть утворити кращу пару.


Дійсно пара B --- с має індекс 2 х 1, тобто В покращує свій показник з 3 до 2, а с з 2 до 1.
Можливо, тоді таке парування підійде:

А --- а (2 х 1)

B --- с (2 х 1)

C --- b (2 х 3)

Тут b може запропонувати А утворити нову пару, дійсно пара А --- b має індекс 1 x 2. Обоє
покращують свій виграш. Нове парування буде таким:

А --- b (1 х 2)

B --- с (2 х 1)

C --- а (3 х 3)

Тут а запропонує В утворити пару від якої вони виграють. Нарешті парування
А --- b (1 х 2)

B --- а (1 х 2)

C --- с (1 х 2)

є стабільним, оскільки всі ВНЗ отримали свої перші місця і навіть, якщо якийсь з студент захоче
покращити свій вибір, він не зможе знайти пари для такого покращення.

Зазначимо, що тут якість парування визначається саме неможливістю “покращення” для будь-
якої пари, а не, скажімо, більшістю задоволених або відсотком здійснених мрій абітурієнтів.

Це був надзвичайно простий приклад для шести учасників, що ж буде для сотень? Виникає три
очевидних питання:

Чи завжди існує стабільне парування? (спойлер: Так)


Якщо існує, то як його знайти? (спойлер: алгоритм далі)
Чи таке парування єдине? (спойлер: ні, але можна вибрати оптимальне в певному сенсі)

Ллойд Шеплі

Алгоритм Гейла-Шеплі
Алгоритм пошуку стабільної системи на прикладі вступу (поки що для ситуації рівної кількості
ВНЗ і кандидатів та коли кожен ВНЗ набирає одного). Розглянемо більш складний приклад 4 на
4.

Уподобання кандидатів а, b, c, d.

a bc d

АABD

BDAB

CCCC
DBDA

Уподобання ВНЗ A, B, C, D.

Adcab

Bbdac

Cdabc

Dcbad

Перший крок. Кожен абітурієнт подає документи у ВНЗ, який стоїть у нього під першим
номером. Кожен ВНЗ, який отримав більше однієї пропозиції, вибирає одного найкращого
кандидата і відмовляє всім іншим (хто подав заявку до нього у цьому раунді). Кандидати, які не
отримали відмови зберігаються у “списку очікування” цього ВНЗ, інші видаляються і не можуть
більше подаватись в цей ВНЗ.

A BCD
список a b c d
відмова b

b має нижчий пріоритет для ВНЗ А ніж а, тому b відхиляється. Всі інші потрапляють у списки
очікування.

Другий крок.

Кожен кандидат, який отримав відмову, звертається до другого ВНЗ у своєму списку. Кожен
ВНЗ, який отримав більше однієї пропозиції, порівнює нового кандидата з існуючим списком
очікування та вибирає кращого. Кращий залишається у списку, гірший отримує відмову.

ABCD
список a c b d
відмова d
d отримує відмову від D, оскільки прийшов кращий кандидат b.

Третій крок.

Кожен кандидат, який отримав відмову, звертається до наступного ВНЗ у своєму списку. І так
продовжується, поки є кандидати з відмовами.

AB CD
список a c d b
відмова c

Четвертий крок.
A BCD
список a c d b
відмова a

П'ятий крок.

AB CD
список с d a b
відмова a

Шостий крок.

ABCD
список c d a b
відмова

Теорема. Алгоритм Гейла-Шеплі зупиняється за скінченну кількість кроків, його результатом є


стабільне парування.

Девід Гейл

Загальна ситуація

В реальній ситуації є не так багато ВНЗ і багато бажаючих кандидатів, кожен з яких хоче
поступити в один з декількох ВНЗ. Алгоритм Гейла-Шеплі масштабується і на цей випадок.
Власне, його основна частина незмінна:
1. Усі кандидати подаються в ВНЗ, яка є їх першим номером. ВНЗ вибирає кількість
абітурієнтів, яка відповідає квоті, та відмовляє решті. Поточні кандидати потрапляють у
список очікування.
2. Кандидати, що отримали відмову, подаються до наступного ВНЗ в їх списку пріоритетів.
Вони потрапляють у список з попереднього кроку та сортуються за балами.
3. Ситуація повторюється, поки в системі не припиняються відмови. Тобто алгоритм
завершується, коли кожен абітурієнт або потрапив у список очікування, або отримав
відмову від кожного ВНЗ. у який подавався.

Дві очевидні думки з цього приводу:

1. Є сенс заповнювати всі 7 можливих ВНЗ, але відноситись до цього вибору серйозно, бо
потрапити можна в кожен з них (особливо, якщо бали середні).
2. Пріоритет слід писати реальний, це дасть найкращі шанси. Маніпуляції не дадуть ніякого
виграшу.

Приклад.

ВНЗ:

А - квота 3

B - квота 4

C - квота 6

Є 15 абітурієнтів в ці ВНЗ. Уподобання кандидатів наступні (номер - це місце відповідного ВНЗ у


списку пріорітетів):

abcdef ghi j kl mno

A1311223223112 21

B2132132131231 32

C3223311312323 13

Уподобання ВНЗ наступні (номер це місце студента у конкурсі ВНЗ ):

abcd ef g h i j k l m n o

A 1 5 2 4 3 10 6 9 11 7 8 14 12 13 15

B 1 4 2 3 6 14 5 13 12 11 7 8 9 15 10

C 5 2 1 14 6 12 13 7 8 9 10 11 15 3 4

Далі будемо помічати зірочкою тих кандидатів, які отримують відмову.


Перший крок.

A --- a c d k l o ______ A --- a c d - k* l* o*

B --- b e h j m __→ ___B --- b e m j - h*

C --- f g i n __________C --- n i f g

ВНЗ відсортовують кандидатів, залишають квоту і решті відмовляють (зірочки).

Другий крок.

A --- a c d h __________A --- a c d - h*

B --- b e m j k o__→ ___ B --- b e k m - o* j*

C --- n i f g l __________C --- n i l f g

Третій крок.

A --- a c d _________A --- a c d

B --- b e k m__→ ___ B --- b e k m

C --- n i l f g h o j ____C --- n o h i j l - f* g*

Четвертий крок

A --- a c d f _________ A --- a c d - f*

B --- b e k m g__→ ___ B --- b g e k - m*

C --- n o h i j l ________ C --- n o h i j l

П’ятий крок.

A --- a c d m ________A --- a c d - m*

B --- b g e k f __→ ___ B --- b g e k - f*

C --- n o h i j l _______C --- n o h i j l

Шостий крок.

A --- a c d ________ A --- a c d

B --- b g e k __→ ___B --- b g e k

C --- n o h i j l m _____C --- n o h i j l - m*

В результаті m і f не потрапляють нікуди в цьому році. Інші отримують місця відповідно до


останнього парування.

Оптимальність алгоритму

Виникає природне питання: якщо стабільних систем може бути декілька, то, можливо, вони не
однакові. І можна вибрати краще.

Дійсно, стабільна система парування називається оптимальною для абітурієнтів, якщо за нею
кожен з них отримує місце не гірше, ніж за будь-якої іншої стабільної системи.
Теорема. Для будь-якої системи уподобань алгоритм Гейла-Шеплі є оптимальним для
абітурієнтів.

Виявляється, що це не єдине застосування алгоритму.

Донорство нирок

В 2005-2007 роках Алвін Рот застосував ідею алгоритму Гейла-Шеплі до створення ринку
донорства нирок. Справа в тому, що є два типи донорства нирки: звичайне (від людини, яка
загинула в катастрофі, наприклад) та живе, коли людина віддає одну свою нирку і живе з іншою.
Звичайно, це не те, що люди охоче роблять, але це поширена практика, коли від цього
залежить життя близької людини. Проблема полягає в тому, що є два теста: на сумісність крові
та сумісність тканин, провал хоча б одного з них ставить хрест на донорстві.

Отже, є люди, які потребують нирку особливого типу і люди, які готові їм віддати свою, але їх
тип не співпадає. Теоретично можна спробувати знайти іншу пару, що знаходиться в подібній
ситуації, але якщо обидва типи не співпадуть (що дуже малоймовірно), домовитись вони не
зможуть.

В 2003 році в усіх Сполучених Штатах було усього 19 операцій від живих американських
донорів. Алгоритм Рота використовував складне парування, коли утворювалися ланцюжки
донорів і кожен віддавав свою нирку і отримував нирку потрібного типу. Після запуску алгоритму
кількість операцій стрімко зростала: 400 за 2012 рік, 5300 операцій за 2017 рік.

Успіх цих алгоритмів був однією з суттєвих причин присудження нобелівської премії з економіки
в 2012 році Алвіну Роту і Ллойду Шеплі.

Алвін Рот

You might also like