Всем привет! Сегодня я хочу рассказать про самую популярную игру в Теории Игр – Дилемму заключенного. Ее еще иногда называют, дилеммой бандитов. Эта игра является фундаментальной проблемой теории игр.
Сначала лучше всего представить классическое определение данной дилеммы:
Полиция поймала двух преступников и развела по разным камерам. Следователь предлагает каждому из них 2 варианта: заложить своего подельника или молчать.
4 варианта развития событий:
- Если первый заключенный сдаст второго, а второй будет молчать, то первый выйдет на свободу, а второй получит 3 года тюрьмы;
- Если второй сдаст первого, а первый будет молчать, то второй выйдет на свободу, а первый получит три года;
- Если оба будут молчать, то оба получат по одному году заключения;
- Если оба сдадут друг друга, то каждого посадят на два года.
Можно записать в виде матрицы (таблицы):
Теперь давайте посмотрим в таблицу и подумаем, какой вариант рациональнее всего выбирать каждому заключенному по отдельности.
Посмотрим на эту задачу с точки зрения первого заключенного:
Если второй будет молчать, то мне выгоднее все рассказать и выйти на свободу. А если второй будет говорить, то лучше тоже все рассказать, и получить два года, вместо трех. Получается, что с точки зрения первого заключенного, стратегия говорить наилучшая, независимо от действий второго заключенного.
Теперь с точки зрения второго заключенного:
На самом деле рассуждения такие же. Если первый будет молчать, то лучше сдать его, и выйти на свободу. Если он будет говорить, то тоже лучше говорить и получить 2 года, вместо трех. И у него также получается стратегия говорить наилучшая, независимо от действий первого заключенного.
Получается, если принимать решение рационально и независимо друг от друга, то мы придем к исходу, когда оба заключенных получат по два года тюрьмы, сдав друг друга. Так как они выбирают наилучший вариант для себя. Стратегия предать строго доминирует над стратегией молчать, поэтому вариант «предать/предать» является равновесием.
Хотя, из таблицы видно, что у них есть более оптимальный вариант, получить всего по одному году, вместо двух.
То есть равновесие не ведет к Парето-оптимальному исходу, когда оба получат меньший срок. В этом и есть суть дилеммы.
Примеры дилеммы
Пример №1 Раздел областного бюджета
Есть какая-то область, допустим область N, у нее есть губернатор, и в этой области есть два конкурирующих соседних города, допустим N1 и N2, в каждом свой мэр.
Губернатор приходит к каждому из этих мэров и спрашивает, что вы больше хотите, чтобы я дал вашему городу один миллион долларов на постройку дорог или два миллиона долларов второму городу?
И каждый мэр решает, что выбрать: себе один миллион или соседнему городу два?
Таблица будет выглядеть следующий образом:
Посмотрим на рассуждения первого мэра:
Если второй мэр отдаст мне два миллиона, то я лучше возьму себе еще один и у меня будет 3 миллиона. Если же второй мэр возьмет себе один миллион, то я лучше возьму себе один миллион, чем останусь вообще без денег.
Точно такие же рассуждения и у второго мэра.
И получается в итоге, что оба мэра, рационально рассуждая, приходят к неоптимальному решению – оба получат по одному миллиону, хотя могли бы оба получить по два.
Пример №2 Картель
Представим, что есть какой-то картель, состоящий из двух компаний. Допустим это две фабрики, производящие спички. Они договорились производить определенное количество коробков спичек, и договорились о цене одного коробка.
У каждой из компаний, входящих в картель есть два варианта поведения: придерживаться соглашения, или нарушить его и произвести больше спичек, продать их по более низкой цене, и получить больше прибыли.
Таблица для этого будет выглядеть следующий образом:
- Если обе компании будут соблюдать условия, то обе получат по 10 миллионов рублей прибыли;
- Если обе нарушат, то обе получат по 7 миллионов;
- Если первая нарушит, а вторая будет соблюдать, то первая получит 15 миллионов, а вторая всего 5;
- Если первая будет соблюдать, а вторая нарушит, то первая получит 5, а вторая 15.
Как результат, обе компании, входящие в картель, выбирают доминирующую стратегию (нарушить соглашение) и обе терпят убытки, т.к. товаров на рынке становится больше, цены падают, прибыль снижается.
Таким образом видно, что картель является неустойчивой моделью, и недолговечен, потому что у каждого из его участников есть соблазн предать и получить больше прибыли.
Пример №3 Враждующие страны
Допустим есть две страны, которые в очень плохих отношениях между собой. У каждый из этих стран есть два варианта: создать ядерное оружие или пустить деньги на развитие своей страны.
Очевидно, что лучшим решением для этих стран будет развивать свои страны и не создавать оружие массового поражения.
Но давайте посмотрим на рассуждение глав этих государств:
Первый президент думает, если вторая страна сделает ядерное оружие, они будут диктовать условия, и мы будем совсем не защищены, поэтому, если вторая страна создаст ядерное оружие, то и нам лучше создать. Если вторая страна не будет создавать ядерное оружие, то в этом случае, если мы создадим его, то мы сможем диктовать условия, получается нам лучше создать его.
Таким же образом рассуждает и второй президент.
И независимо друг от друга они приходят к решению создать ядерное оружие. Тем самым просто потратив деньги на создание, ужесточив обстановку в регионе, сократив расходы на социально-экономические нужды. Т.е. пришли не к оптимальному решению.
Пример №4 Рекламный бюджет конкурирующих компаний
Представим, что есть две фирмы, выпускающие одинаковый продукт и других конкурентов у них нет. Допустим, без рекламы у них одинаковые доходы. Если одна компания начнет рекламную акцию, а вторая нет, то прибыль первой увеличится, а второй сократится. Если они обе начнут рекламироваться, то доли рынка у них не поменяются, а вот расходы на рекламу увеличатся, таким образом прибыль упадет.
Повторяющаяся дилемма заключенного
В 1984 году Роберт Аксельрод написал книгу «Эволюция кооперации».
В этой книге была предложена версия дилеммы, когда игроки раз за разом принимают решения, помня предыдущие результаты.
Роберт Аксельрод решил провести чемпионат по повторяющейся дилемме заключенного, на который были приглашены многие математики, экономисты и программисты.
Не смотря на свою простоту (4 строчки кода), лучшей стратегией оказалась «Око за око», созданная Анатолием Рапопортом:
На первой итерации игры сотрудничать, на всех последующих итерация повторять решение, сделанное оппонентом на предыдущей итерации игры.
Затем появилась лучше работающая стратегия «Око за око с прощением», в которой иногда (вероятность 1% - 5%) даже при предательстве второго игрока на предыдущей итерации, первый мог простить его и сотрудничать на следующей итерации. Это помогало разорвать круг мести.
Примером повторяющейся дилеммы заключенного может служить гонка вооружений между США и СССР.
В период холодной войны между СССР и США было противостояние в превосходстве в области ядерного оружия.
Огромная часть бюджета обоих государств уходила на эту гонку. Соответственно другие сферы получали меньше из бюджета из-за этой гонки.
У обоих государств был выбор продолжить наращивать ядерную мощь государства или остановиться и поднять остальные отрасли. Если одна держава перестанет наращивать ядерный потенциал, а вторая продолжит, то теоретически у одной страны будет более сильное влияние на вторую.
Очевидно, наилучшим вариантом для всех было бы направление военного бюджета в мирное русло, но это возможно только если обе страны одновременно перестанут производить ядерное оружие. Но из-за соблазна быть «круче» другой страны гонка продолжалась.
Тут стоит отметить, что если у одной 50 ядерных бомб, а у другой 51, то разница будет не столь ощутима, т.к. если начнется война, то все равно всем будет конец, но если от этого абстрагироваться, то одна страна будет более «мощной», чем другая.
Еще один пример повторяющейся дилеммы заключенного – игра Мир/Война, в которой Предать/Молчать заменяются на Война/Мир.
Вообще, дилемма заключенного, важна не только в математике, но и экономике, социологии, политике, психологии, философии, даже в генетике!
Надеюсь эта статья будет вам и полезной, и интересной!
Картинка с лицензией CC0.
С уважением, @veritas
Хорошая статья.
Спасибо:)
Это не Стим, тут за свои собственные комментарии можно и не голосовать, не бойтесь, не потеряется в общем списке :)
А это не для того чтобы не потерялось. Это совсем для другого.
А для чего, если не секрет?
Видишь выплату.
Вот завтра я получу её на свой счет.
Да копейки, но как говорят: "Копейка рубль бережет".
"Игры разума" вспоминается и великолепный Джон Нэш
Ваш пост поддержали следующие Инвесторы Сообщества "Добрый кит":
losos, xroni, zoss, dabudi, shuler, vasilisapor2, tom123, ropox, svinsent, romapush, gryph0n, arystarch, asuleymanov, rous, stranniksenya, igor-golos, tunguska, yuriks2000, boltyn, acidgarry, vika-teplo, sva-lana, myhardmoney, amelina.elena, del137, ogion, dobronrav
Поэтому я тоже проголосовал за него!
Узнать подробности о сообществе можно тут:
Разрешите представиться - Кит Добрый
Правила
Инструкция по внесению Инвестиционного взноса
Вы тоже можете стать Инвестором и поддержать проект!!!
Если Вы хотите отказаться от поддержки Доброго Кита, то ответьте на этот комментарий командой "!нехочу"
Хороший пример с заключёнными. Если не сдавать друг друга, в сумме получают минималку.
@veritas Поздравляю! Вы добились некоторого прогресса на Голосе и были награждены следующими новыми бейджами:
Вы можете нажать на любой бейдж, чтобы увидеть свою страницу на Доске Почета.
Чтобы увидеть больше информации о Доске Почета, нажмите здесь
Если вы больше не хотите получать уведомления, ответьте на этот комментарий словом
стоп
Голосуя за это уведомление, вы помогаете всем пользователям Голоса. Узнайте, как здесь.
Что значит, представим?
Он есть, вот он! @cartel
Только не понятно из его посланий, что он из себя представляет:) По крайней мере мне:)
Флаговые войны готовятся, видимо :)
Ничего не понятно, но почитать прикольно
Это про мой пост или про посты картеля?:)
картеля.
У Вас - всё очень даже понятно и тоже прикольно.
Длинновато иногда, но в случае с этим постом - это необходимость
Тогда спасибо:) А с объемом текста в постах ничего не могу поделать, каждый раз хочется как можно подробнее рассказать, чтобы даже человеку абсолютно отстраненному стало понятно:)
и это правильно