Дилемма заключенного в экономике кратко

Обновлено: 02.07.2024

В дилемме заключенного измена строго доминирует над сотрудничеством, поэтому единственный возможный равновесие — предательство обоих участников. Проще говоря, не важно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.

Обращаясь отдельно рационально, вместе участники приходят к нерациональному решение: если оба предадут, они получат в сумме меньше выигрыш, чем если бы сотрудничали (единственная равновесие в этой игре не ведет к Парето-оптимального решения). В этом и заключается дилемма.

Классическая дилемма заключённого

Классическая дилемма заключенного такова:

Двое подозреваемых, А и Б, арестованы. У полиции нет достаточных доказательств для обвинения, и изолировав их друг от друга, они предлагают им одну и ту же операцию: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается, а второй получает 10 лет тюрьмы. Если оба молчат, в полиции мало доказательств, и они приговариваются к 6 месяцев. Если оба свидетельствуют против друг друга, они получают по 2 года. Каждый заключенный выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдет?

Игру можно представить в виде следующей таблицы:

Узник Б хранит молчание	Узник Б дает показания
Узник А хранит молчание	Оба получают полгода.	А получает 10 лет Б освобождается
Узник А дает показания	А освобождается Б получает 10 лет тюрьмы	Оба получают 2 года тюрьмы

Дилемма появляется, если предположить, что оба заботятся только о минимизации собственного срока заключения.

С точки зрения группы (этих двух заключенных) лучше сотрудничать друг с другом, хранить молчание и получить по полгода, поскольку это уменьшит суммарный срок заключения. Любое другое решение будет менее выгодным. Это очень наглядно демонстрирует, что в игре с ненулевой суммой Парето-оптимум может быть противоположным равновесии Нэша.

Обобщенная форма

Можно раскрыть скелет игры далее, абстрагировавшись от подтекста заключенных. Обобщенная форма игры часто используется в экспериментальной экономике. Вот правила, которые дают типичную реализацию игры.

Значения переменных C, D, с, d могут быть любого знака (в примере выше все меньше или равны 0). Обязательно должна соблюдаться неравенство D> C> d> c, чтобы игра была ДВ.

Каноническая матрица выигрышей ДВ

Сотрудничать	Изменить
Сотрудничать	C, C	c, D
Изменить	D, c	d, d

Если игра повторяется, то есть играет более 1 раза подряд, общий выигрыш от сотрудничества должен быть большим суммарного выигрыша в ситуации, когда один изменяет, а другой — нет (объяснения — ниже):

Эти правила были установлены Дугласом Гофштадтером и образуют канонический описание типичной дилеммы заключенного.

Похожая, но другая игра

В этой игре обман всегда будет наилучшим решением, означая также, что рациональные агенты никогда не играть в нее, и рынок обмена закрытыми сумками будет отсутствовать.

Как указано выше, без памяти эта игра имеет мало смысла, она мало что объясняет в поведении систем и групп людей, кроме описания взаимодействий, не проходить. Сложностей вводится больше, чем можно ожидать. Программист (особенно специализирующийся на функциональном программировании) сразу поймет значимость времени и состояния (памяти). Но и без написания программ можно предположить, как поведут себя агенты. Насколько велика память каждого агента? Какая стратегия каждого из них? Как агенты с различными стратегиями распределены и определяет, кто с кем взаимодействует и в каком порядке?

Сложность создания какой-то многозначной модели может смущать, но она поднимает некоторые интересные и ценные технические и философские вопросы.

О потенциале этой задачи свидетельствует тот факт, что в этой дискуссии еще не упоминались возможность формировать коалиции и рядиться коллективно. А как насчет агентов, которые по плату организовывали переговоры? Или агентов, которые накапливали информацию о самых операции?

Примеры из реальной жизни

Примеры с заключенными, карточной игрой и обменом закрытыми сумками могут казаться надуманными, но на самом деле есть множество примеров взаимодействия людей и животных, имеющих такую же матрицу выигрышей. Поэтому ДВ представляет интерес социальным наукам, таким как экономика, политология и социология, а также разделам биологии — этологии и эволюционной биологии. Многие природные процессы были обобщены в модели, в которых живые существа участвуют в бесконечных играх типа дилеммы заключенного. Такая широкая применимость ДВ придает этой игре значительную важность.

В политологии, например, сценарий ДВ часто используется для иллюстрации проблемы двух стран, вовлеченных в гонку вооружений. Обе заявлять, что у них есть две возможности: либо увеличить расходы на военные нужды, или сокращать вооружения. Ни одна из сторон не может быть уверена, что другая соблюдать договоренность, следовательно обе стремиться к военной экспансии. Это можно считать теоретическим объяснением политики запугивания.

В автоспорте яркий пример дилеммы заключенного — Формула-1, где последние 20 лет происходит гонка бюджетов команд, через какое количество машин участников сократилось с 36 в 1990 до 20 в 2003.

Случай дилеммы узника может быть найден в бизнесе. Две конкурирующие фирмы должны определиться, сколько средств тратить на рекламу. Эффективность рекламы и прибыль каждой фирмы уменьшается с ростом расходов на рекламу у конкурента. Обе фирмы принимают решение увеличить расходы на рекламу, при этом их доли рынка и, возможно, объемы продаж остаются неизменными, а прибыль сокращается. Предел гонки рекламных бюджетов — прибыль, впрочем, они могут пытаться некоторое время работать и в убыток. Фирмы могут пойти на соглашение о сокращении расходов на рекламу, но всегда есть стимул его нарушить.

В олигополистических рынках ценовая политика — это повторение ДВ. Конечно олигополисты сотрудничают друг с другом и не доводят ситуацию до ценовой войны.

Теоретический вывод ДВ — одна из причин, почему во многих странах сделка о признании вины запрещена. Часто сценарий ДВ повторяется очень точно: в интересах обеих подозреваемых признаться и свидетельствовать против другого подозреваемого, даже если оба невиновны. Возможно, наихудший случай — когда только один виноват, в этом случае виноват вряд ли признается в чем, а виноват пойдет на это и даст показания против невинного.

Дилемма узника, повторяющееся

Анализируя стратегии, набравшие лучшие результаты, Акселрод назвал несколько условий, необходимых, чтобы стратегия получила высокий результат.

Хорошая

Мстительная

Прощая

Другая важная качество успешных стратегий — уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечной мести друг другу и максимизирует выигрыш.

НЕ завистливая

Итак, Акселрод пришел утопично звучащему выводу, что эгоистичные индивиды во имя их же эгоистического блага будут стремиться быть добрыми и прощая и не завистливыми.

Определить оптимальную стратегию можно двумя путями:

Если НДС играет ровно N раз (какая-то известная константа N), есть еще один интересный факт. Равновесие Нэша — всегда предавать. Доводим по индукции: если оба сотрудничают, на последнем ходе выгодно предать, тогда у соперника не будет возможности отомстить. Поэтому оба предадут друг друга на последнем ходу. Раз соперник предаст на последнем ходе в любом случае, любой игрок захочет предать на предпоследнем ходу, и так далее. Чтобы сотрудничество оставалась выгодной, необходимо, чтобы будущее было неопределенным для обоих игроков. Одно из решений — делать число N случайным и подсчитывать результаты по среднему выигрышем за ход.

Дилемма заключенного — фундаментальная для некоторых теорий о взаимодействии людей и доверие. С предположение модели ДВ, что транзакция между двумя людьми требует доверия, доверительная поведение в популяциях может быть смоделирована с помощью многие гравцевои версии игры, повторяется. Это годами вдохновляло многих ученых. В 1975 году Грофман и Пул оценивали число работ, посвященных этой теме, их около 2000.

Психология обучения и теория игр

Если игроки могут оценивать возможность предательства со стороны других игроков, на их поведение влияет опыт. Простая статистика показывает, что неопытные игроки обычно ведут себя чрезмерно хорошо или плохо. Если они все время будут действовать так, то проигрывают из-за своей излишней агрессивности или лишнюю доброту. С получением большого опыта они реально оценивают вероятность измены и добиваются лучших результатов. Ранние розыгрыше сильно влияют на неопытных игроков, чем более поздние на опытных. Это пример, почему ранний опыт имеет такое влияние на молодых, и почему они особенно уязвимы к немотивированной агрессии, иногда сами становясь такими.

Можно уменьшить вероятность измены в популяции посредством сотрудничества в ранних играх, позволив укрепить доверие. Итак самопожертвование может в некоторых ситуациях усилить моральный дух группы. Если группа маленькая, на позитивное поведение с большей вероятностью ответят взаимностью, что поощрит индивидов на дальнейшее сотрудничество. Это связано с еще одной дилеммой, хорошее отношение без причины — это потерянные, которое может ухудшить моральные качества.

Эти процессы — главное поле интереса взаимного альтруизма, группового отбора, семейного отбора и этики.

Восточная философия

В боевых искусствах изучается даосское пословица, которая гласит, что:

Отвечать добром на добро — дает добро
Отвечать злом на зло — дает добро
Отвечать злом на добро — дает зло
Отвечать добром на зло — дает зло

Дилемма заключенного, одна из самых известных игровых теорий, была концептуализирована Merrill Flood и Melvin Dresher в Rand Corporation в 1950 году, а также была оформлена и названа математиком Принстона Альбертом Уильямом Такером. Дилемма заключенного в основном обеспечивает основу для понимания того, как найти баланс между сотрудничеством и конкуренцией, и является очень полезным инструментом для принятия стратегических решений.

В результате он находит применение в различных областях, от бизнеса, финансов, экономики и политических наук до философии, психологии, биологии и социологии.

Основы дилеммы заключенного

Сценарий дилеммы заключенного работает следующим образом: два подозреваемых были задержаны за преступление и теперь находятся в отдельных комнатах в полицейском участке, не имея возможности общаться друг с другом. Прокурор отдельно сказал им следующее:

Если вы признаетесь и согласитесь дать показания против другого подозреваемого, который не признается, обвинения против вас будут отброшены, и вы пойдете без шотландца.
Если вы не признаетесь, но другой подозреваемый, вы будете осуждены, и обвинение будет добиваться максимального срока в три года.
Если вы оба признаетесь, вы оба будете приговорены к двум годам лишения свободы.
Если ни один из вас не признается, вы оба будете обвиняться в проступках и будете приговорены к одному году тюрьмы.

Что должны делать подозреваемые? В этом суть дилеммы заключенного.

Оценка наилучшего курса действий

Дилемма заключенного -

Матрица выплат

Подозреваемый B

Дилемма спроса и предложения на рынке недвижимости

Должны ли инвесторы искать безопасность в сфере недвижимости? Возможно нет. Вот почему.

Нулевая нижняя граница Дилемма: мы застряли?

Процентные ставки могут зависеть от нулевой нижней границы (ZLB), благодаря экспериментальной денежно-кредитной политике ФРС и чрезмерным расходам со стороны правительства США.

Дилемма америки для замороженных пенсий

К сожалению, есть несколько факторов, которые подорвали присутствие пенсионных планов в Америке, и работники должны быть готовы заменить ожидаемый доход для своих лет выхода на пенсию.

Посредством теории игр в современном мире экономического анализа весьма точно можно обозначить проблемы картелей, ЕС и зоны евро, более того, с их помощью смоделировать иные виды взаимодействий с большим количеством участников.

Теория игр – это математический раздел, предмет которого – анализ и предсказание решений, которые принимают участники любого стратегического взаимодействия – шахматисты и карточные игроки, конкуренты на олигополистическом рынке и государства, которое взаимодействует с бизнесом, противоборствующих сторон вооружённого конфликта и стран, являющиеся участниками международного объединения.

В теории игр игрой называется взаимодействие, участники данного взаимодействия называются игроками. В игре благосостояние каждого игрока зависит от его собственных действий и от действий других игроков. Все альтернативные методы и способы действий, которые предпринимал любой из игроков, назывались стратегиями. Получать платежи возможно в результате различных стратегий и действий всех участников игры.

Формализация игры

Существует несколько способов, чтобы формализовать игру. Зачастую это математический способ, хотя для простых игр чаще всего используется платёжная таблица.

Платёжная таблица – это таблица, в которой записываются все платежи игроков для всех без исключения комбинаций и стратегий.

Игрок 2
Камень	Ножницы	Бумага
Игрок 1	Камень	Игрок 1: 0 руб., Игрок 2: 0 руб.	Игрок 1: +1 руб., Игрок 2: -1 руб.	Игрок 1: -1 руб., Игрок 2: +1 руб.
	Ножницы	Игрок 1: -1 руб., Игрок 2: +1 руб.	Игрок 1: 0 руб., Игрок 2: 0 руб.	Игрок 1: +1 руб., Игрок 2: -1 руб.
	Бумага	Игрок 1: +1 руб., Игрок 2: -1 руб.	Игрок 1: -1 руб., Игрок 2: +1 руб.	Игрок 1: 0 руб., Игрок 2: 0 руб.

Ни один из них не знает, как поступит другой, не знает, какую стратегию выберет подельник. У них есть информация только о том, что:

Если никто не сознается, то обоих преступников могут выпустить через полгода по причине отсутствия улик.
Если каждый сознается, то получат по два года тюрьмы, поскольку срок сократят по причине сотрудничества со следствием.
Если сознается только одни из них, а другой будет отрицать вину, то сознавшегося выпустят немедленно, а того, кто молчал посадят на три года.

Платёжная матрица этой игры представлена в таблице ниже. Необходимо обратить внимание на то, что платежи отрицательные по причине того, что представляют собой количество лет, проведённых в тюрьме.

Преступник 2
Молчать	Сознаться
Преступник 1	Молчать	П1: -0,5 П2: -0,5	П1: -3 П2: 0
Преступник 1	Сознаться	П1: 0 П2: -3	П1: -2 П2: -2

Самый лучший сценарий для заключённых в том, что оба из них должны сохранять молчание, и только в таком случае они смогут оба выйти из тюрьмы через полгода. Но ведь не зря таких преступников чаще всего сажают в разные камеры и пытаются получить правдивые показания по отдельности. На психологическом уровне преступники подозревают друг друга и думаю, что кто-то всё же сознается и тогда одному из них придётся провести за решёткой гораздо больший срок. Вряд ли заранее они договорились о какой-то стратегии защиты и в силу этого, они не имеют информации о том, какую лини. Защиты выберет сторонник. Не имея никакой информации о подельнике, но при этом зная о математической матрице, каждый из них может размышлять так: есть ли стратегия, которая наиболее выгодна для меня вне зависимости от того, какую стратегию выберет напарник. В теории игр такую стратегию называют доминирующей. Важно понимать, что такая стратегия возможна для двух преступников, у каждого она своя – это стратегия сознаться.

По той же схеме можно доказать, что для второго также выгодно сознаться и то будет его доминирующая стратегия. Если оба подозреваемых выберут доминирующую стратегия, то результат будет парадоксальным – каждый проведёт по два года в тюрьме, одновременно с тем, они оба питали надежды, что выйдут на свободу не позднее, чем через полгода.

Участникам картеля выгоднее всего было бы соблюдать соглашения, но при этом каждый стремиться его нарушить, итогом является разрушенный картель.

Подобная ситуация с фермерами, которым выгоднее всего было бы беречь общее поле и не пасти на нём слишком много воров, но, к сожалению, они так не делаю, что приводит к тому, что поле приходит в общую негодность.

Такая же история с Индией и Пакистаном, которые могли бы оба остаться безъядерными державами, но они имеют ядерное оружие, что приводит к опасному двустороннему соседству и огромным издержкам, которые связаны с содержанием данного вида оружия.

Каждый из примеров, ярко показывает взаимное недоверие участников взаимодействия, на основании которых они и выбирают доминирующую стратегию для себя, хоть результат в конечном итоге остаётся далёк от идеала.

Дилемма заключенных относится к типу экономической игры, в которой равновесие Нэша таково, что оба игрока оказываются в худшем положении, даже если они оба выбирают свои оптимальные стратегии.

Дилемма заключенных — это классический пример игры, в которой участвуют два подозреваемых, скажем P и Q, арестованные полицией и которые должны решить, признаваться им или нет.

Если один сознается, а другой нет, то заключенный, который сознается, получает более легкий тюремный срок, скажем, 1 год, а заключенный, который не сознается, получает очень суровый срок, скажем, 8 лет.

Если ни один из них не признается, они оба получают более легкие сроки, скажем, по 2 года каждый; но если оба признаются, то оба получают строгий срок, скажем, по 4 года каждый.

Игра может быть визуализирована с помощью следующей матрицы выплат:

Выплаты в тюрьме		Заключенный Q
Выплаты в тюрьме		Признаться	Не признаться
Заключенный P	Признаться	-4, -4	-1, -8
Заключенный P	Не признаться	-8, -1	-2, -2

Комбинированная оптимальная стратегия для обоих заключенных — не признаваться в содеянном. Именно потому, что это привело бы к минимальному объединенному тюремному сроку для них.

Но поскольку они не могут общаться и сотрудничать, пытаясь сделать все возможное индивидуально, они выбирают стратегии, которые обрекают их обоих.

Давайте посмотрим на игру с точки зрения заключенного P. Если заключенный Q сознается, то заключенному Р тоже лучше признаться, потому что в противном случае он получил бы срок 8 лет вместо 4 лет.

Точно так же, если заключенный Q не сознается, то в интересах заключенного P сознаться, потому что, признавшись, он получит срок в 1 год вместо 2 лет. Следовательно, независимо от того, что делает заключенный Q, признание является доминирующей стратегией для заключенного P.

В конечном счете и тот и другой находятся в худшем положении, потому что они получают по 4 года каждый вместо всего лишь 2 лет каждый.

Но они не могут избежать этого печального исхода, потому что не могут сотрудничать, и любая другая стратегия была бы худшей для каждого заключенного в отдельности.

Равновесие Нэша в дилемме заключенных

Результатом дилеммы заключенного является равновесие Нэша. Равновесие Нэша — это такая комбинация стратегий, при которой у фирмы-игрока есть какой-либо стимул в одностороннем порядке изменить свою стратегию.

Когда оба игрока в игре имеют доминирующие стратегии, результатом, который является пересечением доминирующих стратегий, является равновесие Нэша.

В дилемме заключенных, поскольку признание является доминирующей стратегией для каждого заключенного, равновесие Нэша возникает, когда оба признаются.

Это равновесие Нэша, потому что ни один заключенный не станет лучше, если в одностороннем порядке изменит свою стратегию.

Например, если заключенный Р решит не признаваться, в то время как заключенный Q действительно признается, то заключенный Р получит 8 лет вместо 4 лет. Следовательно, заключенному Р будет хуже, если он отойдет от равновесия Нэша.

Он не станет выбирать иной стратегии, кроме той, что диктует равновесие Нэша. Этот пример показывает, что равновесие Нэша является самоподкрепляющимся и стабильным.

Примеры

Хотя дилемма заключенных, рассмотренная выше, является абстрактной концепцией, многие реальные ситуации очень похожи на нее.

Пример 1. Фирмы знают, что если они не рекламируют, то могут сохранить свою существующую долю рынка и прикарманить сэкономленный рекламный бюджет в качестве дополнительной прибыли, но они все равно рекламируют, потому что каждая фирма боится, что если она не рекламирует, а другая фирма делает это, то она потеряет свою долю рынка.

Поскольку обе фирмы испытывают один и тот же страх, обе они рекламируют, обе имеют более низкую прибыль (из-за более высоких расходов на рекламу), и никто не получает никакой доли рынка.

Пример 2. Фирмы, принимающие решение о том, следует ли нанять адвоката, чтобы представлять их интересы в арбитраже, будут коллективно лучше, если они решат не нанимать адвоката.

Но каждая фирма нанимает адвоката из страха, что если другая фирма наймет адвоката, а они этого не сделают, вероятность того, что другая фирма выиграет в арбитраже, значительно возрастет.

Пример 3. Фирмы в олигополии находятся в лучшем положении, если они могут одновременно ограничивать свой выпуск и устанавливать монопольную цену.

Но так как сговор незаконен, то и то, и другое дает более высокую отдачу, что снижает отдачу каждой фирме. Модель Курно является иллюстрацией такой дилеммы заключенных.

Читайте также: