Ситуация дилемма заключенных кратко

Обновлено: 04.07.2024

Представим себе следующую игру. Два преступника задержаны по подозрению в ограблении банка, однако против них недостаёт улик. Они могут получить небольшой срок – один год за те проступки, в отношении которых против них имеются улики (например, за хранение оружия). Задача следователя, ведущего дело, – заставить преступников сознаться в совершении преступления. Он разработал два альтернативных плана проведения допроса (невидимая рука и дилемма заключённых).

Если один из преступников признался в совершении преступления, а другой смолчал, то признавшийся получает максимальный срок – 10 лет тюремного заключения, а тот, кто не сознался, будет выпущен на волю. Если сознаются оба преступника, они получают по 5 лет заключения. Если оба молчат, каждый получает по 1 году заключения за ношение оружия. Каждый из игроков в данной ситуации принимает решение, не имея информации о выборе другого игрока. Выигрыши представлены в матрице игры, где числа означают величину отрицательной полезности, которая определяется количеством лет, проведённых в тюрьме. Соответственно (-5) означает, что преступник приговорён к 5 годам тюремного заключения, (-1) – 1 году тюремного заключения, (-10) – 10 годам тюремного заключения и (0) – преступник выпущен на свободу.

Следователь не смог достичь своей цели – добиться от преступников признания – и придумал другой план.

Преступники снова могут выбирать одну из двух стратегий. Оба знают: если никто из них не сознается, они получат минимальный срок – 1 год тюремного заключения за незаконное ношение оружия. Если сознаются оба, то каждый получает по 5 лет. Если признается лишь один из них, тогда тот, кто даст показания, выходит на волю, а тот, кто все отрицает, получает 10 лет тюремного заключения.

В этой игре у каждого преступника есть доминирующая стратегия – сознаться. Равновесием по Нэшу в этой игре будет набор стратегий , которые выбирают игроки.

Здесь равновесие по Нэшу неэффективное, ведь преступники могли бы получить по 1 году, а получили по 5 лет. Но стимулы, действующие в этой игре, настолько сильны, что можно представить себе ситуацию, когда оба преступника сознаются в совершении преступления, даже если оба невиновны.

Может быть, это стабильное неэффективное равновесие возникает потому, что преступники не смогли договориться между собой, не скоординировали свои действия? Но даже если бы они обменялись информацией и скоординировали свои показания на допросе у следователя, результат был бы тем же. Никто из них не мог быть уверен в том, что другой в последний момент не захочет получить одностороннее преимущество за счёт другого игрока. Причиной того, что игроки оказываются в неэффективном равновесии, является отсутствие надёжного, заслуживающего доверия обязательства со стороны каждого из игроков.

Обязательство будет надёжным, если одна из сторон видит, что другая сторона лишена возможности нарушить своё обязательство.

Императивное обязательство возникает в случае, когда игрок не может поступить иначе, потому что его принуждают к такому поведению или он лишён свободы действий. Подобно Одиссею, приказавшему привязать себя к мачте корабля, чтобы услышать пение сладкоголосых сирен, которые увлекали мореплавателей на острые прибрежные скалы, но при этом проплыть невредимым мимо них. Обязательство Одиссея не покидать корабль, и не направлять его в сторону скал было надёжным, т.к. он был физически лишён возможности нарушить его.

Мотивационное обязательство возникает в случае, когда игроку выгодно его выполнить. Томас Шеллинг, лауреат Нобелевской премии по экономике 2005 г., следующим образом иллюстрирует подобное обязательство. Похититель намеревался получить выкуп за похищенную жертву, но внезапно испугался и хочет отпустить её. Однако очевидно, что как только жертва получит свободу, она сразу же сообщит о похищении в полицию. Конечно, жертва клянётся, что будет молчать. Но надёжно ли её обещание? Вряд ли, и поэтому похитителю придётся её убить. Но можно ли избежать такого исхода, сделав каким-то образом обещание молчать со стороны жертвы надёжным? Шеллинг предлагает следующий выход: если жертва в прошлом совершила какое-либо преступление, она должна сообщить об этом похитителю; если же она не совершала никакого преступления, она должна это сделать в присутствии похитителя. В этом случае жертве, которая не лишена физической возможности пойти в полицию, будет невыгодно делать это: она будет опасаться, что похититель сообщит полиции о её преступлении и ей придётся нести наказание.

Социальная ловушка – особая ситуация, отличающаяся прямым конфликтом между частными стимулами и общественными интересами.

В жизни дилемма заключённых как ситуация, которая возникает единожды, не повторяясь, встречается очень редко. Многие ситуации подобного типа – повторяющиеся, когда игроки постоянно встречаются друг с другом. Поведение игроков в повторяющихся ситуациях отличается от одношаговой игры. В повторяющихся (кооперативных) играх идёт процесс обучения, игроки узнают постепенно тип поведения, который они могут ожидать друг от друга, каждый из игроков имеет возможность наказать партнёра за его отказ от сотрудничества в прошлом, и на этой основе возникают разделяемые всеми игроками нормы поведения, институты, позволяющие избежать односторонних выигрышей, предсказанных одношаговой игрой.

Посредством теории игр в современном мире экономического анализа весьма точно можно обозначить проблемы картелей, ЕС и зоны евро, более того, с их помощью смоделировать иные виды взаимодействий с большим количеством участников.

Теория игр – это математический раздел, предмет которого – анализ и предсказание решений, которые принимают участники любого стратегического взаимодействия – шахматисты и карточные игроки, конкуренты на олигополистическом рынке и государства, которое взаимодействует с бизнесом, противоборствующих сторон вооружённого конфликта и стран, являющиеся участниками международного объединения.

В теории игр игрой называется взаимодействие, участники данного взаимодействия называются игроками. В игре благосостояние каждого игрока зависит от его собственных действий и от действий других игроков. Все альтернативные методы и способы действий, которые предпринимал любой из игроков, назывались стратегиями. Получать платежи возможно в результате различных стратегий и действий всех участников игры.

Формализация игры

Существует несколько способов, чтобы формализовать игру. Зачастую это математический способ, хотя для простых игр чаще всего используется платёжная таблица.

Платёжная таблица – это таблица, в которой записываются все платежи игроков для всех без исключения комбинаций и стратегий.

Игрок 2
Камень Ножницы Бумага
Игрок 1 Камень Игрок 1: 0 руб., Игрок 2: 0 руб. Игрок 1: +1 руб., Игрок 2: -1 руб. Игрок 1: -1 руб., Игрок 2: +1 руб.
Ножницы Игрок 1: -1 руб., Игрок 2: +1 руб. Игрок 1: 0 руб., Игрок 2: 0 руб. Игрок 1: +1 руб., Игрок 2: -1 руб.
Бумага Игрок 1: +1 руб., Игрок 2: -1 руб. Игрок 1: -1 руб., Игрок 2: +1 руб. Игрок 1: 0 руб., Игрок 2: 0 руб.

Ни один из них не знает, как поступит другой, не знает, какую стратегию выберет подельник. У них есть информация только о том, что:

  • Если никто не сознается, то обоих преступников могут выпустить через полгода по причине отсутствия улик.
  • Если каждый сознается, то получат по два года тюрьмы, поскольку срок сократят по причине сотрудничества со следствием.
  • Если сознается только одни из них, а другой будет отрицать вину, то сознавшегося выпустят немедленно, а того, кто молчал посадят на три года.

Платёжная матрица этой игры представлена в таблице ниже. Необходимо обратить внимание на то, что платежи отрицательные по причине того, что представляют собой количество лет, проведённых в тюрьме.

Преступник 2
Молчать Сознаться
Преступник 1 Молчать П1: -0,5 П2: -0,5 П1: -3 П2: 0
Сознаться П1: 0 П2: -3 П1: -2 П2: -2

Самый лучший сценарий для заключённых в том, что оба из них должны сохранять молчание, и только в таком случае они смогут оба выйти из тюрьмы через полгода. Но ведь не зря таких преступников чаще всего сажают в разные камеры и пытаются получить правдивые показания по отдельности. На психологическом уровне преступники подозревают друг друга и думаю, что кто-то всё же сознается и тогда одному из них придётся провести за решёткой гораздо больший срок. Вряд ли заранее они договорились о какой-то стратегии защиты и в силу этого, они не имеют информации о том, какую лини. Защиты выберет сторонник. Не имея никакой информации о подельнике, но при этом зная о математической матрице, каждый из них может размышлять так: есть ли стратегия, которая наиболее выгодна для меня вне зависимости от того, какую стратегию выберет напарник. В теории игр такую стратегию называют доминирующей. Важно понимать, что такая стратегия возможна для двух преступников, у каждого она своя – это стратегия сознаться.

По той же схеме можно доказать, что для второго также выгодно сознаться и то будет его доминирующая стратегия. Если оба подозреваемых выберут доминирующую стратегия, то результат будет парадоксальным – каждый проведёт по два года в тюрьме, одновременно с тем, они оба питали надежды, что выйдут на свободу не позднее, чем через полгода.

Участникам картеля выгоднее всего было бы соблюдать соглашения, но при этом каждый стремиться его нарушить, итогом является разрушенный картель.

Подобная ситуация с фермерами, которым выгоднее всего было бы беречь общее поле и не пасти на нём слишком много воров, но, к сожалению, они так не делаю, что приводит к тому, что поле приходит в общую негодность.

Такая же история с Индией и Пакистаном, которые могли бы оба остаться безъядерными державами, но они имеют ядерное оружие, что приводит к опасному двустороннему соседству и огромным издержкам, которые связаны с содержанием данного вида оружия.

Каждый из примеров, ярко показывает взаимное недоверие участников взаимодействия, на основании которых они и выбирают доминирующую стратегию для себя, хоть результат в конечном итоге остаётся далёк от идеала.

Дилемма заключенного – парадокс в анализе решений, в котором два человека, действующие в собственных интересах, не приводят к оптимальному результату. Типичная дилемма заключенного создается таким образом, что обе стороны предпочитают защищать себя за счет другого участника. В результате оба участника оказываются в худшем состоянии, чем если бы они сотрудничали друг с другом в процессе принятия решений. Дилемма заключенного – одна из самых известных концепций современной теории игр .

Ключевые моменты

  • Дилемма заключенного – это ситуация, когда отдельные лица, принимающие решения, всегда имеют стимул сделать выбор таким образом, который создает менее чем оптимальный результат для отдельных лиц как группы.
  • Дилеммы заключенного возникают во многих сферах экономики.
  • Люди разработали множество методов преодоления дилемм заключенного, чтобы добиться лучших коллективных результатов, несмотря на явно неблагоприятные индивидуальные стимулы.

Понимание дилеммы заключенного

Дилемма заключенного представляет собой ситуацию, когда две стороны, разделенные и неспособные к общению, должны каждая сделать выбор между сотрудничеством друг с другом или нет. Наивысшая награда для каждой стороны возникает, когда обе стороны решают сотрудничать.

Классическая дилемма заключенного выглядит так: два члена банды грабителей банков, Дэйв и Генри, арестованы и допрашиваются в разных комнатах. Других свидетелей у властей нет, и они могут доказать свою правоту только в том случае, если они смогут убедить хотя бы одного из грабителей выдать своего сообщника и дать показания о преступлении. Каждый грабитель банков сталкивается с выбором: сотрудничать со своим сообщником и хранить молчание или уйти из банды и дать показания в пользу обвинения. Если они оба будут сотрудничать и хранить молчание, то власти смогут осудить их только по меньшему обвинению в праздношатании, что будет означать по одному году тюрьмы каждый (1 год для Дэйва + 1 год для Генри = 2 года тюрьмы. время). Если один дает показания, а другой нет, то тот, кто дает показания, выйдет на свободу, а другой получит три года (0 лет для того, кто виноват + 3 для одного осужденного = всего 3 года). Однако, если оба дадут показания против друг друга, каждый получит два года тюрьмы за частичную ответственность за ограбление (2 года для Дейва + 2 года для Генри = 4 года общего тюремного заключения).

В этом случае у каждого грабителя всегда есть стимул отступить, независимо от выбора другого. С точки зрения Дэйва, если Генри будет молчать, то Дэйв может либо сотрудничать с Генри и отсидеть год в тюрьме, либо сбежать и выйти на свободу. Очевидно, в этом случае ему было бы лучше предать Генри и остальную часть банды. С другой стороны, если Генри откажется от Дэйва и даст показания против Дэйва, тогда выбор Дэйва будет либо молчать и отсидеть три года, либо говорить и отсидеть два года в тюрьме. Опять же, очевидно, что он предпочел бы провести два года вместо трех.

В обоих случаях, независимо от того, будет ли Генри сотрудничать с Дэйвом или откажется от обвинения, Дэйву будет лучше, если он сам откажется и даст показания. Теперь, когда Генри стоит перед одним и тем же набором вариантов выбора, ему всегда будет лучше сбежать. Парадокс дилеммы заключенного заключается в следующем: оба грабителя могут свести к минимуму общее время тюремного заключения, которое они оба будут делать, только если они оба будут сотрудничать (всего 2 года), но стимулы, с которыми они сталкиваются по отдельности, всегда будут стимулировать каждого из них. дезертировать и в конечном итоге провести максимальное общее тюремное заключение между ними двумя (всего 4 года).

Примеры дилеммы заключенного

Экономика изобилует примерами дилемм заключенных, результаты которых могут быть либо полезными, либо вредными для экономики и общества в целом. Общей чертой являются ситуации, когда стимулы, с которыми сталкивается каждый отдельный человек, принимающий решения, который получает право выбора, побуждали бы каждого из них вести себя так, что им всем в целом становится хуже, в то время как индивидуально избегая выбора, который сделал бы их всех коллективно лучше, если бы все могли некоторые как-то кооперативно выбирают.

Один из таких примеров – трагедия общества . Для каждого может быть коллективным преимуществом сохранение и реинвестирование в распространение общего природного ресурса, чтобы иметь возможность продолжать его потребление, но у каждого человека всегда есть стимул вместо этого потреблять как можно больше и как можно быстрее, что затем истощает ресурс. Если найти способ сотрудничества, то здесь всем станет лучше.

С другой стороны, поведение картелей также можно рассматривать как дилемму заключенного. Все члены картеля могут коллективно обогащаться, ограничивая объем производства, чтобы удерживать цену, которую каждый получает достаточно высокой, чтобы получать экономическую ренту от потребителей, но каждый член картеля индивидуально имеет стимул обманывать картель и увеличивать объем производства, чтобы также получать ренту от другие участники картеля. С точки зрения благосостояния всего общества, в котором действует картель, это пример того, как дилемма заключенного, разрушающая картель, иногда может действительно улучшить положение общества в целом.

Побег из дилеммы заключенного

Со временем люди выработали множество решений дилемм заключенных, чтобы преодолеть индивидуальные стимулы в пользу общего блага.

Во-первых, в реальном мире большинство экономических и других человеческих взаимодействий повторяются более одного раза. Настоящая дилемма заключенного обычно разыгрывается только один раз, иначе она классифицируется как повторная дилемма заключенного . В повторяющейся дилемме заключенного игроки могут выбирать стратегии, которые поощряют сотрудничество или наказывают отступничество с течением времени. Постоянно взаимодействуя с одними и теми же людьми, мы можем даже сознательно перейти от дилеммы бывшего заключенного к повторной дилемме заключенного.

Во-вторых, люди разработали формальные институциональные стратегии для изменения стимулов, с которыми сталкиваются отдельные лица, принимающие решения. Коллективные действия по обеспечению сотрудничества посредством репутации, правил, законов, демократического или другого коллективного принятия решений и явного социального наказания за дезертирство трансформируют многие дилеммы заключенных в сторону более коллективно выгодных совместных результатов.

Переговоры в семье и на работе, в конференц-зале и даже в международных конфликтах — это всегда своего рода игра. Если понимать, как она устроена,можно легче прийти к соглашению и добиться своего. Разбираемся с одной из фундаментальных проблем в теории игр.

О чём речь

Дилемма заключённого — одна из самых известных концепций в теории игр. Её придумали Меррилл Флад и Мелвин Дрешер в 1950 году. Позже её доработал и дал ей название математик из Принстонского университета Альберт Такер.

Дилемма заключённого помогает понять, как найти баланс между сотрудничеством и конкуренцией. По сути, это такой инструмент для принятия решений, который можно приложить нужной стороной хоть к политике и бизнесу, хоть к социологии с биологией.

Важные тезисы

  1. Дилемма заключённого (в теории игр) подразумевает ситуацию, в которой два действующих стратегически игрока делают неоптимальный выбор для обоих.
  2. В бизнесе понимание её принципов ведёет к пониманию того, как принимать решения в целом. И, как следствие, к более благоприятным результатам.
  3. С таким подходом можно научиться находить баланс между сотрудничеством и конкуренцией. Так, чтобы каждый оставался в выигрыше.

Суть дилеммы заключённого

Представьте ситуацию. Двоих подозреваемых задержали за какое-то преступление и рассадили по разным камерам в участке. Общаться друг с другом они не могут. Прокурор говорит каждому одно и то же:

— Если ты признаешься и дашь показания против другого, а он промолчит, мы снимем с тебя обвинения и освободим.

— Если ты промолчишь, а другой даст показания, тебя осудят и посадят на максимальный срок — три года.

— Если признаешься и ты, и он, получите по два года каждый.

— Если оба будете молчать, каждого обвинят в административном правонарушении и посадят на год.

Как поступить подозреваемым? В этом и есть суть дилеммы.

Оценка наилучшего образа действий

Теперь немного из теории игр. Доминирующая стратегия для игрока — та, что принесёт ему наилучший результат, независимо от стратегий, которые используют другие. Здесь доминирующая стратегия заключается в том, чтобы каждый игрок признался. Это минимизирует средний тюремный срок. А вот все возможные результаты:

  1. Если А и Б промолчат, то получат по году тюрьмы — первая ячейка.
  2. Если А признается, а Б нет: А освободится, Б получит три года — вторая ячейка.
  3. Если А промолчит, но Б сознаётся: А получит три года, Б освободится — третья ячейка.
  4. Если оба признаются, каждый сядет на два года — четвёртая ячейка.

Таким образом, если первый подозреваемый признается, он либо выйдет на свободу, либо получит два года тюрьмы. А если нет — получит либо год, либо три. Второй подозреваемый находится в тех же условиях. Очевидно, что лучшая стратегия — признаться, независимо от того, что решит другой.

Что мы имеем

Итак, дилемма заключённого позволяет понять следующую штуку. Когда каждый заботится только о своих интересах, результат получается хуже, чем если бы оба сотрудничали.

В примере сотрудничества, когда оба молчат, их суммарный срок составляет два года. Во всех остальных вариантах — три или четыре года.

Увы, рациональный человек, заинтересованный в максимальной выгоде, чаще всего предпочитает не сотрудничать. Что будет, если оба подозреваемых решат признаться, предполагая, что другой этого не сделает? Окажутся в ячейке 4 (заработают по два года) — вместо того, чтобы оказаться в ячейке 2 или 3 (освободиться).

Сотрудничество неизбежно приведёт к наказанию, тогда как признание может повлечь за собой освобождение. Однако молчание может обернуться сроком до трёх лет, если один заключенный ошибётся в другом. Удивительно, но подобную дилемму можно часто встретить в бизнесе.

Заключённые-конкуренты

Классический пример в реальной жизни — две конкурирующих компании на одном рынке. Вспомните Coca-Cola и Pepsi, Burger King и McDonald’s, Apple и Samsung.

Возьмём первых и предположим, что Coca-Cola думает снизить цену на свои продукты. Если это произойдёт, Pepsi, скорее всего, поступит также, чтобы сохранить свою долю рынка. А это может привести к падению прибыли обеих компаний.

Снижение цен любого из конкурентов может быть истолковано как предательство, так как нарушит негласное соглашение между ними. Если Coca-Cola снизит цену, а Pepsi оставит на том же уровне, первая идёт в отказ, а вторая продолжает сотрудничество. Тогда Coca-Cola может завоевать долю рынка и продавать больше газировки.

Давайте снова построим матрицу выплат

В таком случае дополнительная прибыль для обеих компаний будет выглядеть так:

Дисклеймер: канал не научно-популярный, а я не знаю теорию игр в том объеме, чтоб по ней лекции читать, поскольку большинство моих "знаний" по этой теме получены из книжек по саморазвитию (кстати, "Теория игр" Диксита и Нейлбаффа огонь книга, всем подобным мне любителям повыпендриваться знаниями в какой-то случайной теме очень советую) поэтому не ждите грамотного и обширного раскрытия темы

В общем-то опять тема статьи не самая оригинальная, учитывая что процентов девяносто людей, у которых от словосочетания "теория игр" не отключается мозг, сразу представляют себе эту пресловутую дилемму заключенного (хотя правильнее было бы называть её дилеммой заключенных, потому что если он один, то никаких проблем не возникает). Конечно, можно было бы выбрать какую-нибудь более нетривиальную тему, но я как всегда имею Наполеоновские планы, связанные с целой кучей статей про теорию игр (да, я начитался книжек и теперь хочу умничать много раз, не пропадать же добру), так что логично начать с чего-нибудь попроще и пораспространеннее.

Стандартный пример

Опять же, я не Википедия, расписывать всё с точки зрения формальной постановки ситуации не буду, к тому же наверняка большинство в общих чертах и так представляет, что это такое, но все-таки дам сначала классический пример, чтобы показать что я сильно умный, ой, в смысле для общего развития.

Итак, есть два стула заключенных, которые попались на совершении преступления. Но каким-то образом получилось так, что улик против них недостаточно, чтоб посадить их по полной, только по какой-нибудь ерундовой статье на полгодика. Ну например за то, что они маски медицинские на дело не надели, тем самым способствуя распространению коронавируса (оп, актуалочка. Я слышал, что если вставлять в свой текст "очень оригинальные" шутки про корону, его интеллектуальная ценность возрастает минимум в 10 раз). В общем, такая ситуация полицейских категорически не устраивает и они решают прибегнуть к классическим эффективным цыганским фокусам для получения признаний. Нет, они не избивают арестантов пока те не признаются, это слишком эффективный метод, там ни одна теория игр не поможет. Они просто разводят заключенных по разным комнатам и предлагают сдать друг друга - если оба так и продолжат молчать, им дадут по полгода, но если один признается, а другой нет, то признавшегося освободят за помощь следствию, а второго засадят на десять лет за отказ признать свою вину. Ну а если признаются оба, то оба получат два года за преступное деяние в сговоре. На этом стандартную формулировку можно закончить, просто дав таблицу выигрышей и некоторые комментарии, но зачем тогда создавалась эта статья? Поэтому вспомним, что мы тут не быдлота какая-нибудь математическая, а высокоинтеллектуальные любители искусства, так что сейчас будет притянутый за уши пример из классической литературы.

Вспомним такое очаровательное произведение Гоголя "Ревизор". А именно, момент, где все чиновники города бегут распихивать Хлестакову взятки по карманам. Опустим все другие их мотивы, страх, и прочее, а также саму выдачу взяток и то, что Хлестаков на самом деле никакой не ревизор. Попечитель богоугодных заведений Земляника поначалу пытается обезопасить себя, не давай взятки - он закладывает всех своих "друзей", рассказывая про их грязные делишки. А теперь, чтобы окончательно натянуть сову на глобус, представим себе, что в городе существует всего два чиновника, таких как Земляника, то есть желающих выйти сухими из воды, заложив друг друга Хлестакову, который является настоящим ревизором. Рассмотрим все возможные случаи и их условные "выигрыши".

  • Оба не сдали друг друга (и каким-то чудом скрыли все нарушения при обходе заведений) - ревизор уехал довольный, никого не наказал. Максимальный выигрыш для обоих - условно 3
  • Один сдал, другой не сдал - ревизор наказал того, которого заложили, но и к зонам ответственности второго присматривался более пристально. Условный выигрыш заложившего - 2 , не заложившего - -1
  • Оба сдали - ревизор наказал обоих, но моральное удовлетворение от того, что и второй был наказан, немного сгладило это впечатление. Выигрыш - условно 0

Тогда, если анализировать выгодность стратегий для каждого из чиновников, очевидно можно сказать, что отдельно каждому из них выгоднее сдать другого. Если другой чиновник не сдаст вас, то ваш выигрыш может быть равен либо нулю либо двум. Соответственно, чтоб выбить максимальный выигрыш в виде двойки, нужно сдать своего коллегу. Если же он сдаст вас, то лучший ваш выигрыш может быть равен нулю, и для этого вам тоже нужно сдать коллегу. Так что, опуская моральную сторону вопроса, вариант предательства здесь предпочтительней, а если выпендриваться умными словечками, он является доминирующей стратегией - при любом ходе оппонента такая стратегия дает вам максимальный выигрыш из возможных. То есть любой рациональный человек в такой ситуации должен выбрать стратегию предательства. Но если предположить, что оба играющих - рациональны, то единственный возможный вариант исхода - оба закладывают друг друга и получают условно равный нулю выигрыш. Но нетрудно заметить, что для обоих игроков это не максимальный возможный выигрыш. Иными словами, если каждый игрок по отдельности сделает рациональный выбор, то вместе они придут к нерациональному результату. Собственно, в этом и заключается пресловутая дилемма заключенного.(если ну оооооочень сильно выпендриваться, то можно задвинуть про то, что дилемма здесь в том, что равновесие Нэша в этой игре не соответствует Парето-оптимальному решению, но такие заумные формулировки даже для меня перебор)

Трагедия общин

По сути, та же самая дилемма заключенного, только распространенная на большую группу людей, и с этой ерундой сталкиваются в жизни все, по моему чуть ли не чаще чем с изначальной дилеммой. Любая идиотская ситуация, в которой группа людей не может что-либо сделать, потому что все ждут, когда это сделает другой человек, является по сути трагедией общин.

Солдаты сидят в окопах и никак не могут подняться в атаку, потому что никто не хочет быть первым, или ученики выслушивают несправедливые обвинения учителя и никто не возражает, хотя все знают, что это неправильно, или зеркальная ситуация - все туристы мусорят где попало, потому что именно от их небольшого сора ничего не изменится, и прочее. Во всех этих случаях, если каждый человек мыслит рационально, исход будет далеко не самый хороший - каждому отдельно взятому солдату выгоднее сидеть в окопе, поскольку если он вскочит первым, то точно умрет, если не вскочит никто ещё, и скорее всего умрет, даже если вскочат остальные. Так что оставаться в окопе - доминирующая стратегия, однако если так рассудят все, то атака захлебнется, противники победят и тогда уж точно прикончат абсолютно всех. Протест против учителя может обернуться хоть каким-то успехом если достаточно большая группа людей поддержит этот протест (ха-ха, смешно, когда это протесты против учителей успехом оборачивались, выдумал я пример конечно), но при этом вовсе не обязательно, чтобы этой группой был весь класс. Тогда доминирующая стратегия - промолчать в любом случае. Если все вокруг мусорят, ещё один мусор от одного туриста ничего не изменит, а если все вокруг не мусорят, то ничего страшного не произойдет, если намусорит один. И естественно, так думают практически все. И практически по этому поводу есть один прекрасный отрывок из "Стража! Стража!" Терри Пратчетта:

Эх раз, да ещё раз

В общем-то дилемма заключенного, взятая в вакууме, это конечно очень весело, но в жизни практически никогда ничто не сводится к одному единственному взаимодействию, поэтому помимо одного "раунда" такой дилеммы очень часто рассматривают несколько повторяющихся - это может быть сотрудничество в бизнесе или ещё что-нибудь подобное, но основное отличие здесь в том, что результат текущего раунда может непосредственно повлиять на все последующие, и таким образом предательство становится наказуемым . Я не просто так тут со шрифтами игрался и выделил это слово жирным, оно на самом деле является наверное ключевым свойством любых повторяющихся игр, для которых можно рассматривать какие-то другие стратегии, отличные от "одноразовой". Потому что если предыдущий раунд никак не влияет на последующий, то такая ситуация ничем не отличается от изначального примера - предательство всё ещё доминирует.

Но как выгоднее поступить, если вы знаете, что ваше предательство может быть наказуемым? Ладно, это был риторический вопрос, я тут не буду четыреста лет рассуждать о разных подходах к делу, учитывая что это делали тучи других людей, даже проводили чемпионат среди компьютерных моделей с разным подходом, но победила там, насколько я знаю, очень простая модель. Что с одной стороны странно, а с другой логично.
В общем-то, вся суть лучшей(если мы говорим об адекватных стандартных выигрышах и прочем, конечно. Понятно, что если назначить за предательство огромнейший выигрыш, ситуация несколько изменится) стратегии для повторяющейся дилеммы заключенных заключалась в копировании предыдущего хода соперника. По сути, её можно назвать терпилой имитатором. Она начинает с сотрудничества, то есть не выдает другого игрока, если следовать нашему примеру, а в следующих раундах просто повторяет его ход, что по сути обеспечивает наказуемость - если такую стратегию предать на одном ходу, она предаст тебя на следующем. Собственно, тут всё логично, мне и добавить нечего.

Читайте также: