Парадокс двух конвертов доклад

Обновлено: 04.07.2024

В теории вероятностей существует несколько задач, решение которых, на первый взгляд, противоречит здравому смыслу. Такие задачи называют парадоксами.

Содержание

Есть два неразличимых конверта с деньгами. В обоих конвертах находится некая степень двойки денег, причем в одном находится сумма в два раза большая, чем во втором. Величина этой суммы неизвестна. Конверты дают двум игрокам. Каждый из них может открыть свой конверт и пересчитать в нём деньги. После этого игроки должны решить: стоит ли обменять свой конверт на чужой? Оба игрока рассуждают следующим образом. Я вижу в своём конверте сумму [math]X[/math] . Если [math]X = 1[/math] , то менять точно выгодно. Если [math]X[/math] другой, то в чужом конверте равновероятно может находиться [math] 2 \cdot X [/math] или [math] \dfrac[/math] . Поэтому, если я поменяю конверт, то у меня в среднем будет [math] \dfrac<(2 \cdot X + \dfrac)> = \dfrac \cdot X [/math] . То есть больше, чем сейчас. Значит обмен выгоден. Однако обмен не может быть выгоден обоим игрокам. Где в их рассуждениях кроется ошибка?

В данном рассуждении ошибка кроется в предположении о том, что в другом конверте может равновероятно находится [math] 2 \cdot X [/math] или [math] \dfrac[/math] . В действительности этого не может быть.

Предположим от противного, что существует вероятностное распределение [math]p(x)[/math] , определенное на степенях двойки так, что [math]p(2^)[/math] — вероятность того, что в конвертах будут записаны [math]2^[/math] и [math]2^[/math] , причем значения этой функции на соседних степенях равны. Тогда значения этой функции вообще говоря должны быть равны на всех степенях, то есть [math]p(x)[/math] постоянна. Но [math] \sum\limits_^\infty p(2^i) = 1[/math] (так как это вероятностное распределение) — противоречие.

Также есть формулировка парадокса, обходящая данное доказательство.

Действительно, пусть нам дано вероятностное распределение геометрической прогрессией:

  • вероятность выпадения [math]1[/math] и [math]2[/math] в конвертах — [math](1-q)[/math]
  • вероятность выпадения [math]2[/math] и [math]4[/math] в конвертах — [math](1-q) \cdot q[/math]
  • вероятность выпадения [math]4[/math] и [math]8[/math] в конвертах — [math](1-q) \cdot q^2[/math]
  • вероятность выпадения [math]2^i[/math] и [math]2^[/math] в конвертах — [math](1-q) \cdot q^i[/math]
  • и так далее.

тогда сумма всех вероятностей действительно [math](1-q) \cdot \dfrac = 1[/math]

Итак, пусть нам дали конверт с суммой [math]2^i[/math] . тогда вероятность того, что в другом конверте [math]2^[/math] — [math] \dfrac [/math] , а того, что в другом конверте [math]2^[/math] — [math]\dfrac [/math]

Тогда "в среднем" при обмене мы будем получать [math]\left ( 2^ \cdot \dfrac + 2^ \cdot \dfrac \right ) = 2^i \cdot \left ( \dfrac \right ) [/math] .

При [math]q \gt \dfrac[/math] последняя скобка больше единицы. Таким образом "в среднем" мы получим больше, чем [math]2^i[/math] . Такое же рассуждение справедливо для обоих игроков. В чем же тут ошибка рассуждения?

А между тем ошибка тут психологическая. Ведь что человек понимает под понятием "в среднем"? Это некоторое "среднее значение", при условии, что число экспериментов очень велико. Рассчитаем математическое ожидание выигрыша, если мы не будем менять конверты.

[math]E = \dfrac \cdot 1 + \sum\limits_^ <\infty>\left ( 2^i \cdot \dfrac <(1 - q) \cdot q^+ (1-q) \cdot q^i > \right ) = \dfrac + (1 - q^2)\cdot \sum\limits_^ <\infty>\left ( 2 \cdot q \right )^i[/math] , а так как [math]q \gt \dfrac[/math] , то под знаком суммирования стоит возрастающая геометрическая прогрессия, тогда [math]E = \infty[/math] .

А в равенстве [math] \infty = \infty \cdot \left ( \dfrac \right ) [/math] ошибки нет.

Допустим, вы участвуете в игре. Перед вами три двери, за одной из них — автомобиль, за двумя другими — козы. Вы выбираете одну из трёх дверей и указываете на неё. Ведущий, который знает, за какой дверью машина, открывает одну из двух оставшихся дверей, за которой коза. После этого он предлагает вам выбрать одно из двух: выбрать другую дверь, или не менять свой выбор. Увеличатся ли шансы выиграть авто, если вы выберете другую дверь?

После того, как ведущий открыл одну из дверей с козой, автомобиль может быть либо за выбранной первоначально дверью, либо за оставшейся. С житейской точки зрения, вероятность выигрыша не зависит от первоначального выбора, при любом поведении одинакова и равна [math]0,5[/math] . Однако, такой ход рассуждений неверен. Предположим, что мы выбрали дверь номер [math]1[/math] . Пусть событие [math]A[/math] — автомобиль за дверью номер [math]2[/math] . [math]B[/math] — автомобиль за дверью номер [math] 3[/math] . [math]P(A) =\dfrac \cdot \dfrac = \dfrac; P(B) = \dfrac \cdot \dfrac= \dfrac[/math] , где [math]\dfrac[/math] — условная вероятность нахождения автомобиля именно за данной дверью при условии, что автомобиль не за дверью, выбранной игроком. Ведущий, открывая одну из оставшихся дверей, всегда проигрышную, сообщает тем самым игроку ровно [math]1[/math] бит информации и меняет условные вероятности для [math]B[/math] и [math]C[/math] соответственно на [math]"1"[/math] и [math]"0"[/math] . В результате выражения принимают вид: [math]P(A) = \dfrac \cdot 1 = \dfrac[/math] ; [math]P(B) = \dfrac \cdot 0 =0; [/math]

Таким образом, мы видим, что при любом первоначальном выборе, вероятность выиграть, если не менять решения — [math]\dfrac [/math] , а если поменять — [math]\dfrac [/math] , что противоречит интуитивному пониманию данного вопроса. Другими словами, если игрок меняет решение, то он проиграет в том и только в том случае, если первоначально выбрал дверь за которой автомобиль, а вероятность выбрать автомобиль первоначально составляет [math]\dfrac [/math] .

Иллюстрирует расхождение математического ожидания выигрыша и его житейской оценки.

Игроку в казино предлагают сыграть в игру, состоящую в следующем: после уплаты определённого вступительного взноса за участие в игре, игрок подбрасывает честную монету пока у него не выпадет орёл. Если у него выпал орёл с первой попытки, ему выплачивают рубль. Если со второй — два рубля. С третьей — [math]4[/math] , и так далее. После получения денег — игра закончена. Нужно определить, какого размера вступительный взнос должно просить казино, чтобы не остаться в убытке.

Согласно некоторым статистическим данным, игрок готов заплатить за участие в такой игре [math]10-20[/math] , редко [math]50[/math] рублей, что нелогично с математической точки зрения, ведь математическое ожидание выигрыша в такой ситуации равно бесконечности. Докажем это: Рассмотрим величину [math] E_ [/math] — математическое ожидание выигрыша с [math]n[/math] -й попытки:

[math] E_ = 1 \cdot \dfrac = 0,5[/math] ;

[math] E_ = 2 \cdot \dfrac = 0,5[/math] ;

Согласно линейности математического ожидания, ожидание выигрыша в этом случае равно [math]E_+E_+ \ldots = 0,5+0,5+0,5 = \infty [/math]
Данный парадокс до сих пор не имеет математически полного решения. Нетрудно заметить, что задача легко решается если наложить ограничения на количество игр и предельно малую вероятность, которую можно считать ненулевой.

Вероятность того, что в определённой игре количество бросков превысит [math]n[/math] , равна [math]\dfrac>[/math] . Пусть игрок может сыграть не более [math]k[/math] игр. Тогда вероятность того, что количество бросков хотя бы в одной игре превысит [math]n[/math] , равна [math]1-(1-\dfrac>)^[/math] .

[math]1 \cdot \dfrac + 2 \cdot \dfrac+ \ldots +2^ \cdot \dfrac>=\dfrac,[/math] где [math]n=\log_2 \dfrac

.[/math]

Таким образом, средний выигрыш равен [math]\dfrac \cdot \log_2 \dfrac

.[/math]

Представьте себя на месте Спящей красавицы. Вас разбудили. Какова вероятность того, что монета упала решкой?

Решение 1. У вас нет никакой информации о результате выпадения монеты и предыдущих побудках. Поскольку известно, что монета честная, можно предположить, что вероятность решки [math]\dfrac[/math] .

Решение 2. Проведём эксперимент [math]1000[/math] раз. Спящую красавицу будят в среднем [math]500[/math] раз с орлом и [math]1000[/math] раз с решкой (так как в случае решки спящую красавицу спрашивают [math]2[/math] раза). Поэтому вероятность решки [math]\dfrac[/math] .

[math]\dfrac[/math] — это вероятность решки при всей известной Красавице информации. Вероятностное пространство здесь таково: первый день, орёл — [math]\dfrac[/math] ; первый день, решка — [math]\dfrac[/math] ; второй день, решка — [math]\dfrac[/math] .

А [math]\dfrac[/math] в таком случае — это действительная доля пробуждений с решкой с учётом того, что каждая решка даёт два пробуждения, а каждый орёл — одно.

Некоторое время назад мне попалась на глаза статья, в которой шло обсуждение так называемого "Парадокса двух конвертов".
Парадокс давно уже опровергнут несколькими доказательствами и уже не сотрясает основы Вселенной.

Вкратце о его сути: двум участникам выдают по одному конверту, причем в одном конверте сумма больше, в другом — меньше. Каждый участник, после того как заглянет в конверт и ознакомится с суммой наличности, имеет возможность поменять конверт на конверт оппонента. При этом, какая сумма лежит в конверте у оппонента, участник не знает. Суть игры — сделать правильный выбор в пользу конверта с большей суммой.

В моем примере я создал рефери и участника шоу. Рефери берет два конверта и кладет в них деньги, причем в один конверт помещается сумма в два раза больше. Затем рефери тасует конверты и отдает их участнику шоу.

Далее я создал скрипт, который проверяет несколько сценариев. Каждый скрипт разыграл 1 миллион комбинаций конвертов.

Сценарии:
1) Участник выбирает конверт случайным образом.
2) Участник выбирает конверт случайным образом и затем делает выбор: оставлять конверт или взять другой.

Оба эти варианта закономерно вернули 50% удач и 50% неудач.

Но совсем не так себя повел вариант №3.

3) Рефери закладывает в конверт с малой суммой деньги в размере от $1 до $1 000 000. Во конверт с большой суммой рефери кладет в два раза больше денег. Таким образом, если в первом конверте $42, то в другом $84.
Участник выбирает первый конверт и смотрит его сумму. Затем он решает оставить ли себе этот конверт или поменять его на другой, руководствуясь двумя правилами:
а) Если участнику в первый раз попалась такая большая сумма, он оставляет этот конверт себе. Это чисто фиктивное правило, поскольку вполне хватает следующего условия.
б) Если среднее арифметическая сумма всех ранее получаемых денег ниже суммы в конверте, он так же оставляет этот конверт себе.

В случае если хотя бы одно правило выполнено, конверт остается у участника шоу. Иначе, он всегда выбирает другой конверт.

На одном миллионе итераций достигается стабильный результат — 76% успеха и 24% неудач. То есть, участник шоу, используя вышерасписанную стратегию, увеличивает вероятность угадывания конверта с большей суммой на 25%. При этом он ничего не знает о диапазоне сумм, и не знает сколько денег лежит во втором конверте.

Конечно, тут не так все просто. Картина начинает изменяться если мы:
а) изменим стратегию рефери: конверт с большей суммой отличается от конверта с малой суммой всего на $1.
б) уменьшим количество итераций и увеличим диапазон сумм.

И мы вновь возвращаемся к обычным 50 на 50. Я специально не выкладываю этот скрипт здесь, но поделюсь техническими данными:

1) Скрипт был написан на php, использовалась версия php 5.5.3 stable.
2) Пик использования памяти — 512кб памяти.
3) 1 млн. итераций выполнялись за 26 секунд.
4) Использовался рабочий четырехядерный компьютер неизвестной комплектации (я к нему логинюсь по ssh и руками не щупал).

Спасибо за внимание. Надеюсь, моя история по простому расследованию простой задачки была вам интересна и родит, так же как и сам парадокс, немало других интересных задач и их решений.

Envelop.jpg

Задача о двух конвертах (Парадокс двух конвертов) — известный парадокс, демонстрирующий как особенности субъективного восприятия теории вероятностей, так и границы её применимости. В облике двух конвертов этот парадокс предстал в конце 1980-х годов, хотя в различных формулировках известен математикам с первой половины XX века.

Содержание

Формулировка

Есть два неразличимых конверта с деньгами. В одном находится сумма в два раза большая, чем во втором. Величина этой суммы неизвестна. Конверты дают двум игрокам. Каждый из них может открыть свой конверт и пересчитать в нём деньги. После этого игроки должны решить: стоит ли обменять свой конверт на чужой? Оба игрока рассуждают следующим образом. Я вижу в своём конверте сумму . В чужом конверте равновероятно может находиться или " width="" height="" />
. Поэтому если я поменяю конверт, то у меня в среднем будет \right)/2 = \frac54X" width="" height="" />
, то есть больше, чем сейчас. Значит, обмен выгоден. Однако обмен не может быть выгоден обоим игрокам. Где в их рассуждениях кроется ошибка?

История

В 1953 году бельгийский математик Морис Крайчик предложил похожую задачу на примере двух галстуков [1] :

Крайчик утверждает, что симметрия в игре существует, но предполагает неправомерность использования вероятности ½ при вычислении среднего дохода [2] :

С точки зрения обоих участников спора игра симметрична и каждый имеет равную вероятность выиграть. Однако вероятность не является объективно данным фактом и зависит от знания условий задачи. В данном случае разумным является не пытаться оценивать вероятность.

From the point of view of the contestants the conditions of the game are symmetrical, so each has a probability of one-half of winning. In reality, however, the probability is not an objectively given fact, but depends upon one's knowledge of the circumstances. In the present case it is wise not to try to estimate the probability.

Однако Гарднер отмечает также, что подробного математического разбора задачи Крайчиком не было сделано:

к сожалению, это ничего не говорит нам о том, где именно в рассуждениях двух игроков кроется ошибка. Как мы ни бились, нам так и не удалось найти простое и удовлетворительное решение парадокса Крайчика.

В один конверт помещается некоторая сумма денег, неизвестная для других, и этот конверт отдаётся Али. Затем скрытно подбрасывается монета. Если выпадает орёл, во второй конверт кладётся сумма в два раза большая, чем в первом. В противном случае во второй конверт кладётся сумма в два раза меньшая. Этот конверт отдаётся Бабе. Али и Баба могут открыть свои конверты, не сообщая один другому суммы которые они там видят. После этого они могут (по обоюдному согласию) обменяться конвертами.

Предположим, что Али видит в своём конверте 10 $. Али предполагает, что в конверте у Бабы равновероятно могут находиться 5 $ или 20 $. В этом случае обмен конвертами приносит Али 2,5 $ (или 25 %). Аналогично Баба считает, что в конверте Али равновероятно находится сумма в два раза меньшая или большая, чем , которая находится у него. Поэтому в среднем, при обмене конвертов, он получает 5 x + x)/2 = 025 x" width="" height="" />
. Таким образом, Баба также ожидает получить в среднем 25 % дохода, по сравнению с суммой в своём конверте.

Однако, это является парадоксальным. Обмен конвертами не может быть выгоден обоим участникам. Где ошибка в их рассуждениях? [2]

Модификация Нейлбуфа условия задачи и предложенные им решения позволили многое прояснить по сути парадокса. Однако подбрасывание монетки после наполнения первого конверта заметно нарушало первоначальную симметрию капиталов игроков. При решении акцент смещался на доказательство неравноценности стартовых условий для Бабы по сравнению с Али. Поэтому в результате дальнейшей эволюции [5] , из условия задачи исчезла монетка, с помощью которой у Нейлбуфа определялось содержимое второго конверта.

На сегодняшний день наиболее широко известна и вызывает наибольший интерес у математиков идеально симметричная постановка с внешне неразличимыми конвертами, содержащими меньшую и в два раза большую суммы, причём один из конвертов можно открыть прежде, чем начать рассуждение о выгодности обмена.

Разрешение парадокса

Баба считает, что сумма, которую он видит, не имеет значения ввиду возможности того, что в его конверте сумма больше. Это значит, что Баба полагает, что вероятность того, что сумма в его конверте больше, составляет ½ независимо от увиденной суммы. Это верно только если каждое значение от нуля до бесконечности равновероятно. Но если всё бесконечное число возможностей равновероятно, шанс каждого значения имеет нулевую вероятность. Тогда у каждого исхода нулевой шанс. А это нонсенс.

Baba believes the amount he sees is uninformative with respect to the posterior probability his envelope contains the higher amount. That means that Baba believes that the probability his envelope contains the higher amount is ½ regardless of what amount he sees in the envelope. This is true only if every value, from zero to infinity, is equally likely. But if an infinite number of possibilities are all equally likely, the chance of any one outcome must be zero. Then every outcome has a zero chance, and this is nonsense.

f(x)

Обозначим через вероятность того, что в конверте Али находится сумма x. Когда Баба наблюдает в своём конверте сумму X, условная вероятность того, что Али в своём конверте имеет 2X, равна:

P(A=2X|B=X)=\frac<f(2X)></p>
<p><f(X/2)+f(2X)>.

В формулировке задачи Баба считает, что эта вероятность равна ½ независимо от того, какую сумму X он видит в своём конверте. Поэтому для всех . Это означает, что постоянна на интервале от 0 до бесконечности. Однако, такой вероятности, равномерной на всей вещественной полуоси, быть не может. Если вероятность положительна и постоянна везде, то сумма вероятностей равна бесконечности, что невозможно. Итак, исходное предположение парадокса (равновероятность Х/2 и 2Х) нереализуемо.

Два разумных и вполне правдоподобных рассуждения приводят к несовпадающим результатам. Это противоречие и называется "парадоксом двух конвертов". Существуют также версии названия: "парадокс двух шкатулок", "парадокс двух карманов" и т.д.

Вокруг этого парадокса время от времени вспыхивают споры в интернет-сообществе. Иногда появляются "сенсационные" заявления о том, что некто парадокс наконец решил. С другой стороны, часто в общих словах происходит, в принципе, верное объяснение сути, но без конкретных расчётов. В результате создаётся ощущение философского надувательства.

Несмотря на то, что парадокс достаточно прост, мне не удалось быстро найти подходящий источник, а так как сын срочно требовал разъяснений, пришлось сесть и написать сей трактат.

Напомним кратко историю. Парадокс был предложен в 1953 году Морисом Крайчиком в книге "Математические развлечения". Широкую известность он получил благодаря Мартину Гарднеру который описал его в книге "А ну-ка, догадайся!" в 1982 г. Исходная версия парадокса "Чей кошелёк толще?" звучала следующим образом:

Два человека решают сравнить суммы денег в их кошельках. При этом они договариваются, что тот, у кого их окажется меньше, забирает все деньги себе. Каждый из них рассуждает следующим образом. Максимум, что я могу проиграть это деньги которые имею. А выиграть могу больше, поэтому эта игра выгодна для меня.

Понятно, что симметричная игра не может быть одновременно выгодной обеим сторонам. Получается парадокс.

Гарднер отмечает, что Крайчик для объяснения рассматривает одинаковое равновероятное распределение вероятностей сумм в каждом кошельке. При этом получается нулевая матрица платежей и игра оказывается симметричной. Однако, пишет Гарднер, "к сожалению, это ничего не говорит нам о том, где именно в рассуждениях двух игроков кроется ошибка. Как мы ни бились, нам так и не удалось найти простое и удовлетворительное решение парадокса Крайчика." Неудивительно, что после такого заявления парадокс вызвал большой интерес.

Приведенная в начале статьи формулировка парадокса была сделана Барри Нейлбуфом в 1989 г. Чтобы парадокс Крайчика стал больше похож на задачу с двумя конвертами, необходимо чуть изменить рассуждения каждой из сторон:

Мы будем обсуждать парадокс в "современной" формулировке двух конвертов, и вернёмся к парадоксу Крайчика в заключительном разделе статьи.

Уточнение задачи

Математика работает с непротиворечиво определёнными моделями. Пока исходные формулировки нечётки, любые рассуждения могут привести к любому ответу, в результате чего и возникают такие парадоксы.

В задаче с двумя конвертами необходимо сначала определить способ формирования конвертов. Вариантов может быть множество. Для определённости будем считать, что ведущий игру выбирает некоторую сумму x m a x > , которую считает большей. Соответственно во второй конверт он кладёт x m i n = x m a x / 2 =x_/2> . После этого конверты случайно перемешиваются.

  • 1) Суммы, участвующие в игре, являются дискретными. Например, это может быть ограниченная последовательность < 1 , 2 , 4 , 8 >> с возможными парами конвертов ( 1 , 2 ) , ( 2 , 4 ) и ( 4 , 8 ) . Можно также рассматривать неограниченные (в одну или обе стороны) последовательности. Например: < . . . , 2 − 2 , 2 − 1 , 1 , 2 , 2 2 , . . . >,\,2^,\,1,\,2,\,2^,\. \>> . В любом случае вероятности будут дискретными числами p i > , где i — номер значения суммы.
  • 2) Суммы, участвующие в игре — непрерывные вещественные положительные числа. Их вероятность необходимо уже задавать при помощи плотности вероятности P ( x ) (или распределения вероятностей). В этом случае вероятность того, что при некотором малом Δ x , выбранное число попадёт в интервал [ x , x + Δ x ] , равняется P ( x ) Δ x .

В обоих вариантах должно выполняться условие нормировки, при котором полная вероятность любого исхода принимается за единичную. В общем случае условия нормировки имеют вид:

Невозможно разобрать выражение (синтаксическая ошибка): p_i = 1,\;\;\;\;\;\;\;или\;\;\;\;\;\;\; \int\limits^\infty_0 P(x)dx = 1.>

Ниже на левом рисунке представлен первый вариант, а на правом, соответственно, второй:

Envel Px.jpg

Понятно, что первый вариант на самом деле эквивалентен второму, но имеет более "изломанное убывание" на бесконечности. Тем не менее, нам будет удобнее их различать.

Задача двух конвертов в более общей постановке предполагает формирование различных стратегий поведения игрока и выбор из них наиболее доходной. Стратегии могут учитывать или не учитывать информацию о сумме x в открытом конверте. Например:

Сначала мы рассмотрим влияние краевого эффекта для равномерного распределения с границей. Мы увидим, что даже при формальном "отодвигании" границы на бесконечность существует более выигрышная "активная" стратегия. Кроме этого будут вычислены доходности различных стратегий в модифицированных правилах игры, при помощи которых делается попытка снизить влияние краевого эффекта. В этом случае конверты перестают быть симметричными. Затем мы найдём оптимальную стратегию для непрерывного убывающего распределения.

Новая формулировка парадокса была предложена уже в процессе обсуждения этой статьи в Интернете. Мы попробуем по-возможности с ней также разобраться. В заключение мы обсудим некоторые общие вопросы, связанные с понятием вероятности и причинами появления подобных парадоксов. Любители математики не склонные к математическим вычислениям ⌣ ¨ >> могут сразу перескочить к этому разделу.

Равномерное ограниченное распределение

Envel 24.jpg

Выше слева нарисовано равномерное ограниченное распределение плотности вероятностей. На правом рисунке изображено дерево вариантов, сопровождающих открытие конверта. С вероятностями 1/2 в открытом конверте может находиться меньшая ( x m i n > ) или большая сумма ( x m a x > ). Если эта сумма большая, она снова равновероятно может быть меньше или больше L / 2 .

Таким образом, существуют три исхода при открытии конверта со следующими вероятностями:

Упс. Фактически мы повторили рассуждение парадокса и, несмотря на все уточнения формулировки задачи, снова пришли к противоречию. Что неверно в наших вычислениях?

Зайдём с другого конца и вычислим абсолютный (безусловный) средний доход, получаемый игроком при выборе денег из открытого конверта. Большая и меньшая сумма в открытом конверте может появиться равновероятно. Меньшая сумма имеет равномерное распределение на интервале [ 0 , L / 2 ] . Поэтому её среднее значение равно L / 4 . Большая сумма, равномерно распределённая на интервале [ 0 , L ] , имеет среднее значение L / 2 . Поэтому среднее значение суммы в открытом конверте равно:

Очевидно, что такое же рассуждение и результат справедливы для средней доходности от выбора закрытого конверта. Поэтому средние доходности первой и второй стратегий равны ⟨ v 1 ⟩ = ⟨ v 2 ⟩ = 3 L / 8 \right\rangle =\left\langle v_\right\rangle =3L/8> .

i f x L 2 : x = x m i n x m a x L 2 p i = 2 / 3 1 / 3

Другими словами, каждую ступеньку необходимо разделить на 2 и результаты сложить. Итоговая плотность вероятности представлена ниже на правом рисунке:

Envel sum.jpg

Абсолютный средний доход от выбора второго конверта равен:

Этот же результат ранее мы получили более простым способом.

Чтобы найти средний доход, получаемый при использовании активной стратегии, необходимо снова проинтегрировать v 3 > c плотностью P ( x ) :

Закрытый конверт на 50\% более доходный. Это и понятно: дополнительное правило изменило симметрию между конвертами.

Абсолютная средняя доходность равна:

Неравномерное распределение

Таким образом, в приведенном выше алгоритме формирования случайно перемешанных конвертов, сумма x в открытом конверте имеет следующую плотность вероятности:

В частности, среднее значение суммы в открытом конверте равно:

Естественно, что такая же сумма в среднем будет находиться и в закрытом конверте.

Наша задача состоит в вычислении оптимального значения x 0 > .

После несложных преобразований, получаем:

Второй интеграл равен среднему доходу от пассивных стратегий. Первый интеграл — бонус за активность. Найдём его максимум, взяв производную по x 0 > и приравняв её нулю. Это даст следующее уравнение для x 0 > :

К примеру, вычислим доходности для распределения в виде убывающей экспоненты:

В результате, активная стратегия оказывается на 12\% более доходной, чем пассивные.

В случае немонотонных функций плотности распределения, эффективная стратегия может быть существенно более затейливой, чем простой пороговый выбор одного или другого конверта.

Парадокс возвращается

Существует очень любопытная модификация парадокса для дискретных сумм с убывающими вероятностями. Она была предложена в Интернете участником SeTosha при обсуждении классического парадокса двух конвертов. Мы рассмотрим несколько более общую формулировку этой задачи.

Поэтому, условные средние от выбора открытого и закрытого конверта можно записать следующим образом:

Компьютерное моделирование

Решение или проверка решения задач по теории вероятности почти всегда могут быть реализованы при помощи компьютера. Ниже приведен исходный код на C++, который моделирует игру с непрерывным постоянным распределением вероятностей шириной L .

Закомментированная строка соответствует дополнительному условию по началу игры (прерываем раунд, если в открытом конверте сумма больше, чем L / 2 ).

Для контроля статистической оценки достоверности получаемых результатов, в начале программы стоит "встряхиватель" случайных чисел: srand(time(0)). Несколько последовательных запусков позволят увидеть, какая цифра "дёргается". Это и есть примерная ошибка моделирования. Приведём примеры работы программы:

Каждая строка вычислений занимает около четверти секунды на машине средней мощности. Результаты работы с раскомментированным условием прерывания раунда следующие:

Заметим, что для проведения большого количества численных итераций необходимо обязательно использовать тип удвоенной точности double, а не одинарной — float. Ошибки округления достаточно быстро накапливаются, и без удвоенной точности появится систематическая ошибка. Вообще говоря, использование встроенного в С++ генератора случайных чисел для подобных моделирований это не лучший выбор. Он генерит только 32768 различных псевдослучайных чисел, хоти и с достаточно большим периодом повторения. Тем не менее для экспериментов "на скорую руку" он вполне приемлем.

Немного философии

Иногда на форумах при обсуждении задачи о двух конвертах, задаётся следующий вопрос:

Хорошо. Выбрав конкретные правила игры (=распределение), можно показать, что противоречия нет. Но как быть, если игрок не знает каким образом формируются конверты и суммы в них. В этом же случае вероятности по-любому 50/50?

Нет, это не верно. Важно понимать, что отсутствие знания не свидетельствует о равновероятности исходов. Наоборот, равновероятность возникает, если мы уверены в симметричности исходов, поэтому:

Теория вероятностей может оперировать только вероятностями, которые заданны из соображений симметрии или получены в эмпирическом исследовании. Например, подбрасывая симметричную монету мы присваиваем каждому исходу (орёл или решка) вероятность 1/2 именно потому, что монета симметрична, а не потому, что мы не знаем, что выпадет. Бросая кость, мы тоже не знаем что выпадет, но из соображений симметрии уже считаем вероятности равными 1/6. Если проводится эмпирическое определение вероятностей, исходя из наблюдаемых частот, то мы предполагаем, что эти вероятности не изменяются во времени (чего увы нет, например, на финансовых рынках).

Ни каких других способов задания вероятностей нет. Ещё раз напомним, что математика — это игра с чётко определёнными правилами. Неявный выход за них и приводит парадоксам.

Незнание не обладает симметрией. Чтобы незнание превратить в числа (вероятности) необходимо, как минимум провести некое эмпирическое исследование. Однако и в этом случае математика подстерегает множество неприятностей (нестационарность, возможность чуда и т.п.).

Стоит напомнить старую шутку про блондинку, которая уверена, что завтра она с вероятностью 1/2 встретит динозавра, потому, что она его либо встретит, либо не встретит. Во времена культа политкорректности, эта шутка не актуальна и сейчас уже все блондинки умеют вычислять вероятности и знают, что динозавры давно вымерли ⌣ ¨ >> .

Эти же блондинки понимают, что если им неизвестно в какую геологическую эпоху они живут, нельзя априори присвоить событию встречи динозавра ту или иную вероятность. И уж точно это не будет вероятность равная 1/2.

Теперь мы можем вернуться к парадоксу Крайчика с двумя кошельками. Напомним, что вывод о выгодности игры для каждого игрока был сделан на основании вероятностей выигрыша или проигрыша равных 1/2. Действительно, если бы, например, вероятность выиграть некоторую сумму была существенно ниже вероятности лишиться своих денег, вряд-ли участвующие желали бы сыграть в такую игру.

Поэтому это типичная сказка о динозавре. На основании незнания делается вывод о равновероятности, а затем применяется теория вероятности. В результате получается парадокс.

Таким образом, мы проанализировали задачу двух конвертов на примере различных распределений вероятностей для сумм, находящихся в конвертах. Если игра происходит без ограничений (нет селекции открытого конверта), то доходность выбора открытого и закрытого конвертов одинаковы, как и следует из соображений симметрии. Однако существует более доходная ("активная") стратегия, учитывающая значение суммы в открытом конверте. В случае равномерного ограниченного и монотонно убывающего распределений эта стратегия пороговая. В зависимости от того больше x некоторой константы или меньше, выбирается открытый или закрытый конверт.

Парадокс двух конвертов возникает по двум причинам. Во-первых проводится некорректное вычисление условного среднего дохода при выборе закрытого конверта. Во-вторых это вычисление делается без конкретизации условий задачи, с неверной посылкой о том, что незнание этих условий соответствует равновероятности всех исходов.

Читайте также: