Игры с природой кратко

Обновлено: 04.07.2024

Примеры игры с природой: определение объема выпуска сезонной продукции в ожидании наиболее выгодного уровня спроса для ее реализации или формирование пакета ценных бумаг в расчете на более высокие дивиденды.
В играх с природой степень неопределенности возрастает приприня тии решения сознательным игроком, поскольку если в стратегических играх каждый из участников ожидает наихудшего для себя результата от действий партнера, то природа может принимать такие ответные действия, которые ей совсем невыгодны, а выгодны сознательному игроку. Поэтому можно сказать, что природа коварна, но не злонамеренна, она не стремится использовать в своих интересах ошибки соперника или информацию о его стратегии.

Решение.
Мэр городка имеет возможность приобрести летом от 6000 т до 8000 т угля. В зависимости от типа зимы затраты (в млн. руб.) на приобре тение угля представим в виде таблицы 1.

Закупка угля, т Виды зимы $\alpha _i$
Мягкая Обычная Холодная
6000 -398 -398 -406 -406
7000 -455 -455 -464 -464
8000 -520 -520 -520 -520
$\beta _i$ -390 -398 -406

Найдем нижнюю и верхнюю цену игры, получим

Значит, игра имеет седловую точку, а чистая стратегия мэра города состоит в покупке 6000 т угля летом, при этом в бюджете го родка на отопление требуется выделить 406 млн. руб.
Замечание. Так как игра из примера 1 имеет седловую точку, то ее платежная матрица может быть упрощена. Однако при упрощении матрицы нельзя отбрасывать доминируемые стратегии природы, так как она может реализовать любое свое состояние независимо от того, выгодно это игроку или нет.

Себестоимость еденицы прдукции,руб.

Игрок Природа $\alpha _$
Теплая погода Холодная погода
"6000 ед. кваса и 1000 ед. чая" 2700 -1600 -16200
"1200 ед. кваса и 4000 ед. чая" -3200 16800 -3200

Нижняя и верхняя цены игры равны $\alpha = -3200$ и $\beta = 16800$ соответственно.

Так как природа может реализовать любое свое состояние, то найдем стратегию менеджера предприятия. Составим математическую модель задачи.Увеличим все элементы платежной матрицы на 16200, тогда если $p= (p_1\cdot p_2)$ - смешанная стратегия менеджера, то требуется найти неотрицательные значения переменных $p_1, p_2$ и $\nu$ удовлетворяющих ситеме ограничений

$$\left\
43200p_1 & &\geq \nu \\
13000p_1 &+33000p_2 &\geq \nu \\
p_1 & +p2 & = 1
\end\right.$$

и обращающих в максимум функцию

Введем неотрицательные фиктивные переменные $p_3 и p_4$, тогда система ограничений прмет вид:

$$\left\
43200p_1 & &-p_3 & &-\nu = 0 \\
13000p_1 &+33000p_2 & &-p_4 &-\nu = 0 \\
p_1 &+p_2 & & &= 1
\end\right.$$

Решив задачу симплекс-методом, получим

Таким образом, в среднем ежедневно целесообразно призводить $6000p_1+1200p_2=2719$ ед.кваса и $1000p_1+4000p_2=3051$ ед. чая. При этом, независимо от погоды, средний доход компании составит 6357 руб.

В рассмотренных выше матричных играх предполагалось, что в них принимают участие два игрока, интересы которых противоположны. Поэтому действия каждого игрока направлены на увеличение выигрыша (уменьшение проигрыша). Однако в некоторых задачах, приводящихся к игровым, имеется неопределенность, вызванная отсутствием информации об условиях, в которых осуществляется действие (погода, покупательский спрос и т. д.). Эти условия зависят не от сознательных действий другого игрока, а от объективной действительности. Такие игры называются играми с природой. Человек в играх с природой старается действовать осмотрительно, второй игрок (природа, покупательский спрос) действует случайно.

Условия игры задаются матрицей

Пусть игрок Аимеет стратегии А1, А2, …, Аm, а природа – состояния В1, В2, …, Вn. Наиболее простой является ситуация, когда известна вероятность pj каждого состояния природы Вj. При этом, если учтены все возможные состояния, p1 + p2 + … + pj + … + pn = 1.

Если игрок Авыбирает чистую стратегию Аi , то математическое ожидание выигрыша составит p1 ai1 + p2 ai2 + … + pn ain. Наиболее выгодной будет та стратегия, при которой достигается

Если информация о состояниях с природой мала, то можно применить принцип недостаточного основания Лапласа, согласно которому можно считать, что все состояния природы равновероятностны:

т.е. стратегию, для которой среднее арифметическое элементов соответствующей строки максимальное.

Имеется ряд критериев, которые используются при выборе оптимальной стратегии. Рассмотрим некоторые из них.

1. Критерий Вальда. Рекомендуется применять максиминную стратегию. Она выбирается из условия

и совпадает с нижней ценой игры. Критерий является пессимистическим, считается, что природа будет действовать наихудшим для человека способом.

2. Критерий максимума. Он выбирается из условия

Критерий является оптимистическим, считается, что природа будет наиболее благоприятна для человека.

3. Критерий Гурвица. Критерий рекомендует стратегию, определяемую по формуле

где a - степень оптимизма и изменяется в диапазоне [0, 1].

Критерий придерживается некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего поведения природы. При a = 1 критерий превращается в критерий Вальда, при a = 0 - в критерий максимума. На a оказывает влияние степень ответственности лица, принимающего решение по выбору стратегии. Чем больше последствия ошибочных решений, больше желания застраховаться, тем a ближе к единице.

4. Критерий Сэвиджа. Суть критерия состоит в выборе такой стратегии, чтобы не допустить чрезмерно высоких потерь, к которым она может привести. Находится матрица рисков, элементы которой показывают, какой убыток понесет человек (фирма), если для каждого состояния природы он не выберет наилучшей стратегии.

Элементы матрицы рисков находятся по формуле

где - максимальный элемент в столбце исходной матрицы.

Оптимальная стратегия определяется выражением

При принятии решений в условиях неопределенности следует оценивать различные варианты с точки зрения нескольких критериев. Если рекомендации совпадают, можно с большей уверенностью выбрать наилучшее решение; если рекомендации противоречат друг другу, окончательное решение надо принимать с учетом его сильных и слабых сторон.

Пример. Возможно строительство четырех типов электростанций: А1 (тепловых), А2 (приплотинных), А3 (бесшлюзовых), А4 (шлюзовых). Состояния природы обозначим через Р1, Р2, Р3, Р4. Экономическая эффективность строительства отдельных типов электростанций изменяется в зависимости от состояния природы и задана матрицей

1) Согласно критерию Вальда

следует строить бесшлюзовую электростанцию.

2) Воспользуемся критерием Сэвиджа. Построим матрицу рисков:

Согласно критерию Сэвиджа определяем

В соответствии с этим критерием также предлагается строить бесшлюзовую электростанцию.

3) Воспользуемся критерием Гурвица. Положим a=1/2.

т.е. следует принять решение о строительстве приплотинной электростанции.

4) Если принять известным распределение вероятностей для различных состояний природы, например считать эти состояния равновероятностными (р1=р2=р3=р4=1/4), то для принятия решения следует найти математические ожидания выигрыша:




Так как максимальное значение имеет М3, то следует строить бесшлюзовую электростанцию.

В рассмотренных выше матричных играх предполагалось, что в них принимают участие два игрока, интересы которых противоположны. Поэтому действия каждого игрока направлены на увеличение выигрыша (уменьшение проигрыша). Однако в некоторых задачах, приводящихся к игровым, имеется неопределенность, вызванная отсутствием информации об условиях, в которых осуществляется действие (погода, покупательский спрос и т. д.). Эти условия зависят не от сознательных действий другого игрока, а от объективной действительности. Такие игры называются играми с природой. Человек в играх с природой старается действовать осмотрительно, второй игрок (природа, покупательский спрос) действует случайно.

Условия игры задаются матрицей

Пусть игрок Аимеет стратегии А1, А2, …, Аm, а природа – состояния В1, В2, …, Вn. Наиболее простой является ситуация, когда известна вероятность pj каждого состояния природы Вj. При этом, если учтены все возможные состояния, p1 + p2 + … + pj + … + pn = 1.

Если игрок Авыбирает чистую стратегию Аi , то математическое ожидание выигрыша составит p1 ai1 + p2 ai2 + … + pn ain. Наиболее выгодной будет та стратегия, при которой достигается

Если информация о состояниях с природой мала, то можно применить принцип недостаточного основания Лапласа, согласно которому можно считать, что все состояния природы равновероятностны:

т.е. стратегию, для которой среднее арифметическое элементов соответствующей строки максимальное.

Имеется ряд критериев, которые используются при выборе оптимальной стратегии. Рассмотрим некоторые из них.

1. Критерий Вальда. Рекомендуется применять максиминную стратегию. Она выбирается из условия

и совпадает с нижней ценой игры. Критерий является пессимистическим, считается, что природа будет действовать наихудшим для человека способом.

2. Критерий максимума. Он выбирается из условия

Критерий является оптимистическим, считается, что природа будет наиболее благоприятна для человека.

3. Критерий Гурвица. Критерий рекомендует стратегию, определяемую по формуле

где a - степень оптимизма и изменяется в диапазоне [0, 1].

Критерий придерживается некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего поведения природы. При a = 1 критерий превращается в критерий Вальда, при a = 0 - в критерий максимума. На a оказывает влияние степень ответственности лица, принимающего решение по выбору стратегии. Чем больше последствия ошибочных решений, больше желания застраховаться, тем a ближе к единице.

4. Критерий Сэвиджа. Суть критерия состоит в выборе такой стратегии, чтобы не допустить чрезмерно высоких потерь, к которым она может привести. Находится матрица рисков, элементы которой показывают, какой убыток понесет человек (фирма), если для каждого состояния природы он не выберет наилучшей стратегии.

Элементы матрицы рисков находятся по формуле

где - максимальный элемент в столбце исходной матрицы.

Оптимальная стратегия определяется выражением

При принятии решений в условиях неопределенности следует оценивать различные варианты с точки зрения нескольких критериев. Если рекомендации совпадают, можно с большей уверенностью выбрать наилучшее решение; если рекомендации противоречат друг другу, окончательное решение надо принимать с учетом его сильных и слабых сторон.

Пример. Возможно строительство четырех типов электростанций: А1 (тепловых), А2 (приплотинных), А3 (бесшлюзовых), А4 (шлюзовых). Состояния природы обозначим через Р1, Р2, Р3, Р4. Экономическая эффективность строительства отдельных типов электростанций изменяется в зависимости от состояния природы и задана матрицей

1) Согласно критерию Вальда

следует строить бесшлюзовую электростанцию.

2) Воспользуемся критерием Сэвиджа. Построим матрицу рисков:

Согласно критерию Сэвиджа определяем

В соответствии с этим критерием также предлагается строить бесшлюзовую электростанцию.

3) Воспользуемся критерием Гурвица. Положим a=1/2.

т.е. следует принять решение о строительстве приплотинной электростанции.

4) Если принять известным распределение вероятностей для различных состояний природы, например считать эти состояния равновероятностными (р1=р2=р3=р4=1/4), то для принятия решения следует найти математические ожидания выигрыша:

Так как максимальное значение имеет М3, то следует строить бесшлюзовую электростанцию.

Разделы лекции:

1. Понятие игры с природой.

2. Критерии выбора оптимальных решений в условиях полной неопределенности.

3. Критерии выбора оптимальных решений в условиях риска.

РАЗДЕЛ 1. ПОНЯТИЕ ИГРЫ С ПРИРОДОЙ.

КАКОВЫ ОСНОВНЫЕ ОТЛИЧИЯ СТАТИСТИЧЕСКОЙ ИГРЫ ОТ МАТРИЧНОЙ ИГРЫ?

- отсутствие стремления к выигрышу у игрока-ПРИРОДЫ, т. е. отсутствие антагонистического противника;

- возможность игрока-статистика провести статис­тический эксперимент для получения дополнительной информа­ции о стратегиях природы.

Таким образом, теория статистических решений является теорией проведения статистических наблюдений, обработки этих наблюдений и их использования. Для принятия решений в условиях риска используют методы теории вероятностей, если это возможно, по причине массовости явления. В таком случае факторы, например, состояния среды, представляют собой либо случайные величины, либо случайные функции. Они описываются какими-либо статистическими ха­рактеристиками, например математическим ожиданием и дисперсией, и обладают статистической устойчивостью.

КАК СТРОИТСЯ МАТРИЦА ВЫИГРЫШЕЙ В ИГРЕ С ПРИРОДОЙ?

В ЧЕМ ЗАКЛЮЧАЕТСЯ СОДЕРЖАТЕЛЬНОЕ ОТЛИЧИЕ МАТРИЦЫ ВЫИГРЫШЕЙ В ИГРЕ С ПРИРОДОЙ ОТ ПЛАТЕЖНОЙ МАТРИЦЫ КОНЕЧНОЙ АНТАГОНИСТИЧЕСКОЙ ИГРЫ?

На практике часто появляется необходимость согласования действий фирм, объединений, министерств и других участников проектов в случаях, когда их интересы не совпадают. В таких ситуациях теория игр позволяет найти лучшее решение для поведения участников, обязанных согласовывать действия при столкновении интересов. Теория игр все шире проникает в практику экономических решений и исследований. Ее можно рассматривать как инструмент, помогающий повысить эффективность плановых и управленческих решений. Это имеет большое значение при решении задач в промышленности, сельском хозяйстве, на транспорте, в торговле, особенно при заключении договоров с иностранными партнерами на любых уровнях.

Содержание
Прикрепленные файлы: 1 файл

Прохорова.doc

Традиционно следующим этапом такого развития являются так называемые игры с природой. Формально изучение “игр с природой“, так же как и стратегических, должно начинаться с построения платежной матрицы, что является, по существу, наиболее трудоемким этапом подготовки принятия решения. Ошибки в платежной матрице не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату.

Швейная фабрика на летний сезон может реализовать два вида костюмов: 1200 костюмов по цене 520 руб. и 200 костюмов по цене 1000 руб., если погода будет жаркой. Если погода будет холодной, то фабрика может реализовать 650 костюмов первого вида и 700 костюмов второго вида.

Определить план выпуска костюмов каждого вида и прибыль, полученную от их реализации.

Швейная фабрика располагает двумя стратегиями: А1 - погода будет жаркой и А2 – погода будет холодной.

Если фабрика воспользуется первой стратегией и погода действительно будет жаркой, то прибыль фабрики составит:

1200 · 520 + 200 · 1000 = 624 000 + 200 000 = 824 000 руб.

Если фабрика воспользуется первой стратегией, но погода будет холодной, то прибыль фабрики составит:

650 · 520 + 200 · 1000 – (1200 – 650) · 520 = 338 000 + 200 000 – 286 000 = 252 000 руб.

Если фабрика воспользуется второй стратегией и погода действительно будет холодной, то прибыль фабрики составит:

650 · 520 + 700 · 1000 = 338 000 + 700 000 = 1 038 000 руб.

Если фабрика воспользуется второй стратегией, но погода будет жаркой, то прибыль фабрики составит:

650 · 520 + 200 · 1000 – (700 – 200) · 1000 = 338 000 + 200 000 – 500 000 = 38 000 руб.

Составим матрицу прибыли.

α = max (252 000; 38 000) = 252 000 руб.

β = min (824 000; 1 038 000) = 824 000 руб.

Таким образом, цена игры находится в диапазоне от 252 000 руб. до 824 000 руб.

Минимальный гарантированный доход швейной фабрики составит 252 000 руб., но возможен и доход в 824 000 руб.

Определим план выпуска изделий швейной фабрикой. Вероятность выбора стратегии А1 обозначим через х1, а вероятность выбора стратегий А2 – через х2. Учитывая, что х2 = 1 - х1,можем записать:

(a11 – a12)· х1 + a12 = (824 000 – 38 000)· х1 + 38 000 = 786 000 х1 + 38 000;

(a21 – a22)· х1 + a22 = (252 000 – 1 038 000) · х1 + 1 038 000 = -786 000 х1 + 1 038 000;

786 000 х1 + 786 000 х1 = 1 038 000 – 38 000

1 572 000 х1 = 1 000 000

х1 = 0,64; х2 = 1 – 0,64х2 = 0,36;

0,64 (1200; 200) + 0,36 (650; 700) = (1002; 380).

Цена игры составит: 786 000 х1 + 38 000 = 541 040 руб.

Таким образом, план выпуска изделий таков: 1002 костюма первого вида и 380 костюмов второго вида, и при любых погодных условиях швейная фабрика получит прибыль не менее 541 000 руб.

1. Критерий Вальде:

max (min a ij) = max (38 000; 252 000) = 252 000 руб.

Швейной фабрике целесообразно использовать стратегию А1 .

2. Критерий максимума:

max (max a ij ) = max (824 000; 1 038 000) = 1 038 000 руб.

Швейной фабрике целесообразно использовать стратегию А2 .

3. Критерий Гурвица:

пусть α = 0,4 , тогда для стратегии А1

α min a ij + (1 - α) max a ij = 0,4 · 252 000 + (1 – 0,4) · 824 000 = 595 200 руб.

для стратегии А2

α min a ij + (1 - α) max a ij = 0,4 · 38 000 + (1 – 0,4) · 1 038 000 = 638 000 руб.

Швейной фабрике целесообразно использовать стратегию А2 .

Теория игр полезна, когда требуется определить важные факторы принятия решений в условиях конкурентной борьбы. Благодаря ей, можно предположить примерное затрачивание ресурсов и времени для достижения цели, и стоит она того. Так же большое преимущество теории игр в том, что ее можно применить к задачам связи, к вопросам технологии, медицины, нефтедобычи, спорта, рыболовства, к противовоздушной обороне, к задачам, которые приходится решать командиру в сражении, к задачам разоружения и т.д.

Недостаток Теории игр в том, что есть игры, в которых проработка сложных ситуаций требует большого количества времени. Для их вычисления требуется специальное программное обеспечение, и мощная база вычислительных машин. Ведь для исследования даже самой простой ситуации в торгово-экономической сфере, бывает необходимым провести большое количество вычислений. Но это не значительный недостаток, так как электроника не стоит на месте, она развиваются, вычислительные машины становятся мощнее, их скорость вычислений увеличивается в несколько раз. В будущем, на проработку игр, которых раньше уходило до несколько лет, будет уходить лишь несколько дней.

Читайте также: