Критерий вальда гурвица сэвиджа лапласа кратко

Обновлено: 16.05.2024

Разделы лекции:

1. Понятие игры с природой.

2. Критерии выбора оптимальных решений в условиях полной неопределенности.

3. Критерии выбора оптимальных решений в условиях риска.

РАЗДЕЛ 1. ПОНЯТИЕ ИГРЫ С ПРИРОДОЙ.

КАКОВЫ ОСНОВНЫЕ ОТЛИЧИЯ СТАТИСТИЧЕСКОЙ ИГРЫ ОТ МАТРИЧНОЙ ИГРЫ?

- отсутствие стремления к выигрышу у игрока-ПРИРОДЫ, т. е. отсутствие антагонистического противника;

- возможность игрока-статистика провести статис­тический эксперимент для получения дополнительной информа­ции о стратегиях природы.

Таким образом, теория статистических решений является теорией проведения статистических наблюдений, обработки этих наблюдений и их использования. Для принятия решений в условиях риска используют методы теории вероятностей, если это возможно, по причине массовости явления. В таком случае факторы, например, состояния среды, представляют собой либо случайные величины, либо случайные функции. Они описываются какими-либо статистическими ха­рактеристиками, например математическим ожиданием и дисперсией, и обладают статистической устойчивостью.

КАК СТРОИТСЯ МАТРИЦА ВЫИГРЫШЕЙ В ИГРЕ С ПРИРОДОЙ?

В ЧЕМ ЗАКЛЮЧАЕТСЯ СОДЕРЖАТЕЛЬНОЕ ОТЛИЧИЕ МАТРИЦЫ ВЫИГРЫШЕЙ В ИГРЕ С ПРИРОДОЙ ОТ ПЛАТЕЖНОЙ МАТРИЦЫ КОНЕЧНОЙ АНТАГОНИСТИЧЕСКОЙ ИГРЫ?

Формула критерия среднего выигрыша

Формула критерия среднего выигрыша

Формула оптимального решения

таблица

В итоги оптимальным вариантом выбора программы по критерию среднего выигрыша является вариант первой программы.

Формула критерия Вальда или максимина

Формула критерия Вальда

Формула оптимального решения по критерию Лапласа

Формула оптимального решения по критерию Лапласа

таблица

По критерию Вальда оптимальным решением является выбор первой программы.

Формула критерия максимакса

Формула критерия максимакса

Формула оптимального решения по критерию максимакса

Формула критерия максимакса

таблица

По критерию максимакса оптимальным решением является выбор третьей программы.

Формула критерия Лапласа

Формула критерия Лапласа оптимальное решение

Формула оптимального решения по критерию Лапласа

Формула критерия Лапласа оптимальное решение

таблица

По критерию Лапласа оптимальным решением является выбор первой программы.

таблица

Формула критерия Гурвица

Формула критерия Гурвица

Формула оптимального решения по Гурвица критерию

Формула критерия Гурвица

Коэффициент α принимает значения от 0 до 1. Если α стремится к 1, то критерий Гурвица приближается к критерию Вальда, а при α стремящемуся к 0, то критерий Гурвица приближается к критерию максимакса.

По критерию Гурвица оптимальным решением является выбор третьей программы.

Формула критерия Сэвиджа для построения матрицы потерь

Формула критерия Сэвиджа

Формула для выбора максимального значения из матрицы потерь

Формула критерия Сэвиджа

Формула оптимального решения по критерию Сэвиджа

Формула критерия Сэвиджа

таблица

Строим матрицу потерь по столбцам выбираем максимальное значение и поочередно вычитаем значения каждой ячейки соответствующего столбца согласно формуле, в итоге получим матрицу вида

матрица потерь пример

По критерию Сэвиджа оптимальным решением является выбор первой или четвёртой программы.

Таким образом, в соответствии со всеми приведёнными критериями большинство решений указывает на выбор первой программы.


9350

Инструкция . Для выбора оптимальной стратегии в онлайн режиме необходимо задать размерность матрицы. Затем в новом диалоговом окне выбрать необходимые критерии и коэффициенты. Также можно вставить данные из Excel . Примечание: Сначала, если возможно, упрощают матрицу, вычеркивая невыгодные стратегии A. Стратегии природы вычеркивать нельзя, т. к. каждое из состояний природы может наступить случайным образом, независимо от действий A .

Любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под "природой" понимается совокупность неопределенных факторов; влияющих на эффективность принимаемых решений. Безразличие природы к игре (выигрышу) к возможность получения экономистом (статистиком) дополнительной информации о ее состоянии отличают игру экономиста с природой от обычной матричной игры, в которой принимают участие два сознательных игрока.

Теория игр — математическая дисциплина, рассматривающая моделирование действий игроков, которые имеют цель, заключающуюся в выбор оптимальных стратегий поведения в условиях конфликта. На Хабре эта тема уже освещалась, но сегодня мы поговорим о некоторых ее аспектах подробнее и рассмотрим примеры на Kotlin.

Так вот, стратегия – это совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации. Оптимальная стратегия игрока – стратегия, обеспечивающая наилучшее положение в данной игре, т.е. максимальный выигрыш. Если игра повторяется неоднократно и содержит, кроме личных, случайные ходы, то оптимальная стратегия обеспечивает максимальный средний выигрыш.

Задача теории игр – выявление оптимальных стратегий игроков. Основное предположение, исходя из которого находятся оптимальные стратегии, заключается в том, что противник (или противники) не менее разумен, чем сам игрок, и делает все для того, чтобы добиться своей цели. Расчет на разумного противника – лишь одна из потенциальных позиций в конфликте, но в теории игр именно она кладется в основу.

  1. задача о принятии решений в условиях риска, когда известны вероятности, с которыми природа принимает каждое из возможных состояний;
  2. задачи о принятии решений в условиях неопределенности, когда нет возможности получить информацию о вероятностях появления состояний природы.

Сейчас мы рассмотрим критерии принятия решений в чистых стратегиях, а в конце статьи решим игру в смешанных стратегиях аналитическим методом.

Я не являюсь специалистом в теории игр, а в этой работе использовал Kotlin в первый раз. Однако решил поделиться своими результатами. Если вы заметили ошибки в статье или хотите дать совет, прошу в личку.

Постановка задачи

Все критерии принятия решений мы разберем на сквозном примере. Задача такова: фермеру необходимо определить, в каких пропорциях засеять свое поле тремя культурами, если урожайность этих культур, а, значит, и прибыль, зависят от того, каким будет лето: прохладным и дождливым, нормальным, или жарким и сухим. Фермер подсчитал чистую прибыль с 1 гектара от разных культур в зависимости от погоды. Игра определяется следующей матрицей:


Далее эту матрицу будем представлять в виде стратегий:


Искомую оптимальную стратегию обозначим . Решать игру будем с помощью критериев Вальда, оптимизма, пессимизма, Сэвиджа и Гурвица в условиях неопределенности и критериев Байеса и Лапласа в условиях риска.

Как и говорилось выше примеры будут на Kotlin. Замечу, что вообще-то существуют такие решения как Gambit (написан на С), Axelrod и PyNFG (написанные на Python), но мы будем ехать на своем собственном велосипеде, собранном на коленке, просто ради того, чтобы немного потыкать стильный, модный и молодежный язык программирования.

Чтобы программно реализовать решение игры заведем несколько классов. Сначала нам понадобится класс, позволяющий описать строку или столбец игровой матрицы. Класс крайне простой и содержит список возможных значений (альтернатив или состояний природы) и соответствующего им имени. Поле key будем использовать для идентификации, а также при сравнении, а сравнение понадобится при реализации доминирования.

Игровая матрица содержит информацию об альтернативах и состояниях природы. Кроме того в ней реализованы некоторые методы, например нахождение доминирующего множества и чистой цены игры.

Опишем интерфейс, соответствующий критерию

Принятие решений в условиях неопределенности

Принятие решений в условиях неопределённости предполагает, что игроку не противостоит разумный противник.

Критерий Вальда


Использование критерия страхует от наихудшего результата, но цена такой стратегии – потеря возможности получить наилучший из возможных результатов.

Рассмотрим пример. Для стратегий найдем минимумы и получим следующую тройку . Максимумом для указанной тройки будет являться значение 1, следовательно, по критерию Вальда выигрышной стратегией является стратегия , соответствующая посадке Культуры 2.

Программная реализация критерия Вальда незатейлива:


Для большей понятности в первый раз покажу, как решение выглядело бы в виде теста:

Нетрудно догадаться, что для других критериев отличие будет только в создании объекта criteria .

Критерий оптимизма


При использовании критерия оптимиста игрок выбирает решение, дающее лучший результат, при этом оптимист предполагает, что условия игры будут для него наиболее благоприятными:


Стратегия оптимиста может привести к отрицательным последствиям, когда максимальное предложение совпадает с минимальным спросом – фирма может получить убытки при списании нереализованной продукции. В тоже время стратегия оптимиста имеет определённый смысл, например, не нужно заботиться о неудовлетворённых покупателях, поскольку любой возможный спрос всегда удовлетворяется, поэтому нет нужды поддерживать расположения покупателей. Если реализуется максимальный спрос, то стратегия оптимиста позволяет получить максимальную полезность в то время, как другие стратегии приведут к недополученной прибыли. Это даёт определённые конкурентные преимущества.

Рассмотрим пример. Для стратегий найдем найдем максимум и получим следующую тройку . Максимумом для указанной тройки будет являться значение 5, следовательно, по критерию оптимизма выигрышной стратегией является стратегия , соответствующая посадке Культуры 1.

Реализация критерия оптимизма почти не отличается от критерия Вальда:

Критерий пессимизма


Данный критерий предназначен для выбора наименьшего элемента игровой матрицы из ее минимально возможных элементов:


Критерий пессимизма предполагает, что развитие событий будет неблагоприятным для лица, принимающего решение. При использовании этого критерия лицо принимающее решение ориентируется на возможную потерю контроля над ситуацией, поэтому, старается исключить потенциальные риски выбирая вариант с минимальной доходностью.

Рассмотрим пример. Для стратегий найдем найдем минимум и получим следующую тройку . Минимумом для указанной тройки будет являться значение -1, следовательно, по критерию пессимизма выигрышной стратегией является стратегия , соответствующая посадке Культуры 3.

После знакомства с критериями Вальда и оптимизма то, как будет выглядеть класс критерия пессимизма, думаю, легко догадаться:

Критерий Сэвиджа

Критерий Сэвиджа (критерий сожалеющего пессимиста) предполагает минимизацию наибольшей потерянной прибыли, иными словами минимизируется наибольшее сожаление по потерянной прибыли:


В данном случае S — это матрица сожалений.

Оптимальное решение по критерию Сэвиджа должно давать наименьшее сожаление из найденных на предыдущем шаге решения сожалений. Решение, соответствующее найденной полезности, будет оптимальным.

К особенностям полученного решения относятся гарантированное отсутствие самых больших разочарований и гарантированное снижение максимальных возможных выигрышей других игроков.

Рассмотрим пример. Для стратегий составим матрицу сожалений:


Тройка максимальных сожалений . Минимальным значением из указанных рисков будет являться значение 4, которое соответствует стратегиям и .

Запрограммировать критерий Сэвиджа немного сложнее:

Критерий Гурвица

Критерий Гурвица является регулируемым компромиссом между крайним пессимизмом и полным оптимизмом:


A(0) — стратегия крайнего пессимиста, A(k) — стратегия полного оптимиста, — задаваемое значение весового коэффициента: ; — крайний пессимизм, — полный оптимизм.

При небольшом числе дискретных стратегий, задавая желаемое значение весового коэффициента , а затем округлять получаемый результат до ближайшего возможного значения с учётом выполненной дискретизации.

Рассмотрим пример. Для стратегий . Примем, что коэффициент оптимизма . Теперь составим таблицу:


Максимальным значением из рассчитанных H будет являться значение 3, которое соответствует стратегии .

Реализация критерия Гурвица уже более объемная:

Принятие решений в условиях риска

Методы принятия решений могут полагаться на критерии принятия решений в условиях риска при соблюдении следующих условий:

  • отсутствия достоверной информации о возможных последствиях;
  • наличия вероятностных распределений;
  • знания вероятности наступления исходов или последствий для каждого решения.

Критерий ожидаемого значения может быть сведен либо к максимизации ожидаемой (средней) прибыли, либо к минимизации ожидаемых затрат. В данном случае предполагается, что связанная с каждым альтернативным решением прибыль (затраты) является случайной величиной.

Постановка таких задач как правило такова: человек выбирает какие-либо действия в ситуации, где на результат действия влияют случайные события. Но игрок имеет некоторые знания о вероятностях этих событий и может рассчитать наиболее выгодную совокупность и очередность своих действий.

Чтобы можно было и дальше приводить примеры, дополним игровую матрицу вероятностями:


Для того, чтобы учесть вероятности придется немного переделать класс, описывающий игровую матрицу. Получилось, по правде говоря, не очень-то изящно, ну да ладно.

Критерий Байеса


Критерий Байеса (критерий математического ожидания) используется в задачах принятия решения в условиях риска в качестве оценки стратегии выступает математическое ожидание соответствующей ей случайной величины. В соответствии с этим правилом оптимальная стратегия игрока находится из условия:


Иными словами, показателем неэффективности стратегии по критерию Байеса относительно рисков является среднее значение (математическое ожидание ожидание) рисков i-й строки матрицы , вероятности которых, совпадают с вероятностями природы. Тогда оптимальной среди чистых стратегий по критерию Байеса относительно рисков является стратегия , обладающая минимальной неэффективностью то есть минимальным средним риском. Критерий Байеса эквивалентен относительно выигрышей и относительно рисков, т.е. если стратегия является оптимальной по критерию Байеса относительно выигрышей, то она является оптимальной и по критерию Байеса относительно рисков, и наоборот.

Перейдем к примеру и рассчитаем математические ожидания:


Максимальным математическим ожиданием является , следовательно, выигрышной стратегией является стратегия .

Программная реализация критерия Байеса:

Критерий Лапласа

Критерий Лапласа представляет упрощенную максимизацию математического ожидания полезности, когда справедливо предположение о равной вероятности уровней спроса, что избавляет от необходимости сбора реальной статистики.

В общем случае при использовании критерия Лапласа матрица ожидаемых полезностей и оптимальный критерий определяются следующим образом:


Рассмотрим пример принятия решений по критерию Лапласа. Рассчитаем среднеарифметическое для каждой стратегии:


Таким образом, выигрышной стратегией является стратегия .

Программная реализация критерия Лапласа:

Смешанные стратегии. Аналитический метод

Аналитический метод позволяет решить игру в смешанных стратегиях. Для того, чтобы сформулировать алгоритм нахождения решения игры аналитическим методом, рассмотрим некоторые дополнительные понятия.

Стратегия доминирует стратегию , если все . Иными словами, если в некоторой строке платёжной матрицы все элементы больше или равны соответствующим элементам другой строки, то первая строка доминирует вторую и называется доминант-строкой. А также если в некотором столбце платёжной матрицы все элементы меньше или равны соответствующим элементам другого столбца, то первый столбец доминирует второй и называется доминант-столбцом.

Нижней ценой игры называется .
Верхней ценой игры называется .

Теперь можно сформулировать алгоритм решения игры аналитическим методом:

  1. Вычислить нижнюю и верхнюю цены игры. Если , то записать ответ в чистых стратегиях, если нет — продолжаем решение дальше
  2. Удалить доминирующие строки доминирующие столбцы. Их может быть несколько. На их место в оптимальной стратегии соответствующие компоненты будут равны 0
  3. Решить матричную игру методом линейного программирования.

И класс, выполняющий решение симплекс-методом. Поскольку в математике я не разбираюсь, то воспользовался готовой реализацией из Apache Commons Math


В этой матрице есть доминирующее множество:
\begin 2& 4\\ 6& 2\end

Решение игры при цене игры равной 3,33

Вместо заключения

Надеюсь, эта статья будет полезна тем, кому необходимо в первом приближении с решением игр с природой. Вместо выводов ссылка на GitHub.

Существует несколько критериев для выбора оптимальной стратегии при принятии решения в условиях риска и неопределенности.

Критерий Лапласа:применяется, если можно предполагать, что все варианты внешних условий одинаково вероятны. Для каждого решения находится средняя оценка по всем вариантам внешних условий (средний выигрыш):


где N– количество состояний внешней среды.

Лучшим является решение с максимальной оценкой.


где Z – оптимальная стратегия.

Критерий Вальда: (критерий крайнего пессимизма, максиминный критерий): решение выбирается в расчете на наихудшие внешние условия. Вероятности состояний природы неизвестны и нет возможности получить о них какую-либо статистическую информацию. В качестве оценки каждого решения используется минимальный выигрыш, который можно получить при выборе этого решения:


Лучшим является решение с максимальной оценкой.


Лучшим является решение с максимальной оценкой.

По критерию Вальда выбирают стратегию, которая дает гарантированный выигрыш при наихудшем варианте состояния природы.

Критерий Сэвиджа, как и критерий Вальда, - это критерий крайнего пессимизма, но только пессимизм здесь проявляется в том, что минимизируется максимальная поте­ря в выигрыше. Для оценки решений используется матрица рисков. В качестве оценки используется максимальный риск (максимальный потерянный выигрыш), соответствующий данному решению:


Лучшим является решение с минимальной оценкой.


Это наиболее осторожный подход к принятию решений и наиболее учитывающий все возможные риски.


где a – коэффициент пессимизма.

Лучшим является решение с максимальной оценкой:


Кроме критериев оптимальности, которые можно применять при принятии решения в условиях риска и неопределенности, существует очень известный и распространенный метод теории игр, используемый в управленческой деятельности в условиях неопределенности.

4. Метод теории игр при принятии решений в условиях неопределенности

Если в игре сталкиваются интересы двух сторон, то игра называется парной, если сторон больше - множествен­ной. Множественная игра с двумя постоянными коалициями обращает игру в парную. Наибольшее практическое значе­ние имеют парные игры. Рассматрим конечную игру, в которой игрок А имеет m стратегий, а игрок В - n стратегий. Та­кая игра называется m x n. Стратегии, соответственно, обозначим: А1, А2 , . Аm - для игрока А; В1, В2, . Вn - для игрока В. Если игра состоит только из личных ходов, то выбор стратегий Аi и Вj игроками однозначно определяет исход игры - наш выигрыш aij Если известны aij для всех сочетаний стратегий, то они образуют платежную матрицу размером m x п, где: m - число строк матрицы, а n - число его столбцов.

Принцип осторожности, диктующий игрокам выбор соответствующих стратегий (максиминной и минимаксной), является в теории игр основным принципом и называется принципом минимакса. В платежной матрице такой игры существует элемент, являющийся одновременно минимальным в своей строке и максимальным в своем столбце. Такой элемент назы­вают седловой тонкой. При этом значение v=ą=þ назы­вают чистой ценой игры. В этом случае решение игры (совокупность оптимальных стратегий игроков) обладает следующим свойством: если один из игроков придерживает­ся своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной страте­гии [2]. Если верхняя цена игры не совпадает с нижней, то в этом случае стоит говорить об игре в смешанных стратегиях. Смешанной SA называется применение чистых стратегий А12,…,Аn с вероятностью p1,p2,…,pn, а смешанной стратегией SB - применение чистых стратегий B1,B2,…,Bn с вероятностью p1,p2,…,pm. Пусть игра имеет размерность 2 на 2 и задается платежной матрицей:

Читайте также: