Статистические игры и принятие решений в условиях неопределенности. Пример применения критерия сэвиджа Сэвидж основы статистики

Главная > Документ

1.4.Критерий пессимизма-оптимизма Гурвица.

Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы. Такой компромиссный вариант и был предложен Гурвицем. Согласно этому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей, т.е. стараясь занять уравновешенную позицию, Гурвиц предложил критерий (HW), оценочная функция которого находится где-то между точками предельного оптимизма и крайнего пессимизма. Оценочная функция имеет две формы записи: Z H W =, (5)где  - “степень пессимизма” ("коэффициент пессимизма", весовой множитель), 0  1. Правило выбора согласно критерию Гурвица (HW – критерия) формулируется следующим образом: Матрица решений дополняется столбцом, содержащим средние взвешенные наименьшего и наибольшего результатов каждой строки. Выбираются те варианты Xi , в строках которых стоят наибольшие элементы a ir этого столбца. При =1 критерий Гурвица (5) тождественен критерию Вальда, а при  =0 – в критерий крайнего оптимизма (критерий азартного игрока), рекомендующий выбрать ту стратегию, при которой самый большой выигрыш в строке максимален. В технических приложениях правильно выбрать этот множитель бывает так же трудно, как и выбрать критерий. Вряд ли возможно найти количественную характеристику для тех долей оптимизма и пессимизма, которые присутствуют при принятии решения. Поэтому чаще всего весовой множитель =0.5 без возражений принимается в качестве некоторой "средней" точки зрения. На выбор значения степени пессимизма оказывает влияние мера ответственности: чем серьезнее последствия ошибочных решений, тем больше желание принимающего решение застраховаться, то есть степень пессимизма  ближе к единице. Рассмотрим применение критерия Гурвица для данных таблицы 1 и степени пессимизма =0.6. Для стратегии X 1 минимальное значение равно 1, а максимальное – 10. Используя формулу (6), вычислим а 1 r =0.6*1+0.4*10=4.6. Аналогично для второй стратегии. Находим максимальное значение столбца а ir . В результате получим таблицу 11. Таблица 11

Следовательно, по критерию Гурвица при =0.6 следует выбирать стратегию X 1 . Замечание. В литературе используется и такая форма критерия Гурвица: Z H W =
, (6)где  - “степень оптимизма” ("коэффициент оптимизма ", весовой множитель), 01. При =0 критерий Гурвица (6) тождественен критерию Вальда, а при =1 совпадает с максиминным решением. Критерий Гурвица предъявляет к ситуации, в которой принимается решение, следующие требования:
    о вероятностях появления Вj ничего не известно; с появлением состояний Вj необходимо считаться; реализуется лишь малое количество решений; допускается некоторый риск.

1.5.Критерий Сэвиджа (критерий минимакса риска).

На практике, выбирая одно из возможных решений, часто останавливаются на том, осуществление которого приведет к наименее тяжелым последствиям, если выбор окажется ошибочным . Этот подход к выбору решения математически был сформулирован американским статистиком Сэвиджем (Savage) в 1954 году и получил название принципа Сэвиджа. Он особенно удобен для экономических задач и часто применяется для выбора решений в играх человека с природой. По принципу Сэвиджа каждое решение характеризуется величиной дополнительных потерь, которые возникают при реализации этого решения, по сравнению с реализацией решения, правильного при данном состоянии природы. Естественно, что правильное решение не влечет за собой никаких дополнительных потерь, и их величина равна нулю. При выборе решения, наилучшим образом соответствующего различным состояниям природы, следует принимать во внимание только эти дополнительные потери, которые по существу, будут являться следствием ошибок выбора. Для решения задачи строится так называемая “матрица рисков”, элементы которой показывают, какой убыток понесет игрок (ЛПР) в результате выбора неоптимального варианта решения. Риском игрока r ij при выборе стратегии i в условиях (состояниях) природы j называется разность между максимальным выигрышем, который можно получить в этих условиях и выигрышем, который получит игрок в тех же условиях, применяя стратегию i. Если бы игрок знал заранее будущее состояние природы j, он выбрал бы стратегию, которой соответствует максимальный элемент в данном столбце:
, и тогда риск:
. Критерий Сэвиджа рекомендует в условиях неопределенности выбирать решение, обеспечивающее минимальное значение максимального риска: Z S =
.
(6) Рассмотрим применение критерия Сэвиджа для данных таблицы 10. Строим матрицу "рисков" для этого находим максимальные значения для каждого столбца таблицы 1. Они равны 1.1; 10 и 1.2 соответственно и находим значения рисков по формуле . Дополняем эту матрицу столбцом наибольших разностей. Выбираем те варианты, в строках которых стоит наименьшее для этого столбца значение. В результате получим таблицу 12. Таблица 12. Матрица рисков
Критерий Сэвиджа рекомендует выбрать стратегию X 1 .

1.6.Критерий Лапласа.

В ряде случаев представляется правдоподобным следующее рассуждение: поскольку неизвестны будущие состояния природы, постольку можно считать их равновероятными. Этот подход к решению используется в критерии “недостаточного основания ” Лапласа. Для решения задачи для каждого решения подсчитывается математическое ожидание выигрыша (вероятности состояний природы полагаются равными q j = 1/n, j = 1:n), и выбирается то решение, при котором величина этого выигрыша максимальна. Z L =
. Гипотеза о равновероятности состояний природы является довольно искусственной, поэтому принципом Лапласа можно пользоваться лишь в ограниченных случаях. В более общем случае следует считать, что состояния природы не равновероятны и использовать для решения критерий Байеса-Лапласа.

1.7.Критерий Байеса-Лапласа.

Этот критерий отступает от условий полной неопределенности - он предполагает, что возможным состояниям природы можно приписать определенную вероятность их наступления и, определив математическое ожидание выигрыша для каждого решения, выбрать то, которое обеспечивает наибольшее значение выигрыша: Z BL =
. Этот метод предполагает возможность использования какой-либо предварительной информации о состояниях природы. При этом предполагается как повторяемость состояний природы, так и повторяемость решений, и, прежде всего, наличие достаточно достоверных данных о прошлых состояниях природы. То есть, основываясь на предыдущих наблюдениях прогнозировать будущее состояние природы (статистический принцип ). Возвращаясь к нашей таблице 1 предположим, что q 1 =0.4, q 2 =0.2 и q 3 =0.4. Тогда согласно критерию Байеса-Лапласа таблицу 1 дополняем столбцом математических ожиданий и среди этих значений выбираем максимальное. Получим таблицу 13. Таблица 13.
Оптимальным является решение X 1 . Критерий Байеса-Лапласа предъявляет к ситуации, в которой принимается решение, следующие требования:
    вероятности появления состояний Вj известны и не зависят от времени; решение реализуется (теоретически) бесконечно много раз; для малого числа реализаций решения допускается некоторый риск.
При достаточно большом количестве реализаций среднее значение постепенно стабилизируется. Поэтому при полной (бесконечной) реализации какой-либо риск исключён. Исходная позиция применяющего – критерий оптимистичнее, чем в случае критерия Вальда, однако она предполагает более высокий уровень информированности и достаточно длинные реализации.Перечисленные критерии не исчерпывают всего многообразия критериев выбора решения в условиях неопределенности, в частности, критериев выбора наилучших смешанных стратегий, однако и этого достаточно, чтобы проблема выбора решения стала неоднозначной:Таблица 14. Оптимальные варианты, полученные с помощью различных критериев
Решение

Критерии

Стратегии Вальда maxmax Гурвица, =0.6 Сэвиджа Лапласа Байеса-Лапласа q 1 =0.4, q 2 =0.2, q 3 =0.4
Из таблицы 14 видно, что от выбранного критерия (а, в конечном счете - от допущений) зависит и выбор оптимального решения. Выбор критерия (как и выбор принципа оптимальности) является наиболее трудной и ответственной задачей в теории принятия решений. Однако конкретная ситуация никогда не бывает настолько неопределенной, чтобы нельзя было получить хотя бы частичной информации относительно вероятностного распределения состояний природы. В этом случае, оценив распределение вероятностей состояний природы, применяют метод Байеса-Лапласа, либо проводят эксперимент, позволяющий уточнить поведение природы. Поскольку различные критерии связаны с различными условиями, в которых принимается решение, лучшее всего для сравнительной оценки рекомендации тех или иных критериев получить дополнительную информацию о самой ситуации. В частности, если принимаемое решение относится к сотням машин с одинаковыми параметрами, то рекомендуется применять критерий Байеса-Лапласа. Если же число машин не велико, лучше пользоваться критериями минимакса или Сэвиджа. Примеры постановки решения задач В данном параграфе на примере решения задач мы должны научиться определять вектор стратегий, вектор состояний и платёжную матрицу и применять различные критерии для получения оптимального решения. Задача. В приморском городе решено открыть яхт-клуб. Сколько следует закупить яхт (из расчета: одна яхта на 5 человек), если предполагаемое число членов клуба колеблется от 10 до 25 человек. Годовой абонемент стоит 100 денежных единиц. Цена яхты - 170 денежных единиц. Аренда помещения и хранение яхт обходится в 730 денежных единиц в год. Решение. Несомненно, что имеет смысл рассматривать количество приобретаемых яхт в диапазоне от двух до пяти (4 варианта) и количество потенциальных яхтсменов от 10 до 25. Для уменьшения объема перебора ограничимся вариантами 10, 15, 20, 25 (если полученные выводы для смежных вариантов будут существенно разниться, проведем дополнительный, уточняющий расчет). Итак: X = { X i } = (2, 3, 4, 5) – количество яхт (i=1,2,3,4) ; B = { B j } =(10, 15, 20, 25) – количество членов яхт-клуба (j=1,2,3,4) . Для того, чтобы начать поиск решения, построим матрицу решений , элементы которой показывают прибыль при принятии i -го решения при j –ом количестве членов яхт-клуба:

a ij = 100 ´min(5 ´X i ; B j ) - 170 ´X i - 730

Т.е. решающее правило в нашей задаче формулируется как "доход – затраты".Выполнив несложные расчеты, заполним матрицу решений {a ij } (см. табл. 15): Таблица 15. Платёжная матрица

Например, a 11 = 100´min(52, 10) - 170´2-730 =-70 a 12 =100´min(5´2, 15)-170´2-730=-70 a 13 = a 14 = -70 (спрос на яхты останется неудовлетворенным). Отрицательные значения показывают, что при этих соотношениях спроса на яхты и их наличия яхт-клуб несет убытки. Критерий Вальда (выбор осторожной, пессимистической стратегии) – для каждой альтернативы (количество яхт в клубе) выбирается самая худшая ситуация (наименьшее значение величины прибыли) и среди них отыскивается гарантированный максимальный эффект:

Z MM =max(-70 ; -240; -410; -580)= -70

Вывод : принимая решение по критерию Вальда, яхт-клубу следует закупить 2 яхты и максимум ожидаемого убытка не превысит 70 д.е. Критерий Гурвица (компромиссное решение между самым худшим исходом и излишне оптимистическим). Рассмотрим изменение решения нашей задачи в зависимости от значений коэффициента оптимизма (в таблице 16 выделены значения, удовлетворяющие критерию Гурвица при различных ): Таблица 16. Решения по Гурвицу для различных
Вывод : при  0,5 следует закупить 5 яхт и ожидать прибыль порядка, не меньшую 170 д.е. (надеемся на широкую популярность нашего клуба и определенную финансовую состоятельность любителей), при = 0,2 не следует закупать более 2 яхт (мы более осторожны в своих прогнозах и, скорее всего, предпочтем отказаться от создания клуба). Критерий Сэвиджа (нахождение минимального риска). При выборе решения по этому критерию сначала матрице полезности сопоставляется матрица сожалений DРабочая программа

Теория принятия решений – прикладная дисциплина и область исследований, вовлекающая понятия и методы математики, статистики, экономики, менеджмента и психологии, которая в формате экономических приложений изучает методы и закономерности

Глава 2. Принятие решений в условиях неопределенности

2.10.Критерий Сэвиджа

Критерий Сэвиджа несколько отличается от всех остальных, рассматриваемых в данной книге. Оценка альтернатив производится не по исходной матрице, а по так называемой "матрице сожалений" или, как ее еще называют в некоторых источниках, "матрице рисков" .

Для произвольной альтернативы и конкретного состояния природы величина "сожаления" равна разнице между тем, что обеспечивает данная альтернатива, и тем, сколько максимально можно выиграть при данном состоянии. С экономической точки зрения величину "сожаления" можно трактовать как недополученный выигрыш (или упущенную выгоду) по сравнению с максимально возможным при данном состоянии природы.

Рассмотрим, каким образом следует выбирать наилучшую альтернативу, руководствуясь критерием Сэвиджа.

Порядок применения критерия Сэвиджа

1. Для каждого состояния природы j (столбца матрицы) определим максимальное значение выигрыша y j :

y j = max (x ij )

2. Для каждой клетки исходной матрицы X найдем разность между максимальным выигрышем r j для данного состояния природы и исходом в рассматриваемой ячейке x ij :

r ij = y j - x ij

Из полученных значений составим новую матрицу R - "матрицу сожалений" или, как ее еще можно назвать, матрицу недополученных выигрышей.

3. Для каждой альтернативы в новой матрице R найдем наибольший возможный недополученный выигрыш ("максимальное сожаление"). Это и будет являться оценкой данной альтернативы по критерию Сэвиджа S i :

S i = max (r ij ) , j=1..M

4. Оптимальной может быть признана альтернатива с минимальным (!) наибольшим недополученным выигрышем:

Х* = Х k , S k = min (S i ) , i=1..N

Пример применения критерия Сэвиджа

Применим изложенный выше алгоритм действий для принятия решения в условиях задачи из п.2.7 (табл.2.2).

1. Найдем наибольшую возможную величину прибыли для каждого сценария развития региона:

y 1 = max (x 11 , x 21) = max (45, 20) = 45

y 2 = max (x 12 , x 22) = max (25, 60) = 60

y 3 = max (x 13 , x 23) = max (50, 25) = 50

2. Рассчитаем значения "сожалений" для каждого проекта при каждом сценарии (т.е. найдем недополученную прибыль по сравнению с максимально возможной при данном сценарии развития). Составим из полученных значений "матрицу сожалений" (см. табл.2.3).

для проекта Х 1 :

r 11 = y 1 - x 11 = 45 - 45 = 0

r 12 = y 2 - x 12 = 60 - 25 = 35

r 13 = y 3 - x 13 = 50 - 50 = 0

для проекта Х 2 :

r 21 = y 1 - x 21 = 45 - 20 = 25

r 22 = y 2 - x 22 = 60 - 60 = 0

r 23 = y 3 - x 23 = 50 - 25 = 25

Табл.2.3. Матрица сожалений R (для примера).
Альтер-нативы (X i ) Состояния природы (j ) Макс. "сожаление" S i
1 2 3
X 1 0 35 0 35
X 2 20 0 25 25
y j 45 60 50

4. В полученной матрице по каждой строке найдем наибольшую величину "сожаления" для каждого проекта (последний столбец в табл.2.3). Это значение соответствует оценке данной альтернативы по критерию Сэвиджа.

Применим изложенный выше алгоритм действий для принятия решения в условиях задачи из п. 1 (табл. 2).

1. Найдем наибольшую возможную величину прибыли для каждого сценария развития региона:

y 1 = max (x 11 , x 21) = max(45, 20) = 45

y 2 = max (x 12 , x 22) = max(25, 60) = 60

y 3 = max (x 13 , x 23) = max(50, 25) = 50

2. Рассчитаем значения "сожалений" для каждого проекта при каждом сценарии (т.е. найдем недополученную прибыль по сравнению с максимально возможной при данном сценарии развития). Составим из полученных значений "матрицу сожалений" (см. табл.2.3).для проекта Х 1:

r 11 = y 1 - x 11 = 45 - 45 = 0

r 12 = y 2 - x 12 = 60 - 25 = 35

r 13 = y 3 - x 13 = 50 - 50 = 0

для проекта Х 2:

r 21 = y 1 - x 21 = 45 - 20 = 25

r 22 = y 2 - x 22 = 60 - 60 = 0

r 23 = y 3 - x 23 = 50 - 25 = 25

Табл.3. Матрица сожалений R (для примера).

4. В полученной матрице по каждой строке найдем наибольшую величину "сожаления" для каждого проекта (последний столбец в табл. 3). Это значение соответствует оценке данной альтернативы по критерию Сэвиджа.

S 1 = max(0, 35, 0) = 35

S 2 = max(25, 0, 25) = 25

5. Сравним полученные величины и найдем проект с минимальным (!) значением критерия. Он и будет оптимальным:

35 > 25 => S 1 > S 2 => X* = X 2

ЛПР, руководствующийся при принятии решений критерием Сэвиджа, выберет проект Х 2 .

Еще раз подчеркнем, что в отличие от остальных критериев, наилучшей альтернативой является та, для которой значение критерия Сэвиджа минимально, поскольку критерий отражает наибольший из возможных недополученных выигрышей для данной альтернативы. Разумеется, чем меньше можно недополучить, тем лучше.

Критерий Гурвица

Обычный (или простой) критерий Гурвица учитывает только крайние исходы x i max и x i min каждой альтернативы:

x i max = max(x ij), x i min = min(x ij), j = 1..M

Он позволяет учесть субъективное отношение применяющего данный критерий ЛПР за счет придания этим исходам разных "весов". Для этого в расчет критерия введен "коэффициент оптимизма" λ, 0 ≤ λ ≤ 1. Формула для расчета критерия Гурвица для i-й альтернативы с коэффициентом оптимизма λ выглядит следующим образом:

H i (λ) = λ x i max + (1 - λ) x i min

Если исходы представляют возможные выигрыши, то оптимальной признается альтернатива с максимальным значением критерия Гурвица:

Х* = Х k , H k (λ) = max(H i (λ)), i = 1..N


Как видно из формулы, правильный выбор коэффициента оптимизма λ оказывает существенное влияние на результат применения критерия. Остановимся подробнее на логике подбора λ.

Если ЛПР настроен пессимистически, то для него важнее меньше потерять при плохом развитии событий, пусть даже это означает не такой большой выигрыш при удачном состоянии. Значит, удельный вес наихудшего исхода x i min в оценке альтернативы должен быть выше, чем для x imах. Это обеспечивается, когда λ находится в пределах от 0 до 0.5, исключая последнее значение.

При λ=0 критерий Гурвица "вырождается" в критерий Вальда и подходит только для очень пессимистично настроенных ЛПР.

Оптимистичный ЛПР, напротив, ориентируется на лучшие исходы, так как для него важнее больше выиграть, а не меньше проиграть. Больший удельный вес в оценке наилучшего исхода достигается при λ больше 0.5 и до 1 включительно. При λ=1 критерий Гурвица становится критерием "максимакса", который учитывает исключительно наибольший исход каждой альтернативы.

Если у ЛПР нет ярко выраженного уклона ни в сторону пессимизма, ни оптимизма, коэффициент λ принимается равным 0.5.

Принятие решений в условиях неопределённости

1. Максиминный критерий Вальда.

2. Критерий Сэвиджа (минимаксного риска).

3. Критерий Гурвица (пессимизма-оптимизма).

1. Максиминный критерий Вальда (критерий крайнего пессимизма)

(«рассчитывай на худшее»)

В группу критериев выбора оптимальной стратегии статистика, применяемых при неизвестных априорных вероятностях состояний природы , входят критерии Вальда, Сэвиджа и Гурвица . Они используют анализ платежной матрицы либо матрицы рисков.

Если распределение вероятностей будущих состояний природы неизвестно , то вся информация о природе сводится к перечню ее возможных состояний .

Максиминный критерий Вальда – это критерий крайнего пессимизма, или критерий осторожного наблюдателя. Его можно сформулировать как для чистых, так и для смешанных стратегий.

Критерий Вальда является критерием крайнего пессимизма , так как статистик предполагает, что природа реализует такие состояния, при которых величина его выигрыша принимает наименьшее значение.

Критерий тождественен максиминному (пессимистическому) критерию, используемому при решении матричных игр в чистых стратегиях.

Из каждой строки выбираются минимальные элементы, т.е. которые соответствуют наихудшему результату ЛПР при известных состояниях «природы» . Затем выбирается стратегия ЛПР, соответствующая максимальному элементу из отобранных минимальных :

. (1)

Выбранные таким образом варианты полностью исключают риск, поскольку ЛПР не может столкнуться с худшим результатом, чем тот, на который он ориентируется.

Применение данного критерия оправданно, если ситуация, в которой принимается решение, характеризуется следующими признаками:

    вероятности состояний «природы» неизвестны;

    решение реализуется только один раз или малое количество раз;

    полная недопустимость риска.

Таким образом, оптимальной по критерию Вальда считается чистая стратегия , которая в наихудших условиях гарантирует максимальный выигрыш. Значит, оптимальной будет максиминная чистая стратегия , а максимальным выигрышем – нижняя чистая цена игры в парной игре с нулевой суммой.

Пример 1.

Игра "Поставщик".

Выпуск продукции фирмы существенно зависит от скоропортящегося материала, например, молока или ягод, поставляемого партиями стоимостью 100ед.

Если поставка не прибывает в срок, фирма теряет 400 ед. от недовыпуска продукции.

Фирма может послать к поставщику свой транспорт (расходы 50 ед.), однако опыт показывает, что в половине случаев транспорт возвращается ни с чем.

Можно увеличить вероятность получения материала до 80%, если предварительно послать своего представителя, но расходы увеличатся еще на 50 ед.

Существует возможность приобретать более дорогой (на 50%) материал-заменитель у другого, вполне надежного поставщика, однако, кроме расходов на транспорт (50 ед.) возможны дополнительные издержки хранения материала в размере 30 ед., если его количество на складе превысит допустимую норму, равную одной партии.

Какой стратегии должен придерживаться завод в сложившейся ситуации?

Решение

У природы два состояния: поставщик надежный и поставщик ненадежный. У фирмы - четыре стратегии: 1) не осуществлять никаких дополнительных действий, 2) послать к поставщику свой транспорт, 3) послать к поставщику представителя и транспорт, 4) купить и привезти материал-заменитель от другого поставщика.

Составим таблицу расчетов:

Затраты и убытки фирмы-изготовителя

Ситуация

Стоимость материала

Недовыпуск продукции

Транспорт

Командировочные расходы

Издержки хранения

Общая сумма

Решение

На основе полученных результатов вычислений можно составить платежную матрицу:

Ответ . Нужно придерживаться третьей стратегии и затраты не превысят 260 ед., если послать к поставщику представителя и транспорт.

1 . Рассмотренный способ поиска оптимального решения есть критерий Вальда (максиминный критерий принятия решения). Выбирается решение, гарантирующее получение выигрыша не меньше, чем maxmin:

ед.

Применяя этот критерий мы представляем на месте природы активного и злонамеренного противника. Это пессимистичный подход .

2. Максимаксный критерий . Самый благоприятный случай:

ед.

Если фирма ничего не предпримет, то потратит не больше 100 единиц. Это критерий абсолютного оптимизма .

Критерий Вальда для смешанных стратегий

Оптимальной считается та смешанная стратегия статистика , при которой минимальный средний выигрыш будет максимальным: . (2)

Критерий Вальда ориентируют статистика на самые неблагоприятные состояния природы, то есть выражают пессимистическую оценку ситуации.

2. Критерий Сэвиджа (минимаксного риска )

На практике, выбирая одно из возможных решений, часто останавливаются на том, осуществление которого приведет к наименее тяжелым последствиям , если выбор окажется ошибочным. Этот подход к выбору решения математически был сформулирован американским статистиком Сэвиджем в 1954 году и получил название принципа Сэвиджа . Он особенно удобен для экономических задач и часто применяется для выбора решений в играх человека с природой.

По принципу Сэвиджа каждое решение характеризуется величиной дополнительных потерь, которые возникают при реализации этого решения , по сравнению с реализацией решения, правильного при данном состоянии природы. Естественно, что правильное решение не влечет за собой никаких дополнительных потерь, и их величина равна нулю.

При выборе решения, наилучшим образом соответствующего различным состояниям природы, следует принимать во внимание только эти дополнительные потери, которые по существу, будут являться следствием ошибок выбора.

Для решения задачи строится так называемая «матрица рисков », элементы которой показывают, какой убыток понесет игрок (ЛПР) в результате выбора неоптимального варианта решения.

Напомним, что Риском игрока при выборе стратегии в условиях (состояниях) природы называется разность между максимальным выигрышем, который можно получить в этих условиях, и выигрышем, который получит игрок в тех же условиях, применяя стратегию .

Критерий Сэвиджа – это критерий минимаксного риска, минимизации «сожалений». Этот критерий, как критерий Вальда, является максимально осторожным и пессимистическим.

В критерии Сэвиджа пессимизм проявляется по-другому: худшим считается не минимальный выигрыш, а максимальная потеря выигрыша по сравнению с тем, что можно было бы достичь в данных условиях (максимальный риск).

Критерий Сэвиджа ориентируется не на результат, а на риск (потери или штрафы) .

В качестве оптимальной выбирается стратегия, при которой величина потерь в наихудших условиях минимальна. Критерий Сэвиджа рекомендует выбирать в качестве оптимальной ту стратегию, которая минимизирует максимальный риск:

Требования , предъявляемые к ситуации, в которой принимается решение по критерию Сэвиджа, совпадают с требованием к использованию критерия Вальда. Критерий Сэвиджа, как и критерий Вальда, ориентирует статистика на самые неблагоприятные состояния природы.

Пример 2. Для задачи «Поставщик» минимакс риска достигается сразу при двух стратегиях А 2 и А 3:

Найти оптимальное решение игры , применяя критерий Сэвиджа.

Решение.

Ориентируемся на самые неблагоприятные состояния «природы». Вычислим риски статистика .

Для первого столбца:

Для второго столбца:

Для третьего столбца:

Запишем матрицу рисков .

Стратегии статистика

Определим в каждой строке наибольшее число – наибольший риск статистика , если он применяет стратегию , а природа меняет свои состояния , , . Дополним матрицу рисков последним столбцом «наибольшие риски».

Матрица рисков и наибольшие риски

Стратегии статистика

Наибольшие риски

Найдем наименьший риск: .

Значит, оптимальной стратегией по критерию Сэвиджа является стратегия .

4.3. Критерий Гурвица (пессимизма-оптимизма)

Критерий Гурвица – критерий обобщенного максимума, или пессимизма-оптимизма.

Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы.

Такой компромиссный вариант и был предложен Гурвицем. Согласно этому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей.

Этот критерий обеспечивает промежуточное решение между крайним оптимизмом и крайним пессимизмом , которое определяется по принципу:

. (4)

Число () - степень оптимизма , удовлетворяет условию и выбирается из субъективных соображений, особенностей среды, здравого смысла, исходя из опыта ЛПР, его отношения к риску и т.п. На выбор значения степени оптимизма оказывает влияние мера ответственности: чем серьезнее последствия ошибочных решений, тем больше желание принимающего решение застраховаться, то есть степень оптимизма  ближе к нулю.

Для каждой строки рассчитывается среднее взвешенное (с учетом выбранного значения ) наименьшего и наибольшего результатов, после чего выбирается строка с максимальным значением .

При имеем критерий крайнего оптимизма , т.е. отражает позицию азартного игрока, ожидающего наиболее благоприятное состояние среды.

При критерий Гурвица превращается в критерий крайнего пессимизма Вальда.

Если 0 промежуточное отношение ЛПР к возможным рискам. При желании подстраховаться в данной ситуации принимают близким к единице.

Выбор значения субъективен, а, следовательно, субъективен и выбор решения, что совершенно неизбежно в условиях неопределенности.

Чем опаснее ситуация, тем больше ЛПР стремится застраховать себя от возможных рисков , тем ближе к 0. А чем менее он азартен, тем ближе к 1.

Оптимальная по Гурвицу стратегия должна гарантировать статистику больший выигрыш по сравнению с выигрышем, принимаемым статистиком интуитивно или исходя из опыта.

Применение критерия Гурвица оправданно, если ситуация, в которой принимается решение, характеризуется признаками :

    вероятности состояний природы неизвестны;

    решение реализуется малое количество решений;

    допускается некоторый риск.

Пример 3. Найти оптимальное решение статистической игры, заданной платежной матрицей, применяя критерий Гурвица.

Решение.

Для применения критерия Гурвица нужно знать значение вероятности . Пусть, например, . Это означает, что событие «наименьший возможный выигрыш статистика » желаем сделать более правдоподобным ( близко к единице), то есть страхуемся от неблагоприятных ситуаций в игре. Тогда

Запишем все промежуточные результаты в таблицу.

Из последнего столбца таблицы видно, что максимальное значение равно (–7,2) и соответствует чистой стратегии ; она и будет оптимальной по критерию Гурвица.

Анализ практических ситуаций проводится по нескольким критериям одновременно , что позволяет глубже исследовать суть явления и выбрать наиболее обоснованное управленческое решение . В качестве оптимальной на основании совокупных исследований берется та стратегия, которая чаще других называлась оптимальной по всем критериям.

Выбор критерия (как и выбор принципа оптимальности) является наиболее трудной и ответственной задачей в теории принятия решений. Однако конкретная ситуация никогда не бывает настолько неопределенной, чтобы нельзя было получить хотя бы частичной информации относительно вероятностного распределения состояний природы. В этом случае, оценив распределение вероятностей состояний природы, применяют метод Байеса-Лапласа, либо проводят эксперимент, позволяющий уточнить поведение природы.

Контрольные вопросы

    Что понимается под играми с природой?

    Какими критериями пользуется статистик для определения своей оптимальной стратегии в условиях неопределенности?

    Что понимается под риском игрока?

    Поясните принципы использования моделей теории игр в экономических задачах в условиях неопределенности (игры с природой).

  1. ус­ловиях неопределённости , использующий аппарат нечёткой...
  2. Принятие решений в условиях неопределенности (5)

    Реферат >> Государство и право

    Ситуацией риска, а для другого – неопределённости . Риск принятия наихудшего решения в условиях , когда известны все исходные... потому, что в процессе принятия решений приходится осуществлять выбор в условиях неопределённости .. Процедуры и методы системного...

  3. Принятие управленческих решений в условиях риска и неопределенности

    Реферат >> Менеджмент

    ... Принятие управленческих решений в условиях риска и неопределенности. План: Введение. Источники и виды неопределенности. Принятие решений в условиях неопределённости ... и виды неопределенности. Принятие

Критерий Сэвиджа использует матрицу рисков || r ij ||. Элементы данной матрицы можно определить по формулам (23), (24), ко­торые перепишем в следующем виде:

Это означает, что r ij есть разность между наилучшим значени­ем в столбце i и значениями V ji при том же i. Неза­висимо от того, является ли V ji доходом (выигрышем) или потеря­ми (затратами), r ji в обоих случаях определяет величину потерь ли­ца, принимающего решение. Следовательно, можно применять к r ji только минимаксный критерий. Критерий Сэвиджа рекоменду­ет в условиях неопределенности выбирать ту стратегию Rj, при ко­торой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален).

Пример 6. Рассмотрим пример 4. Заданная матрица опреде­ляет потери (затраты). По формуле (31) вычислим элементы мат­рицы рисков || r ij ||:

Полученные результаты вычислений с использованием крите­рия минимального риска Сэвиджа оформим в следующей таблице:

Введение величины риска r ji , привело к выбору первой страте­гии R 1 , обеспечивающей наименьшие потери (затраты) в самой не­благоприятной ситуации (когда риск максимален).

Применение критерия Сэвиджа позволяет любыми путями из­бежать большого риска при выборе стратегии, а значит, избежать большего проигрыша (потерь).

4.Критерий Гурвица.

Критерий Гурвицаоснован на следующих двух предположе­ниях: «природа» может находиться в самом невыгодном состоянии с вероятностью (1 - α) и в самом выгодном состоянии с вероятно­стью α, где α - коэффициент доверия. Если результат V j i - прибыль, полезность, доход и т. п., то критерий Гурвица записыва­ется так:

Когда V ji представляет затраты (потери), то выбирают действие, дающее

Если α = 0, получим пессимистический критерий Вальда.

Если α = 1, то приходим к решающему правилу вида max max V ji , или к так называемой стратегии «здорового оптими­ста», т. е. критерий слишком оптимистичный.

Критерий Гурвица устанавливает баланс между случаями край­него пессимизма и крайнего оптимизма путем взвешивания обоих способов поведения соответствующими весами (1 - α) и α, где 0≤α≤1. Значение α от 0 до 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или к оптимизму. При отсутствии ярко выраженной склонности α = 0,5 представляется наиболее разумной.

Пример 7. Критерий Гурвица используем в примере 4. Поло­жим α = 0,5. Результаты необходимых вычислений приведены ниже:

Оптимальное решение заключается в выборе W.

Таким образом, в примере предстоит сделать выбор, какое из возможных решений предпочтительнее:

по критерию Лапласа - выбор стратегии R 2 ,

по критерию Вальда - выбор стратегии R 3 ;

по критерию Сэвиджа - выбор стратегии R 1 ;

по критерию Гурвица при α = 0,5 - выбор стратегии R 1 , а ес­ли лицо, принимающее решение, - пессимист (α = 0), то выбор стратегии R 3 .

Это определяется выбором соответствующего критерия (Лапла­са, Вальда, Сэвиджа или Гурвица).

Выбор критерия принятия решений в условиях неопределенно­сти является наиболее сложным и ответственным этапом в иссле­довании операций. При этом не существует каких-либо общих со­ветов или рекомендаций. Выбор критерия должно производить ли­цо, принимающее решение (ЛПР), с учетом конкретной специфи­ки решаемой задачи и в соответствии со своими целями, а также опираясь на прошлый опыт и собственную интуицию.

В частности, если даже минимальный риск недопустим, то сле­дует применять критерий Вальда. Если, наоборот, определенный риск вполне приемлем и ЛПР намерено вложить в некоторое пред­приятие столько средств, чтобы потом оно не сожалело, что вложе­но слишком мало, то выбирают критерий Сэвиджа.

Задание для самостоятельного решения : написать программу на языке С++ для выбора наиболее эффективного проекта легкового автомобиля для производства, используя критерии Лапласа, Вальда, Сэвиджа и Гурвица.

Намечается крупномасштабное производство легковых автомобилей. Имеются четыре варианта проекта автомобиля

Определена экономическая эффективность V ji каждого проекта в зависимости от рентабельности производства. По истечению трех сроков рассматриваются как некоторые состояния среды (природы). Значения экономической эффективности для различных проектов и состояний природы приведены в следующей таблице (д.е.):

Состояния природы

Требуется выбрать лучший проект для производства, используя критерии Лапласа, Вальда, Сэвиджа и Гурвица при ɑ=0,1. Сравните решения и сделайте выводы.