Опубликован: 26.04.2007 | Уровень: специалист | Доступ: платный | ВУЗ: Нижегородский государственный университет им. Н.И.Лобачевского
Лекция 3:

Устойчивость и эффективность поведения сторон: принцип максимума гарантированного результата

< Лекция 2 || Лекция 3: 12 || Лекция 4 >
Аннотация: Сравнение стратегий. Принцип максимума гарантированного результата. Лексикографически упорядоченные критерии.

Проблема сравнения стратегий

Вернемся к рассмотрению описанного выше примера и рассмотрим вопрос о выборе стратегии, которую целесообразно использовать первой стороне для подготовки к участию в конкурсе. Очевидно, что формирование представления о лучшей стратегии x_{1}^{*} стороны P1 предполагает либо возможность определения лучшего варианта для любой пары стратегий x'_{1}, x''_{1} этой стороны, либо возможность установления равноценности стратегий, входящих в эту пару. Однако на множестве стратегий стороны P1 не существует отношения предпочтения, позволяющего ответить на эти вопросы для любой пары x'_{1}, x''_{1}.

Проиллюстрируем это важное обстоятельство путем сравнения уровней эффективности, обеспечиваемых соответственно стратегиями x1=0 и x1=1. Согласно (1.19) и (1.20),

\text{M}_1(x_1,x_2,t)=(x_1-x_2)(t-1), ( 2.1)
откуда вытекает, что
\Delta_1(x_2,t)=\text{M}_1(x_1=0,x_2,t)-\text{M}_1(x_1=1,x_2,t)=1-t ( 2.2)
и, следовательно, \Delta_1(x_2,t)>0,\, 0\le t < 1; \quad \Delta_1(x_2,t)<0,\, 1<t\le 2;

и, \Delta_1(x_2,1)=0 (см. рис. 1.2).

Таким образом, при неизвестном состоянии природы стратегии x1=0 и x1=1 оказываются несравнимыми.


Рис. 1.2.

Следовательно, введенная в модели упорядоченность всех исходов операции, с помощью которой мы описали интересы первой стороны, не порождает полного отношения предпочтений на множестве стратегий этой стороны. Причина состоит в том, что неопределенность значения параметра t вызывает неопределенность самого исхода. Поэтому возможность оценки эффективности конкретной стратегии, которая необходима для определения наилучшего выбора, оказывается фундаментально связанной с информированностью стороны о состоянии природы и (в общем случае) о действиях другой стороны.

Принцип максимума гарантированного результата

Как следует из предшествующего рассмотрения, для обеспечения сравнимости стратегий принципиально необходимо принять некоторую гипотезу о неизвестном состоянии природы. В рассматриваемом примере вся имеющаяся у стороны P1 информация о сроке t проведения конкурса сводится к знанию интервала [0, 2], заведомо содержащего этот неизвестный срок. В связи с указанной неопределенностью состояния природы, в качестве оценки эффективности любой стратегии можно принять тот уровень эффективности, который гарантируется использованием этой стратегии.

Замечание 1.7 (об ориентации на худший случай). Фактически, принятие гарантируемого стратегией уровня эффективности в качестве оценки, на которой будет основано сравнение этой стратегии с другими, означает ориентацию на худший случай.

Принятие такой оценки в качестве прогноза результатов планируемых действий является рекомендацией, основанной на обширном опыте принятия решений в практической деятельности. К этому "правилу худшего случая" приходят многочисленные исследователи опыта принятия решений, относящегося к самым различным областям человеческой деятельности. Приведем несколько примеров.

Известный американский специалист в области создания больших программных систем Ф.П. Брукс отмечает, что "наши методы оценки весьма несовершенны. Строго говоря, они отражают некоторое неявно высказываемое и в корне неверное допущение, что все будет идти хорошо, ... выполнение каждого задания займет ровно столько времени, сколько оно "должно" занять". И далее: "Планируйте неудачу: она вас, так или иначе, найдет1Брукс Ф.П. Как проектируются и создаются программные комплексы. М.: Наука, 1978. ".

Можно даже говорить о возникновении своего рода "фольклора", вызванного к жизни необходимостью ориентации на худший случай в практике принятия решений. К числу таких новых жанров относятся, например, так называемые "законы Мэрфи2См., например, Хьюз Дж., Мичтом Дж. Структурный подход к программированию. М.: Мир, 1980. ":

  • Все сложнее, чем кажется.
  • Все тянется дольше, чем можно ожидать.
  • Все оказывается дороже, чем планировалось.
  • Если что-то может испортиться, оно обязательно испортится.

По поводу этих законов некто Каллаген сделал следующее замечание3См. там же. "Мэрфи был оптимистом". Действительно, например, второй из "законов" неявно предполагает, что планируемая работа, в конце концов, все-таки завершится. Но этого успешного завершения может и не быть. В книге Дж.Фокса4Фокс Дж. Программное обеспечение и его разработка. М.: Мир, 1985. сообщается, что "военно-воздушные силы США затратили более 300 млн. долларов на тщетную попытку автоматизировать комплексную систему перевозок и снабжения".

Вернемся к рассматриваемому примеру и построим оценку эффективности, которую гарантирует стратегия x1 стороны P1 при неизвестном сроке t проведения конкурса. Эта оценка худшего случая, очевидно, определяется величиной

M_1(x_1,x_2)=\min\{\text{M}_1(x_1,x_2,t):0\le t\le 2\}. ( 2.3)
Подставляя в (2.3) правую часть выражения (2.1) для функции \text{M}_1(x_1,x_2,t), приводим оценку (2.3) к виду
$$\min_{0\le t\le 2}(x_1-x_2)(t-1)=\min_{0\le t \le 2}
\left\{\begin{aligned} |x_1-x_2|(t-1),\quad x_1\ge x_2\\ |x_1-x_2|(t-1),\quad
x_1\le x_2\\ \end{aligned} \right. $$ ( 2.4)
Теперь из (2.3), (2.4) следует, что
M_1(x_1,x_2)=-|x_1-x_2|, ( 2.5)
причем эта гарантированная величина реализуется либо в случае проведения конкурса в момент t*=0, либо в случае проведения этого конкурса в момент t*=2.

Первый случай соответствует ситуации, когда x_1\ge x_2, а второй - ситуации, когда x_1\le x_2, т.е.

M_1(x_1,x_2)=\left\{\begin{aligned} \text {M}_1(x_1,x_2,0),\quad x_1\ge x_2, \\ 
\text{M}_1(x_1,x_2,2),\quad x_1\le x_2.\\ \end{aligned} \right. ( 2.6)
Теперь проведем аналогичное рассмотрение, руководствуясь интересами второй стороны. Определим уровень эффективности, который может быть обеспечен стороне P2 выбором стратегии x2 при некоторой известной стратегии x1 первой стороны и неизвестном сроке проведения конкурса, т.е. вычислим величину
M_2(x_1,x_2)=\min \{\text{M}_2(x_1,x_2,t):0\le t \le 2\}. ( 2.7)
Из (1.20), (2.1) и (2.7) следует, что
M_2(x_1,x_2)=-|x_1-x_2|. ( 2.8)
При этом справедливо следующее соотношение, являющееся аналогом выражения (2.6)
M_2(x_1,x_2)=\left\{\begin{aligned} \text{M}_2(x_1,x_2,2),\quad x_1\ge x_2,\\ 
\text{M}_2(x_1,x_2,0),\quad x_1\le x_2.\\ \end{aligned} \right. ( 2.9)

Таким образом, согласно (2.5) и (2.8),

-1\le M_1(x_1,x_2)=M_2(x_1,x_2)\le 0. ( 2.10)

Следовательно, при ориентации обеих сторон на худший случай (т.е. при использовании ими оценок гарантированного уровня эффективности) противоположность интересов сторон, характеризуемая нулевой суммой критериев (1.21), сменяется ситуацией полного совпадения интересов.

< Лекция 2 || Лекция 3: 12 || Лекция 4 >
Михаил Агапитов
Михаил Агапитов

Не могу найти  требования по оформлению выпускной контрольной работы по курсу профессиональной переподготовки "Менеджмент предприятия"

Подобед Александр
Подобед Александр

Я нажал кнопку "начать курс" и почти его уже закончил, но для получения диплома на бумаге, нужно его же оплатить? Как оплатить? 

Евгений Жеглов
Евгений Жеглов
Россия, Белгород, Белгородский государственный университет, 1997
Mardon Madrahimov
Mardon Madrahimov
Узбекистан, nukus, qmu, 2013